中国英语学习者语音数据库(由北外、南大、社科院等人研制)

#1
请问各位老师:
是否知道该语料库是否可以开放?如果不开放,我应该通过什么方法获取资料?
我是个语料库语言学的门外汉,希望可以向各位老师学习。
 
Last edited:

李亮1975重庆

语料库快乐军政委
#2
与作者联系 —— 分享往往是个难题

你可以给那篇文章的三位作者发送普通邮件或电子邮件进行咨询,其中最资深或最高龄或最高职称的一位应该是版权所有者,中国的语料库建设项目都是有个主持人,主持人决定是否把库公开,库公开也许涉及到版权或隐私,也许版权是不(愿)公开的最好借口。中国的语料库建设一般都是“不公开、不演示、不连续(开发建设)”。私下交流的时候,版权所有者往往狡黠地说“等我用够了再考虑跟别人分享”。中国的语料库兴建项目往往是申请书上写要造福社会和自身单位,但一旦建成或部分建成也就束之高阁了,虽然“分享”这个字眼的实现可以是建个网站来提供免费检索,或者发布光盘来提供全套数据,或者提供链接来下载全套数据,或者给作者邮件就能获取到全套数据。

《语音研究的新平台_中国英语学习者语音数据库》
http://wenku.baidu.com/view/7c3b05c7bb4cf7ec4afed009.html

严格来说,一切语料都有版权,哪怕是早已不在人间的中世纪作家的作品的电子版。因此,我的主张是“语料库不用建,建立灵活高速免费的语料检索工具尤其是针对在线网页的语料检索工具就巧妙地规避了版权问题了”。

打着“语料建设”或“语料库建设”的幌子的科研项目已经成为外语界科研“最大吸金,在省级部级项目中的比例越来越高(光从项目标题也可以粗略探知),越来越多的硕导博导亮出“语料”二字来申请项目,科研处甚至也给本校申请者提示“你加上语料库或语料这两三个字吧,容易命中些”。

对语料项目驾轻就熟的人,往往采用“平台、数据库、信息库、系统”这些字眼来避免直接把“语料”二字裸露而导致落俗,哈哈!
 
#6
回复: 与作者联系 —— 分享往往是个难题

你可以给那篇文章的三位作者发送普通邮件或电子邮件进行咨询,其中最资深或最高龄或最高职称的一位应该是版权所有者,中国的语料库建设项目都是有个主持人,主持人决定是否把库公开,库公开也许涉及到版权或隐私,也许版权是不(愿)公开的最好借口。中国的语料库建设一般都是“不公开、不演示、不连续(开发建设)”。私下交流的时候,版权所有者往往狡黠地说“等我用够了再考虑跟别人分享”。中国的语料库兴建项目往往是申请书上写要造福社会和自身单位,但一旦建成或部分建成也就束之高阁了,虽然“分享”这个字眼的实现可以是建个网站来提供免费检索,或者发布光盘来提供全套数据,或者提供链接来下载全套数据,或者给作者邮件就能获取到全套数据。

《语音研究的新平台_中国英语学习者语音数据库》
http://wenku.baidu.com/view/7c3b05c7bb4cf7ec4afed009.html

严格来说,一切语料都有版权,哪怕是早已不在人间的中世纪作家的作品的电子版。因此,我的主张是“语料库不用建,建立灵活高速免费的语料检索工具尤其是针对在线网页的语料检索工具就巧妙地规避了版权问题了”。

打着“语料建设”或“语料库建设”的幌子的科研项目已经成为外语界科研“最大吸金,在省级部级项目中的比例越来越高(光从项目标题也可以粗略探知),越来越多的硕导博导亮出“语料”二字来申请项目,科研处甚至也给本校申请者提示“你加上语料库或语料这两三个字吧,容易命中些”。

对语料项目驾轻就熟的人,往往采用“平台、数据库、信息库、系统”这些字眼来避免直接把“语料”二字裸露而导致落俗,哈哈!
一语中的
 

Haiyang Ai

Administrator
Staff member
#7
回复: 中国英语学习者语音数据库(由北外、南大、社科院等人研制)

中国学生英语口笔语语料库(SWECCL) 里面是有口语方面的数据的。
 
顶部