当代北京口语语料库简介

xujiajin

管理员
Staff member
当代北京口语语料库简介
--------------------------------------------------------------------------------
http://www.blcu.edu.cn/kych/blcukyc/news/view.asp?id=269
“当代北京口语语料库”,原为国家教委博士点基金项目和国家社会科学基金项目。1992年7月18日通过专家鉴定。主要研究人员吕必松、任远、常宝儒、刘杰、马欣华、陈忠、胡翔、宋孝才等。

课题组对北京六个地区的500名不同年龄、性别、民族、文化程度的人就28组话题进行了现场口语采录。经过科学抽样,建立了378份语料音档及相应的文字转写材料,忠实、准确地反映了北京地区80年代口语的使用情况。语料库170万字,其中精加工语料40万字,包括有声语料、文字语料、机读语料的原始语料档案和经过人机结合方式加工处理的语料档案以及计算机软件系统。语料库可为汉语口语研究、汉语口语教学以及社会语言学、话语分析等方面的研究提供重要基础材料。专家鉴定认为,成果既有实用价值,又有学术价值,设计思想的实现“达到了国际先进水平”。
 
Is it possible to access this coprus on a collaborative basis?
 
We can try contact them for the possibility, but I am afraid this will not be very optimistic.
 
回复:当代北京口语语料库简介

Another thing: this is a rather old corpus; as such I am not
sure if it is easily accessible.

[本贴已被 作者 于 2005年07月19日 05时32分08秒 编辑过]
 
的确。汉语语料库由于有些是版权的问题等等原因没有与大家见面的确是件憾事!
 
我觉得心态问题多于版权问题。英文语料库也有版权问题,但大家可以买到或免费得到。中国的版权等知识产权保护比外国更严格吗?

前两天有些朋友说我傻,自己建了库免费让别人用,等于让别人踩着自己的肩膀往上爬。说别人用了连个acknowledgement都没有。但我很高兴看到有300多人在将LCMC用于研究和教学,让大家的研究具有可比性,这不是很好吗?
 
如果能够的话,还是挺像见见这个语料库的真面目的,许家金博士能否将他们的联系方式贴出来,要收费么?其实如果国内的同行之间如果不是国家安全机密级的内容,相互共享,或者有偿使用也是很好的促进研究进展的一种方式.都绷着向左老大,最后被别人占了先,或者相互竞争,重复研究,这在非典研究中特别明显!
 
有道理。其实,说起来国内所建的各种语料库大大小小也不少了,但是,这些东西一般只能在各种文章中见到一点影子,而真正拿出来共享的的语料库并不多。学术乃天下工器,非一己之私利,况且各种语料库也大多是在国家支助的下才建立起来的。在完成课题的情况,如果不是因为国家安全和重大商业机密,有必要将这些成果公之于众,这对语料库的建设和研究工作将有不可估量的促进作用。
 
回复:当代北京口语语料库简介

前两天有些朋友说我傻,自己建了库免费让别人用,等于让别人踩着自己的肩膀往上爬。说别人用了连个acknowledgement都没有。但我很高兴看到有300多人在将LCMC用于研究和教学,让大家的研究具有可比性,这不是很好吗?

其实有很多人都在由衷地感谢你的工作。
另外,远远不止300人在用,因为通过中文网页上的联系方法向我索要LCMC的人我想肯定已经不下200人了,这还不包括下载后大家之间互相share的。

我想为人做事能为别人提供方便这是一件很值得高兴的事。至于说别人是否真能我们的良苦用心,那另当别论。凡是能做到无愧我心已然很好。更何况你为大家做了这么一件大好事。
 
Back
顶部