研究collocation,语料库的库容一般来讲要多大才够呢。

corpora

初级会员
Stig Johnansson 1993曾讲过“The LOB corpus material is rich enough to show the wide variety of adverb-adjective combinations, but insufficienty large for a proper collocation study”. 但看过一些关于collocation study的文章,库容也大约和lob的库容相仿。所以非常迷惑研究collocation,到底多大的库容才可以接受?

谢谢您留言和指点。
 
回复: 研究collocation,语料库的库容一般来讲要多大才够呢。

现在已经2009年了,Stig Johnansson 1993讲那话时有多少语料库供他使用?而且1993年时估计这个坛子里还没几人摸过电脑呢……
当然这不是库容大小的论据,呵呵……
 
回复: 研究collocation,语料库的库容一般来讲要多大才够呢。

其实在下认为像BNC等这些大型的语料库更有说服力。但是稍微小些的也行,但太小的不具有代表性。另外语料库在设计时,语料的选择很重要。如果你选择的这个库在选料时把该词常用的语域全部涵盖了,而且词频出现的频率也达到相当大的数量,那么几十你的库很小,也能说明问题——证明该词的搭配!
 
回复: 研究collocation,语料库的库容一般来讲要多大才够呢。

有没有什么统计方法可以测试语料库的代表性呢?
 
回复: 研究collocation,语料库的库容一般来讲要多大才够呢。

谢谢各位,尤其是LAOHONG老师的最后提供的线索.
 
回复: 研究collocation,语料库的库容一般来讲要多大才够呢。

多谢laohong 指点迷津!
 
Back
顶部