D DX Huang 2013-02-16 #1 我在使用BNCweb 研究词的搭配时发现使用不同的 值,搭配词的排序就不一样,BNCweb书说默认值是log-likelihood,但是并没有说为什么,同时也给出了其他值, 在这里想请教下大虾们原因,谢谢
我在使用BNCweb 研究词的搭配时发现使用不同的 值,搭配词的排序就不一样,BNCweb书说默认值是log-likelihood,但是并没有说为什么,同时也给出了其他值, 在这里想请教下大虾们原因,谢谢
xujiajin 管理员 Staff member 2013-02-16 #2 回复: 请教关于BNCweb中词搭配值的问题 Log likelihood is very often preferred in collocation and keyword analysis in many tools. You can read some earlier posts discussing the similar question as you posed. http://www.corpus4u.org/forum/showthread.php?t=5027 http://www.corpus4u.org/forum/showthread.php?t=804 http://www.corpus4u.org/forum/showthread.php?t=58 http://www.corpus4u.org/forum/showthread.php?t=4873 http://www.corpus4u.org/forum/showthread.php?t=6236
回复: 请教关于BNCweb中词搭配值的问题 Log likelihood is very often preferred in collocation and keyword analysis in many tools. You can read some earlier posts discussing the similar question as you posed. http://www.corpus4u.org/forum/showthread.php?t=5027 http://www.corpus4u.org/forum/showthread.php?t=804 http://www.corpus4u.org/forum/showthread.php?t=58 http://www.corpus4u.org/forum/showthread.php?t=4873 http://www.corpus4u.org/forum/showthread.php?t=6236
R rightniche 2013-02-22 #4 回复: 请教关于BNCweb中词搭配值的问题 不同搭配力计算方法效果不同,有的突出单纯的共现频次,有的突出观测值与期望值的差异,比如MI的效果是只突出观测值与期望值的差异,所以会把许多低频词排在前面。log-likelihood据说是效果最好的方法,如此而已。。。
回复: 请教关于BNCweb中词搭配值的问题 不同搭配力计算方法效果不同,有的突出单纯的共现频次,有的突出观测值与期望值的差异,比如MI的效果是只突出观测值与期望值的差异,所以会把许多低频词排在前面。log-likelihood据说是效果最好的方法,如此而已。。。