请教关于BNCweb中词搭配值的问题

我在使用BNCweb 研究词的搭配时发现使用不同的 值,搭配词的排序就不一样,BNCweb书说默认值是log-likelihood,但是并没有说为什么,同时也给出了其他值, 在这里想请教下大虾们原因,谢谢:)
 
回复: 请教关于BNCweb中词搭配值的问题

不同搭配力计算方法效果不同,有的突出单纯的共现频次,有的突出观测值与期望值的差异,比如MI的效果是只突出观测值与期望值的差异,所以会把许多低频词排在前面。log-likelihood据说是效果最好的方法,如此而已。。。
 
Back
顶部