请问我计算中文的词语搭配强度,该用哪个软件好,用那种值?我用BFSU计算不出来看你的研究目的决定选取哪种。
MI值会把低频词排在很前面,适合专业文本中搭配词的研究。
T-score相对来说,会把高频词排在很前面,即日常生活中的普通用词,比较适合非专业文本搭配词的研究。
MI3修正了MI值的缺陷。Log likelihood也比较折中。你也可以综合这几种指数做出自己的分析。按这几种指数都排在很前面的,那毫无疑问肯定是显著搭配词了。
大致是这样,《语料库应用教程》中有很详细的论述,你可以找书仔细读读。
谢谢许老师,我看了,貌似只能计算MI和T值