在语料库的对比中,常有overuse和underuse这两个概念,那么究竟超出多少才称为overuse,少用多少又称为underuse 呢?是人为规定的,还是有具体的标准?
有很多文章可以参考,先从这里开始吧:
Paul Rayson's Log-likelihood calculator
Xu Jiajin's Log-likelihood Ratio Calculator 对数似然率计算器
一点建议:跟给自己的作品起个贴切的题目一样,请尽量在贴子的题目中简单明了地说明贴子主旨,不要使用“求助”、“十万火急”、“问个问题”、“又一个问题”、“求文章”、“跪求帮助”等等字句。