大家好,这个问题困扰我几天了,只好又要麻烦各位老师指教了。
我在做硕士论文,在检验两个频率是否有显著差异时,采用的是计算log-likelihood ratio值的办法,使用的是log-likelihood ratio calculator ,但是我发现有时结果与卡方检验不一致。下面举个例子来说明:
在《语料库语言学导论》第245页,语料库A约550,000词,语料库B约193,000词,两个语料库中的名词的标准频率(千分率)分别为语料库A264,语料库B224.45.
通过计算卡方值,书上显示说这两个语料库中名词出现的频率没有显著差异。
然而,为了验证此结果与log-likelihood ratio calculator 的结果是否一致,我把名词的标准频率(千分率)分别为语料库A264,语料库B224.45还原成实际观测次数分别为语料库A145200,语料库B43319.然后用log-likelihood ratio calculator 计算得
Corpus Size 1550000Corpus Size 2193000 WordFreq. in Corpus 1Freq. in Corpu145200 43319 log-likelihood ratio =904.33 0.000 ***+
根据表显示两者差异非常显著。
这到低是怎么回事呢?在论文中是否可直接用log-likelihood,还是我使用log-likelihood calculator有误,肯求高手指教。
非常感谢您给予的任何帮助,占用您的时间很抱歉。
我在做硕士论文,在检验两个频率是否有显著差异时,采用的是计算log-likelihood ratio值的办法,使用的是log-likelihood ratio calculator ,但是我发现有时结果与卡方检验不一致。下面举个例子来说明:
在《语料库语言学导论》第245页,语料库A约550,000词,语料库B约193,000词,两个语料库中的名词的标准频率(千分率)分别为语料库A264,语料库B224.45.
通过计算卡方值,书上显示说这两个语料库中名词出现的频率没有显著差异。
然而,为了验证此结果与log-likelihood ratio calculator 的结果是否一致,我把名词的标准频率(千分率)分别为语料库A264,语料库B224.45还原成实际观测次数分别为语料库A145200,语料库B43319.然后用log-likelihood ratio calculator 计算得
Corpus Size 1550000Corpus Size 2193000 WordFreq. in Corpus 1Freq. in Corpu145200 43319 log-likelihood ratio =904.33 0.000 ***+
根据表显示两者差异非常显著。
这到低是怎么回事呢?在论文中是否可直接用log-likelihood,还是我使用log-likelihood calculator有误,肯求高手指教。
非常感谢您给予的任何帮助,占用您的时间很抱歉。