请教Chi-square test的计算

majorlv511

高级会员
请教一下各位,我在文章中要用到chi-square test, 但是我本人不会。
情况是这样的,我需要比较同一个词在两个语料库中的使用是否存在显著差异。

两个语料库的规模分别是:
corpus1: 1,070,602 words;
corpus 2: 10.33million words

所调查词出现的frequency是:
corpus1 中为312.15,
corpus2中为157.97

不知道这两组数据够用来分析了不?

谢谢大家了!!!
 
The frequencies you gave must be normalised frequencies - why should they not be integers otherwise? Please use the raw frequencies - the actual counts - and the word numbers of the two corpora in the following LL calculator (LL test is more reliable than chi-squared test):

http://ucrel.lancs.ac.uk/llwizard.html
 
回复: 请教Chi-square test的计算

非常非常感谢DR.XIAO!

我在第一个帖子里提到的就是normalized frequency,所以有小数点!

不过经你一指点,既然有现成的可以计算log-likelihood value的,我就直接使用了!真是太感激了!

为了我那论文,我都快急死了!

真是柳暗花明又一村啊!:)
 
Back
顶部