回复: 卡方检验求帮助
可以直接比啊,画个柱装图,这叫描述性统计。
卡方检验是推论性统计。首先要搞清楚卡方检验比的是比率的差异。
比如一个词word在10,000词的语料库A里出现了100次,在8,000词的语料库B里出现了
90次,你想知道这个词在各个语料库里所占的比率是否有差异。
一般在卡方检验里比率用odds表示,比如在语料库A里word出现的odds是
(100/10,000) / (9900/10,000) = 1/99
意思是在该样本中不出现word的概率是出现word的99倍。
在语料库B中的odds是 90/7910。...