我想比较CLEC,CEM语料库和BNC在某个词词频用法上的差异,已经计算出了平均一万词的词频,可以用One-Sample T Test 检验差异的显著性吗?不知道还有没有更好的统计办法。请各位老师指点,谢谢!
关键值就是reference corpus 里面某个词的词频(每一万词)呀。如果要用单样本检验,你有关键值么?
那你手头的语料库和reference corpus 容量上有没有很大的差别呢?
清风出袖老师:你好!你能否将卡方检验的过程讲的更详细一点?怎么样输入数据呀?谢谢