这个问题困扰了我好几年,现在形成了一点认识,前一段在另一个相关帖子里说了一些含混不太靠谱的话:http://www.corpus4u.org/showthread.php?t=882
写了个文章谈这个问题,提出了自己的看法,即将发表,现在先发个草稿,欢迎各位批评。
写了个文章谈这个问题,提出了自己的看法,即将发表,现在先发个草稿,欢迎各位批评。
谢谢dzhigner老师的总结和分享。还是manning他们论证的详细啊。有些公式把t检验和z检验写成这样(sqrt是平方根, O 是实际观察到的搭配频数,E = kf(w1)f(w2)/N,k是跨距):
z = (O-E)/sqrt(E);
t = (O-E)/sqrt(O);
这样操作起来是方便多了,只不过省掉了统计学上的论证。