我正在用许家金老师 给的 LL calculator 做数据检验, 请问数据的可靠性要参考哪一栏里的数值呢, 具体问题也有两个, 譬如, 在CLEC 和bnc 中 as we know 这一短语的数量分别为 clec 108 BNC1728 log liklihood 检测结果如下
108 1728 197.59 0.000 ***+
我的问题是
1. loglikelihood 里的数字是否与 overuse 或underuse 的严重程度成正比, 有没有一个什么具体的诠释方法呢?
2. sig 一栏中的数据是什么意思呢, 是p值吗, 如何判断运算可信的程度呢
3 logliklihood 是不是和chi square test 一样对过小的数值运算就不准了呢,
有的词在clec 中出现词频 是 个位数字 这个运算还可靠吗?
谢谢大家了!
108 1728 197.59 0.000 ***+
我的问题是
1. loglikelihood 里的数字是否与 overuse 或underuse 的严重程度成正比, 有没有一个什么具体的诠释方法呢?
2. sig 一栏中的数据是什么意思呢, 是p值吗, 如何判断运算可信的程度呢
3 logliklihood 是不是和chi square test 一样对过小的数值运算就不准了呢,
有的词在clec 中出现词频 是 个位数字 这个运算还可靠吗?
谢谢大家了!