M missuknow 2015-01-29 #1 请教各位大侠 曾经有学者指出用卡方检验,样本体积越大,越容易推翻无效假设。那当我们将卡方检验用于数十万词的语料库时,得出的结果是不是都会是有显著性差异,推翻零假设? 这时卡方检验的结果还可信吗?还是有其他的检验方法?
请教各位大侠 曾经有学者指出用卡方检验,样本体积越大,越容易推翻无效假设。那当我们将卡方检验用于数十万词的语料库时,得出的结果是不是都会是有显著性差异,推翻零假设? 这时卡方检验的结果还可信吗?还是有其他的检验方法?
D dzhigner Moderator 2015-01-30 #2 回复: 关于样本体积大使用卡方检验是否准确的问题 何为总体?何为样本?先把这些问题搞清楚。 至于数十万词的语料库算不算大样本,看你研究什么问题了。 如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。 不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。
回复: 关于样本体积大使用卡方检验是否准确的问题 何为总体?何为样本?先把这些问题搞清楚。 至于数十万词的语料库算不算大样本,看你研究什么问题了。 如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。 不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。
M missuknow 2015-02-03 #3 回复: 关于样本体积大使用卡方检验是否准确的问题 作者 dzhigner: 何为总体?何为样本?先把这些问题搞清楚。 至于数十万词的语料库算不算大样本,看你研究什么问题了。 如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。 不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。 Click to expand... 谢谢版主指点。或者是不需要太较真。
回复: 关于样本体积大使用卡方检验是否准确的问题 作者 dzhigner: 何为总体?何为样本?先把这些问题搞清楚。 至于数十万词的语料库算不算大样本,看你研究什么问题了。 如果你要调查的模式比较罕见,上亿词次语料库里也最多找到个把,样本还是不够大。 不过么,其实没必要这么较真,追逐“不明觉厉”的时髦方法比搞清实质重要,语言学界不就这么回事。 Click to expand... 谢谢版主指点。或者是不需要太较真。