下面这篇文章中的卡方值是怎么算出来的?

hancunxin

Moderator
想请教一下各位C友,《现代外语》第28卷第三期的一篇文章"CAUSE语义韵的对比研究"中的这个卡方值(即x2=173.1 P<o.o5, )是怎么算出来的?本人百思不得其解,还请高手指点迷津!文章已附在下面。
 

附件

  • CAUSE语义韵的对比研究.pdf
    671.2 KB · 浏览: 102
Last edited:
回复: 下面这篇文章中的卡方值是怎么算出来的?

同样不得其解,望高人指点!
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

一个词是否是关键词,仅仅靠它在该文本中出现的频率是不够的,还需要有个参考语料库(如:BNC)。例如:the,a, of 等词在文本中的频率都很高,但是它们不是关键词,因为它们在任何文本中的频率都很高。当计算一个词是否是一个文本的关键词时可以通过卡方判断,通过计算卡方值的大小就可以判断一个词是否是关键词。计算方法如下:

X2= (|ad-bc|-N/2)2 * N / (a+b)(c+d)(b+d)(c+d)
(N=a+b+c+d)


举例:detective一词在某长度为1000的文本中出现了10次,在容量为10000词的参照语料库中出现了1词,如下表:

词的频数 文本长度 总和
被研究的文本 A=10 B=1000 A+B=1010
参照语料库 C=1 D= 10000 C+D=10001
总和 A+C=11 B+D = 11000 N=11011

把这些值带入公式可得:

X2 = 78.7

一般卡方大于3.84就有显著意义,很显然detective这个词是关键词。
(以上内容参考了杨慧中老师编写的《语料库语言学》第160-161页的内容)
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

谢谢williamJia!
他那篇论文中提供的数据似乎少了点,所以算不出?
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

四格表式的卡方检验至少有两种公式,值略有不同,但大致不影响显著性判断。
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

一个词是否是关键词,仅仅靠它在该文本中出现的频率是不够的,还需要有个参考语料库(如:BNC)。例如:the,a, of 等词在文本中的频率都很高,但是它们不是关键词,因为它们在任何文本中的频率都很高。当计算一个词是否是一个文本的关键词时可以通过卡方判断,通过计算卡方值的大小就可以判断一个词是否是关键词。计算方法如下:

X2= (|ad-bc|-N/2)2 * N / (a+b)(c+d)(b+d)(c+d)
(N=a+b+c+d)


举例:detective一词在某长度为1000的文本中出现了10次,在容量为10000词的参照语料库中出现了1词,如下表:

词的频数 文本长度 总和
被研究的文本 A=10 B=1000 A+B=1010
参照语料库 C=1 D= 10000 C+D=10001
总和 A+C=11 B+D = 11000 N=11011

把这些值带入公式可得:

X2 = 78.7

一般卡方大于3.84就有显著意义,很显然detective这个词是关键词。
(以上内容参考了杨慧中老师编写的《语料库语言学》第160-161页的内容)


谢谢Williamjia的回复! 你说的道理我懂,关键是我根据以上那篇论文的数据,得不出他们的结果,故此有一问。烦请Williamjia 帮我看看,论文的作者们是怎么算出的?
 
Last edited:
回复: 下面这篇文章中的卡方值是怎么算出来的?

为了把这个问题说清楚,我还是先说说我自己的算法。

按照论文中的说法CAUSE 与change(s)搭配的例子在CLEC(库容1百万)中一共找到44例,根据表3,消极4.7% 也就是44*4.7%约等于3, 中性为0例,积极为44*95.7%约等于41例。 SBNC(库容1400万 )中找到CAUSE 与change(s)搭配的例子46例,26例消极,19例中性,1例积极。我们来算一下积极例子的卡方。

A=41 B=1000000 CLEC
C=1 D=14000000 SBNC

因此,我算出的卡方值=558, 叶茨校正后=543 论文中为173

同样的方法,算消极的搭配词
A=3 B=1000000
C=26 D=14000000
X2=0.63 叶茨校正后=0.17 论文中为=57.7

大家看看我的算法是否正确?
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

这种问题太难了,帮我看看如何算出这个问题!
年份 入院人次 跌倒 坠床 放弃 自杀
例数 % 例数 % 例数 % 例数 %
2006 11426 13 0.1 5 0.03 16 0.14 2 0.01
2007 14625 1 0.006 1 0.006 2 0.01 0 0
想请帮忙看下卡方值和P值怎样算,
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

跌倒 坠床 放弃 自杀?
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

是的,他们做的是采取措施,防止意外事故发生,想证明采取的措施有效,
 
回复: 下面这篇文章中的卡方值是怎么算出来的?

麻烦许博士给看看,等着用,但是我查看了好多资料不知道该如何算,但是好多杂志都有类似的表格!谢谢了
 
Back
顶部