STTR与Token数的关系？

主题发起人 fionagnf
时间 2011-01-12

F

fionagnf

2011-01-12

#1

书上说计算长度不等的文本的词汇密度用STTR，但我用readability analyser计算了25个文本的WordSTTR，再用SPSS分析它与Token数的相关性，发现相关性高达0.875，显著性0.000，然后我又照样分析了276个文本，STTR和Token的相关性仍然有0.591，显著性0.000，这是不是说明文本的词长仍然很严重地影响STTR的值呀？

xujiajin

管理员

Staff member

2011-01-12

#2

回复: STTR与Token数的关系？

你的这个分析很有意思。

F

fionagnf

2011-01-12

#3

回复: STTR与Token数的关系？

作者 xujiajin:
你的这个分析很有意思。

那请问究竟是我分析错了，还是STTR这个参数不是很有效呢？

xujiajin

管理员

Staff member

2011-01-12

#4

回复: STTR与Token数的关系？

你的分析应该是对的。
你可以再看看其他的参数是否与tokens也有一样的关系。
我们提供的参数里还有TTR，lemma TTR等，你可以比较一下哪个参数更好一些。

F

fionagnf

2011-01-13

#5

回复: STTR与Token数的关系？

作者 xujiajin:
你的分析应该是对的。
你可以再看看其他的参数是否与tokens也有一样的关系。
我们提供的参数里还有TTR，lemma TTR等，你可以比较一下哪个参数更好一些。

许博士，我又用Wordsmith同样以100词为basis计算了那25个文本的STTR，发现这样算出来的STTR与Token数的相关性是0.346，显著性0.090，根据我大致的观察，从十来个文本到25个，文本越多，相关性和显著性数值都逐渐降低。是不是readability analyser的计算方法有些问题呀？
我也算了TTR，lemma TTR和token数的相关性，都有0.9以上，显著性0.000。

xujiajin

管理员

Staff member

2011-01-13

#6

回复: STTR与Token数的关系？

如果WordSmith和Readability Analyzer有不同，主要就在于对token的definition不一样。

You must log in or register to reply here.

Share:

Reddit Pinterest Tumblr WhatsApp Email 链接

顶部