F fionagnf 2011-01-12 #1 书上说计算长度不等的文本的词汇密度用STTR,但我用readability analyser计算了25个文本的WordSTTR,再用SPSS分析它与Token数的相关性,发现相关性高达0.875,显著性0.000,然后我又照样分析了276个文本,STTR和Token的相关性仍然有0.591,显著性0.000,这是不是说明文本的词长仍然很严重地影响STTR的值呀?
书上说计算长度不等的文本的词汇密度用STTR,但我用readability analyser计算了25个文本的WordSTTR,再用SPSS分析它与Token数的相关性,发现相关性高达0.875,显著性0.000,然后我又照样分析了276个文本,STTR和Token的相关性仍然有0.591,显著性0.000,这是不是说明文本的词长仍然很严重地影响STTR的值呀?
F fionagnf 2011-01-12 #3 回复: STTR与Token数的关系? 作者 xujiajin: 你的这个分析很有意思。 Click to expand... 那请问究竟是我分析错了,还是STTR这个参数不是很有效呢?
xujiajin 管理员 Staff member 2011-01-12 #4 回复: STTR与Token数的关系? 你的分析应该是对的。 你可以再看看其他的参数是否与tokens也有一样的关系。 我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。
回复: STTR与Token数的关系? 你的分析应该是对的。 你可以再看看其他的参数是否与tokens也有一样的关系。 我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。
F fionagnf 2011-01-13 #5 回复: STTR与Token数的关系? 作者 xujiajin: 你的分析应该是对的。 你可以再看看其他的参数是否与tokens也有一样的关系。 我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。 Click to expand... 许博士,我又用Wordsmith同样以100词为basis计算了那25个文本的STTR,发现这样算出来的STTR与Token数的相关性是0.346,显著性0.090,根据我大致的观察,从十来个文本到25个,文本越多,相关性和显著性数值都逐渐降低。是不是readability analyser的计算方法有些问题呀? 我也算了TTR,lemma TTR和token数的相关性,都有0.9以上,显著性0.000。
回复: STTR与Token数的关系? 作者 xujiajin: 你的分析应该是对的。 你可以再看看其他的参数是否与tokens也有一样的关系。 我们提供的参数里还有TTR,lemma TTR等,你可以比较一下哪个参数更好一些。 Click to expand... 许博士,我又用Wordsmith同样以100词为basis计算了那25个文本的STTR,发现这样算出来的STTR与Token数的相关性是0.346,显著性0.090,根据我大致的观察,从十来个文本到25个,文本越多,相关性和显著性数值都逐渐降低。是不是readability analyser的计算方法有些问题呀? 我也算了TTR,lemma TTR和token数的相关性,都有0.9以上,显著性0.000。
xujiajin 管理员 Staff member 2011-01-13 #6 回复: STTR与Token数的关系? 如果WordSmith和Readability Analyzer有不同,主要就在于对token的definition不一样。