请教:Readability Analyzer中的[STTR]问题!

请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。
2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗?
 
回复: 请教:Readability Analyzer中的[STTR]问题!

看一下这两个软件的说明,可能各个软件的定义不同。
 
回复: 请教:Readability Analyzer中的[STTR]问题!

请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。
2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗?

有可能的,AntConc默认的单词定义是大小写分开计算的,AntConc认定的单词只是包含字母的,单词中间有标点,比如连字符,和数字的,比如21st的不算单词。

Readability Analyzer的数值跟Word的字数统计一致,主要以空格莱计算单词数。
 
回复: 请教:Readability Analyzer中的[STTR]问题!

谢谢你的提醒,我再好好检查一下,可能是AntConc用的是plain text, 而Readability Analyzer导入的是word, 可能转换出问题了。如果有哪位老师碰到过这样的问题,帮我看看。谢谢各位了!
 
回复: 请教:Readability Analyzer中的[STTR]问题!

谢谢许博士的帮助,我可能是使用不当,我用Readability Analyzer和Word 统计出来的字数也不一样,附件里的文本,用Readability Analyzer统计出来的字数是2301,用Word统计出来的是2279。
 

附件

  • The Cop and the Anthem.doc
    34.5 KB · 浏览: 4
回复: 请教:Readability Analyzer中的[STTR]问题!

's和't在Readability Analyzer会当做单独的单词处理,而在word中他们会与前面的词记为一个词,这就是为什么word统计的词偏少的原因
 
Back
顶部