Z zhuyang 2010-12-21 #1 请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。 2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗?
请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。 2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗?
xujiajin 管理员 Staff member 2010-12-22 #4 回复: 请教:Readability Analyzer中的[STTR]问题! 作者 zhuyang: 请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。 2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗? Click to expand... 有可能的,AntConc默认的单词定义是大小写分开计算的,AntConc认定的单词只是包含字母的,单词中间有标点,比如连字符,和数字的,比如21st的不算单词。 Readability Analyzer的数值跟Word的字数统计一致,主要以空格莱计算单词数。
回复: 请教:Readability Analyzer中的[STTR]问题! 作者 zhuyang: 请教各位老师:我在写论文,我的语料是短篇小说,每篇小说的字数在1300-2400之间。1. [Set Basis for STTR] 选多少更能说明问题,即用词的变化性。 2. 用AntConc 和Readability Analyzer 提取的types tokens 相差20到40词之间,正常吗? Click to expand... 有可能的,AntConc默认的单词定义是大小写分开计算的,AntConc认定的单词只是包含字母的,单词中间有标点,比如连字符,和数字的,比如21st的不算单词。 Readability Analyzer的数值跟Word的字数统计一致,主要以空格莱计算单词数。
Z zhuyang 2010-12-22 #5 回复: 请教:Readability Analyzer中的[STTR]问题! 谢谢你的提醒,我再好好检查一下,可能是AntConc用的是plain text, 而Readability Analyzer导入的是word, 可能转换出问题了。如果有哪位老师碰到过这样的问题,帮我看看。谢谢各位了!
回复: 请教:Readability Analyzer中的[STTR]问题! 谢谢你的提醒,我再好好检查一下,可能是AntConc用的是plain text, 而Readability Analyzer导入的是word, 可能转换出问题了。如果有哪位老师碰到过这样的问题,帮我看看。谢谢各位了!
Z zhuyang 2010-12-22 #6 回复: 请教:Readability Analyzer中的[STTR]问题! 谢谢许博士的帮助,我可能是使用不当,我用Readability Analyzer和Word 统计出来的字数也不一样,附件里的文本,用Readability Analyzer统计出来的字数是2301,用Word统计出来的是2279。 附件 The Cop and the Anthem.doc 34.5 KB · 浏览: 4
回复: 请教:Readability Analyzer中的[STTR]问题! 谢谢许博士的帮助,我可能是使用不当,我用Readability Analyzer和Word 统计出来的字数也不一样,附件里的文本,用Readability Analyzer统计出来的字数是2301,用Word统计出来的是2279。
williamJia 开放语料库项目 2010-12-22 #7 回复: 请教:Readability Analyzer中的[STTR]问题! 's和't在Readability Analyzer会当做单独的单词处理,而在word中他们会与前面的词记为一个词,这就是为什么word统计的词偏少的原因
回复: 请教:Readability Analyzer中的[STTR]问题! 's和't在Readability Analyzer会当做单独的单词处理,而在word中他们会与前面的词记为一个词,这就是为什么word统计的词偏少的原因