STTR 标准类符形符比 标准型次比

请问,在研究学习者笔语语料库时,我把学生的作文按成绩分成不同的级别,但由于每个级别的人数不同,我如何得到标准类符比?用软件可做吗?
 
回复: STTR

STTR是测量词汇复杂度( lexiacal diversity) 的重要指标之一,但是也不是完美无缺。Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
在文章中提出了备选指标,可以参考。
 
回复: STTR

我想问个菜鸟级的问题。我现在在用许博士的Readability Analyzer 1.0,我想分析词长,词频和类符比,但是,在导入一个包含301篇.txt文本后,出来的数据是按301篇文章分别运算的。想问问,怎样才能让这个软件把所有文章一起运算,得出总的数据,跪谢。
 
回复: STTR

不会吧,要手动?那岂不是工作量巨大啊?有没有其他工具可用,或者有其他软件可以不用合并也能做出总的结果?
 
回复: STTR

不会吧,要手动?那岂不是工作量巨大啊?有没有其他工具可用,或者有其他软件可以不用合并也能做出总的结果?
将这301份文件存入一个文件夹中,打开Word,点插入-文件(“文件类型”选择为文本文件),按Ctrl-A选中全部文件,确定后即可。
 
回复: STTR

由于工作在一所学术资源匮乏的学校,不知哪位好心人可以分享 Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
十分感激 xenia1011@126.com
 
回复: STTR

我想问个菜鸟级的问题。我现在在用许博士的Readability Analyzer 1.0,我想分析词长,词频和类符比,但是,在导入一个包含301篇.txt文本后,出来的数据是按301篇文章分别运算的。想问问,怎样才能让这个软件把所有文章一起运算,得出总的数据,跪谢。

有两种方案:

1、一是按网友的建议,合并文本后计算。
2、正常计算,出结果后Save成Excel工作表,在Excel中再运算平均词长等数据。
 
回复: STTR

由于工作在一所学术资源匮乏的学校,不知哪位好心人可以分享 Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
十分感激 xenia1011@126.com

求文献的帖子请另开一贴,到文献求助区发帖吧。
 
回复: STTR 标准类符形符比 标准型次比

我刚注册进来,刚上研,也刚接触语料库(学校没这门课,属于自学中),所以很多东西都不太知道。
能不能稍微解说一下,什么是类符/形符???
 
回复: STTR 标准类符形符比 标准型次比

是type token的翻译。我一直认为这两个翻译翻得不好。

国内汉语届的译法更容易理解一些。type叫词种,token叫词次。

不过外语圈,类符和形符已经叫开了。

例如,一个语料库有100万词,指的是100万tokens,即100万词次。
但这一百万词次的语料库中,或许只用到了5万个单词。这5万个词,就是types,词种。

type/token,这个值(TTR,type token ratio)可以反映文本中词汇的丰富程度。
 
回复: STTR 标准类符形符比 标准型次比

是type token的翻译。我一直认为这两个翻译翻得不好。

国内汉语届的译法更容易理解一些。type叫词种,token叫词次。

不过外语圈,类符和形符已经叫开了。

例如,一个语料库有100万词,指的是100万tokens,即100万词次。
但这一百万词次的语料库中,或许只用到了5万个单词。这5万个词,就是types,词种。

type/token,这个值(TTR,type token ratio)可以反映文本中词汇的丰富程度。

谢谢大人回复,另学生茅塞顿开,,没想到速度噶快的,,昨天问的今天就有答案了,,哈哈,,
 
Back
顶部