STTR 标准类符形符比标准型次比

后来者 · 2010-06-29

请问，在研究学习者笔语语料库时，我把学生的作文按成绩分成不同的级别，但由于每个级别的人数不同，我如何得到标准类符比？用软件可做吗？

xujiajin · 2010-06-29

回复: STTR

Readability Analyzer可以提供这一项数据
http://www.corpus4u.org/attachment.php?attachmentid=769&d=1251645403

Readability_Analyzer_Readme.doc
http://www.corpus4u.org/attachment.php?attachmentid=730&d=1250864581

后来者 · 2010-06-29

回复: STTR

Many thanks to Xu !

后来者 · 2010-06-29

回复: STTR

许老师，用antconc 和wordsmith 能实现吗？

xujiajin · 2010-06-29

回复: STTR

AntConc不行，WordSmith可以。

清风出袖 · 2010-06-30

回复: STTR

STTR是测量词汇复杂度( lexiacal diversity) 的重要指标之一，但是也不是完美无缺。Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
在文章中提出了备选指标，可以参考。

后来者 · 2010-07-01

回复: STTR

谢谢清风出袖！再次谢谢许老师！

hollyrochest · 2010-12-06

回复: STTR

我想问个菜鸟级的问题。我现在在用许博士的Readability Analyzer 1.0,我想分析词长，词频和类符比，但是，在导入一个包含301篇.txt文本后，出来的数据是按301篇文章分别运算的。想问问，怎样才能让这个软件把所有文章一起运算，得出总的数据，跪谢。

armstrong · 2010-12-07

回复: STTR

把所有文件合并成一个文件.

hollyrochest · 2010-12-07

回复: STTR

不会吧，要手动？那岂不是工作量巨大啊？有没有其他工具可用，或者有其他软件可以不用合并也能做出总的结果？

huangyongxin · 2010-12-08

回复: STTR

作者 hollyrochest:
不会吧，要手动？那岂不是工作量巨大啊？有没有其他工具可用，或者有其他软件可以不用合并也能做出总的结果？

将这301份文件存入一个文件夹中，打开Word，点插入-文件（“文件类型”选择为文本文件），按Ctrl-A选中全部文件，确定后即可。

rainbow · 2010-12-08

回复: STTR

由于工作在一所学术资源匮乏的学校，不知哪位好心人可以分享 Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
十分感激 xenia1011@126.com

xujiajin · 2010-12-08

回复: STTR

作者 hollyrochest:
我想问个菜鸟级的问题。我现在在用许博士的Readability Analyzer 1.0,我想分析词长，词频和类符比，但是，在导入一个包含301篇.txt文本后，出来的数据是按301篇文章分别运算的。想问问，怎样才能让这个软件把所有文章一起运算，得出总的数据，跪谢。

有两种方案：

1、一是按网友的建议，合并文本后计算。
2、正常计算，出结果后Save成Excel工作表，在Excel中再运算平均词长等数据。

volfer · 2010-12-08

回复: STTR

作者 rainbow:
由于工作在一所学术资源匮乏的学校，不知哪位好心人可以分享 Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
十分感激 xenia1011@126.com

求文献的帖子请另开一贴，到文献求助区发帖吧。

dingguoqi · 2010-12-08

回复: STTR

作者 rainbow:
由于工作在一所学术资源匮乏的学校，不知哪位好心人可以分享 Yu, G. (2010). Lexical Diversity in Writing and Speaking Task Performances. Applied Linguistics, 31(2), 236-259
十分感激 xenia1011@126.com

hollyrochest · 2010-12-11

回复: STTR 标准类符形符比标准型次比

谢谢各位热心的帮忙，让我看到了曙光！

龟毛贵族爱番茄 · 2012-06-05

回复: STTR 标准类符形符比标准型次比

我刚注册进来，刚上研，也刚接触语料库（学校没这门课，属于自学中），所以很多东西都不太知道。
能不能稍微解说一下，什么是类符/形符？？？

xujiajin · 2012-06-05

回复: STTR 标准类符形符比标准型次比

是type token的翻译。我一直认为这两个翻译翻得不好。

国内汉语届的译法更容易理解一些。type叫词种，token叫词次。

不过外语圈，类符和形符已经叫开了。

例如，一个语料库有100万词，指的是100万tokens，即100万词次。
但这一百万词次的语料库中，或许只用到了5万个单词。这5万个词，就是types，词种。

type/token，这个值（TTR，type token ratio）可以反映文本中词汇的丰富程度。

龟毛贵族爱番茄 · 2012-06-06

回复: STTR 标准类符形符比标准型次比

作者 xujiajin:
是type token的翻译。我一直认为这两个翻译翻得不好。

国内汉语届的译法更容易理解一些。type叫词种，token叫词次。

不过外语圈，类符和形符已经叫开了。

例如，一个语料库有100万词，指的是100万tokens，即100万词次。
但这一百万词次的语料库中，或许只用到了5万个单词。这5万个词，就是types，词种。

type/token，这个值（TTR，type token ratio）可以反映文本中词汇的丰富程度。

谢谢大人回复，另学生茅塞顿开，，没想到速度噶快的，，昨天问的今天就有答案了，，哈哈，，

STTR 标准类符形符比标准型次比

后来者

xujiajin

管理员

后来者

后来者

xujiajin

管理员

清风出袖

高级会员

后来者

hollyrochest

armstrong

高级会员

hollyrochest

huangyongxin

rainbow

初级会员

xujiajin

管理员

volfer

Moderator

dingguoqi

附件

hollyrochest

龟毛贵族爱番茄

xujiajin

管理员

龟毛贵族爱番茄

STTR 标准类符形符比 标准型次比

管理员

管理员

高级会员

高级会员

初级会员

管理员

Moderator

附件

管理员

STTR 标准类符形符比标准型次比