后 后来者 2010-07-06 #1 我把学生的作文按成绩由高到低的顺序分为4个等级,第一个等级作文15篇,第二个等级40篇,第三个等级71篇, 第四个等级70篇, 用antconc 分别生成四个n-gram序列,序列的total number of n-gram types 和total number of n-gram tokens 的比率分别是90.4%, 86.3%, 84.2% 和83.9%,我可否得出n-gram类符比和成绩呈正相关的结论?每个级别的作文篇数不同,n-gram 类符比能直接相比较吗?急盼大师指点!
我把学生的作文按成绩由高到低的顺序分为4个等级,第一个等级作文15篇,第二个等级40篇,第三个等级71篇, 第四个等级70篇, 用antconc 分别生成四个n-gram序列,序列的total number of n-gram types 和total number of n-gram tokens 的比率分别是90.4%, 86.3%, 84.2% 和83.9%,我可否得出n-gram类符比和成绩呈正相关的结论?每个级别的作文篇数不同,n-gram 类符比能直接相比较吗?急盼大师指点!