求助 语料库的可比性
NESSIE Corpus (
Native
English
Speakers
Similarly or
Identically-prompted
Essays) is another publicly available eassay corpus containing eassys written by native English speakers.
http://124.193.83.252/cqp/
许博士,您好,我研究的是linking adverbials ,对比EFL Chinese EFL learner 和native speakers, 选用了WECCL 和BAWE中的英语专业学生部分的论文, 这两个语料库可以比较吗?
如果所选的两个Corpus的text 平均长度(word length)不一样,WECCL 是263字,BAWE是2477个字,这两个corpus可以比较吗? normalized frequency呢,这样可以比较吗?
BAWE 中英语专业的学生的text全都整理出来了,那么这两个corpus 都是在applied linguistic领域的,同样题材的,但是不能确保是同样的话题,这样有问题吗? 我数据都分析完了,一个MA的同学提醒我这个问题,那如果不行,我是不是要重新选择数据库放弃前面的分析了?
跪求您的指点,谢谢!