[FONT=宋体]我想用语料库来检索一下中国高水平英语学习者关于因果类连接词的使用情况。我想用[/FONT]Michigan Corpus of Upper-Level Student Papers [FONT=宋体]作为参考语料,然后收集国内英语专业研究生的论文自建语料库。从[/FONT]Michigan[FONT=宋体]语料库中提取[/FONT]50[FONT=宋体]篇[/FONT]2000[FONT=宋体]字左右的论文。然后收集[/FONT]50[FONT=宋体]篇中国研究生的课程论文,字数差不多[/FONT]2000. [FONT=宋体]然后用检索出每篇的中的因果连接词,再做一个单样本[/FONT]T[FONT=宋体]检验。可以这样做吗?如果可以的话,在收集文本的时候,我该注意什么呢?选多少篇比较合适?要考虑论文的主题吗?因为中国的理科类的研究生可能都不用英语写论文,就算英语也有不同的方向。[/FONT]