大学英语教材语料库COLEN 薛学彦

#25
回复: 大学英语教材语料库

谢谢许博士,谢谢薛老师!
来到论坛像是到了共产主义社会,大家有什么好东西都是免费分享,一天不来就恐怕错过什么.因为每次进来都有收获,比与恋人约会感觉还好.
 

Helen

初级会员
#29
回复: 大学英语教材语料库

It's a nice corpus. Could you please introduce more about its data---such as what textbooks they actually are? Thank you so much.
 

laohong

管理员
Staff member
#31
回复: 大学英语教材语料库

It's a nice corpus. Could you please introduce more about its data---such as what textbooks they actually are? Thank you so much.

语料统计如下(教材和文本数):
21st Century College English --------------240
College English ---------------------------278
Complete New College English -------------240
New College English ----------------------172

总计:930

下面三个文本的教材名标注出错(每个文件的第9行):
C1IN0602.txt
c2fa0013.txt
C3IN0701.txt
 
#35
回复: 大学英语教材语料库

库很好啊,这样的东西都教学非常有帮助,感谢分享。哪位朋友还知道哪里有 cet4,6 and TEM-4,8 的corpus?感谢了
 
#36
回复: 大学英语教材语料库

库很好啊,这样的东西都教学非常有帮助,感谢分享。哪位朋友还知道哪里有 cet4,6 and TEM-4,8 的corpus?感谢了
我也想要可没找到,所以想自己建cet4,6的语料库,设想是把历年真题收集起来按年代和题型两种方式进行分类,可是不知道这样整理后是属于语料库还是题库,请各位指教!
 
#38
回复: 大学英语教材语料库

http://www.corpus4u.org/showthread.php?t=3280
杨端和
(云南师范大学外语学院,云南昆明 650092)

摘 要:大学英语四、六级考试是我国高等教育最重要的外语考试。我们的语料库开发建设也应注重建立像四、六级考试这类关系重大的大规模外语考试的试题语料库。本文简要介绍我们建设完成的《大学英语四、六级考试语料库》的设计理念、建库方案,报告从这一语料库获得的这两项考试主要语法特征统计分析数据,探讨这一语料库对于大学英语教学,对四、六级考试复习以及备考的意义,并就怎样更充分地利用这个语料库提出了一点儿建议。
关键词:大学英语;四、六级考试;语料库建设
中图分类号:H319. 3文献标识码:A文章编号: 1001-5795(2007)02-0050-0006
  大学英语四、六级考试是我国高等教育最重要的大规模,标准化外语考试,对促进我国大学生整体外语水平的提高发挥了重要作用。同时,这项考试对于国家、社会各类用人单位公正,科学评估大学生外语水平,合理选拔录用人才,也发挥了积极的作用。因此,我们的语料库语言学研究也应理论联系实际,注重研究考试语料库的开发建设问题,特别应着手建立像大
学英语四、六级考试这类关系重大的大规模外语考试的试题语料库。正是出于这一理念,我们以过去十一年这两项考试的真题及模拟试题为原始语料,采用手工标注试卷主要语法特征的模式,花费了近两年时间建立了《大学英语四、六级考试语料库》。
 
#39
回复: 大学英语教材语料库

这样东西听说已经有了。所以自己就没动手去建。因为如果有成型的东西,自己再去建也弄不出什么新东西来。不过如果自己建立的话,感觉上难度不是特别大。因为语料的来源很可靠,是固定的试卷。网上都有,不需要自己手动去key into。所以,相对来说,我感觉只要用点心,应该是说的过去的。而且如果只是自己用的话,就可以更rough一点。但还是感谢有谁能提供专业的建立好的这个方面的库的资源或联系方式。
 

laohong

管理员
Staff member
#40
回复: 大学英语教材语料库

这样东西听说已经有了。所以自己就没动手去建。因为如果有成型的东西,自己再去建也弄不出什么新东西来。不过如果自己建立的话,感觉上难度不是特别大。因为语料的来源很可靠,是固定的试卷。网上都有,不需要自己手动去key into。所以,相对来说,我感觉只要用点心,应该是说的过去的。而且如果只是自己用的话,就可以更rough一点。但还是感谢有谁能提供专业的建立好的这个方面的库的资源或联系方式。
何不先拿一些试卷自己动手尝试建一下呢?不需要大,搞个 prototype 也行啊。
 
顶部