汉语中介语语料库系统简介

xusun575

高级会员
#1
汉语中介语语料库系统简介
“汉语中介语语料库系统”,原为国家教委八五社科规划研究项目、国家汉办八五科研规划项目,1995年11月15日通过专家鉴定。研制人员储诚志、陈小荷、张旺熹、张伟、魏苹、朱旗。
http://www.blcu.edu.cn/kych/files/10/%BA%BA%D3%EF%D6%D0%BD%E9%D3%EF%D3%EF%C1%CF%BF%E2%CF%B5%CD%B3%BC%F2%BD%E9.htm

课题组从北京和外地的9所高等院校收集了96个国家和地区的1635位外国留学生的成篇成段的汉语作文或练习材料5774篇,共计3528988字,从中抽取了740人的1731篇语料,共44218句,1041274字,进行了分词、词性标注及一些特殊的语言学标注。全部语料均登录有作者姓名、性别、年龄、国别、是否华裔、第一语言、文化程度、所学主要教材、语料类别、写作时间、提供者等23项属性。“汉语中介语语料库系统”对抽样语料按照字、词、句、篇等不同层次进行了加工和标记,对语料样本的非规范形式(例如:错字、别字、繁体字、拼音字、非规范词等)作出索引标记,登录其相应的规范形式。系统有语篇属性登录、文本过滤、文字预处理信息登录、语料抽样、断句、分词、词性辅助标注、自动标注以及语料的主题检索、全文检索和数据浏览等各种功能,分别面向库建设、库管理和面向用户的库浏览、库应用。系统不仅是对外汉语教学研究、中介语研究和汉语研究、偏误分析的宝贵资源,而且也为汉语中介语研究、汉语本体研究提供了科学便捷的集成环境和先进技术手段。专家鉴定认为,语料库填补了汉语中介语语料库研究方面的空白,在汉语作为第二语言教学领域里取得了开创性成果,“达到了国际领先的水平”。
 
#2
回复: 汉语中介语语料库系统简介

据说台湾师范大学也研发了中介语语料库。但是怎么样才能获得这些语料库呢?我做功课需要用,但是找不到下载途径,高手指点一二吧,谢谢了!
 
#3
回复: 汉语中介语语料库系统简介

问题就在于此,英语教育方面出版了几个语料库,可是汉语界的学人有成果,可是就是不愿意拿出来和大家分享他们的成果。遗憾。
 

xuyi

普通会员
#5
回复: 汉语中介语语料库系统简介

我想一个原因可能是这些汉语语料库很多都还在发展阶段,没有reasonably 完善的东西不想拿出来公布吧。
台湾师范大学的语料网上是可以搜到的,至少美国可以。据说从国内上网可能不一定能正确下载。
http://www.ntnu.edu.tw/tcsl/SLA/index.htm
http://portal.ntnu.edu.tw/portal/modules/mylinks/visit.php?cid=43&lid=217

问题是我觉得他们的语料到目前为止都很散乱,不是一个大语料库,就是一些老师和researcher搜集的材料。对做大的研究项目来说好像用处不大。
不知道他们是不是还有更完整的语料库存在没有在网上公布。
 
顶部