中国传媒大学广播电视文本语料库

#1
中国传媒大学在线网络资源进行了升级,目前已经进入在线测试阶段
在线资源主要有:
在线分词标注系统
http://ling.cuc.edu.cn/cucseg/
新词语研究资源库
http://ling.cuc.edu.cn/newword/web/index.asp
音视频语料检索系统
http://ling.cuc.edu.cn/mmcpub
中国传媒大学文本语料库检索系统
http://ling.cuc.edu.cn/RawPub/
文本语料库简介
中国传媒大学文本语料库是一个开放、免费使用的语料库。语料库包括2008年-2010年15871个广播、电视节目的转写文本,约1亿字(共104 889 619字次/125 133 466字符)。
  本语料库语料可以进行一般性的语言研究,也可以用于特定年度(如2008、2009或2010)、特定媒体(如广播、电视)、特定单位(如中央电视台、北京电视台)、特定语体(如书面语体、口语语体)、特定语言形式(如独白、对话)、特定领域(如新闻、经济、军事)、特定栏目(如《新闻联播》、《鲁豫有约》)、特定主持人(如白岩松、马斌)以及各种特定语言格式(如重叠词语、成对关联词语)等的语言研究。具体用法参见帮助文件。
欢迎大家访问我们的资源,提出宝贵意见。
 
顶部