多语言短语矩阵

**********************************************************

编号: NLPLAB2010T006

时间: 2010-11-16

语料: 多语言短语矩阵

缩写: MPM

版本: 1.0

版权: 刘伍颖

联系: (1)邮箱: nlplab@163.com; <自然语言处理实验室>
(2)手机: 13787784974
(3)QQ: 44631423
(4)网址: http://nlplab.webhop.net

格式: 文本文件, UTF-8编码

语言: 英语, 中文(简体, 繁体), 阿拉伯语, 法语, 德语, 俄语, 西班牙语, 日本语, 韩国语

用途: 跨语言信息处理, 多语言平行语料库, 自然语言处理, 机器翻译

介绍: MPM语料是经过语言学家校正的多语言对齐的短语列表. 当前的1.0版MPM语料总共包含97,918条短语, 每条短语由9种语言(10种文字)的文本构成.

示例:
[英语][中文简体][中文繁体][阿拉伯语][法语][德语][俄语][西班牙语][日本语][韩国语]
[zealot][狂热者][狂熱者][?????][zélote][eiferer][фанатик][fanático][狂信者][???]
...

**********************************************************
 

附件

  • mpm-toy.zip
    10.7 KB · 浏览: 29
Back
顶部