嗯,领教了。多谢!“平行语料”(Parallel Texts)是指使用不同语言撰写、相互间具有“翻译关系”的文本。在计算语言学界,它有别于“对比语料”(Comparable Texts),后者也使用不同的语言撰写、并且针对同一主题,但相互之间却不存在直接的“翻译关系”。
人类历史上曾有过各式各样的平行语料。埃及出土的罗塞塔石碑,其碑文用两种语言、三种文字刻成,是颇具盛名的古代的平行语料。通过比较石碑上的文字,法国古代语学者商博良解读了古埃及的象形文字。此外,用不同语言对照书写的契约协议、宗教经典、文学作品也在不同的时期和不同的领域影响着人们的生活。20世纪50年代末,平行语料开始出现在机器翻译研究中。由于当时计算机的存储空间和计算能力有限,而大量文本数据的输入又相当困难,平行语料库的作用并没有得到太多的关注。70年代末期,翻译资源的收集工作在 Xerox PARC 、Brigham Young 等研究中心广泛地开展起来。1987年,Martin Kay 和 Martin Roscheisen 提出了最早的平行语料自动对齐算法。之后各种对齐方法层出不穷,对齐后的平行语料也被系统地应用到自然语言处理中,包括建立翻译记忆、编纂词典和双语术语表、跨语言信息检索、计算机辅助教学、语言对比研究等。
引自:http://162.105.203.93/icl_groups/parallel/default.htm
网上可获取的语料库可以参见“小许的语料天涯”http://www.fleric.org.cn/sweccl/Corpus/您好,我想把语料库应用英语专业翻译课堂中,在单词翻译,短语翻译,结构翻译,举行翻译方面具体应用,目前
[FONT=宋体]汉英平行语料库[/FONT] PCCE
[FONT=宋体]北外[/FONT]
[FONT=宋体]英汉双语语料库[/FONT](15[FONT=宋体]万对[/FONT])
[FONT=宋体]中科院软件所[/FONT]
[FONT=宋体]英汉双语语料库[/FONT](100[FONT=宋体]万[/FONT])[FONT=宋体],网上英汉语段电子词典及网上电子英汉搭配词典[/FONT](1000[FONT=宋体]万[/FONT])
[FONT=宋体]东北大学[/FONT]
[FONT=宋体]英汉双语语料库[/FONT](40-50[FONT=宋体]万句子对[/FONT])
[FONT=宋体]哈尔滨工业大学[/FONT]
[FONT=宋体]双语语料库[/FONT](5[FONT=宋体]万多对[/FONT])
[FONT=宋体]北京大学计算语言学研究所[/FONT]
请问这些语料库用哪一个比较合适,而且在网上能找到呢,不好意思又麻烦您。