北外双语平行语料库最新消息

xujiajin

管理员
Staff member
今天上午从王克非老师处得知:
北外双语平行语料库已经完全ready了,书和光盘的出版也是迟早的事。
之所以至今没有出版原因是项目结题所必需履行的审批手续还没有办完。所以大家再等等吧。

对了,王老师说,最后公开的语料不是整个语料库,但至少也在1000万以上吧。
 
这个具体我没来得及问王老师,不过按照另一个帖子中提到的文章中的说法,好像是有吧。
 
回复:北外双语平行语料库最新消息

以下是引用 xujiajin2005-10-21 14:51:57 的发言:
今天上午从王克非老师处得知:
北外双语平行语料库已经完全ready了,书和光盘的出版也是迟早的事。
之所以至今没有出版原因是项目结题所必需履行的审批手续还没有办完。所以大家再等等吧。

对了,王老师说,最后公开的语料不是整个语料库,但至少也在1000万以上吧。

里边大概包含了什么样的语料?
 
回复:北外双语平行语料库最新消息

以下是引用 动态语法2005-10-22 7:12:22 的发言:
以下是引用 xujiajin2005-10-21 14:51:57 的发言:
今天上午从王克非老师处得知:
北外双语平行语料库已经完全ready了,书和光盘的出版也是迟早的事。
之所以至今没有出版原因是项目结题所必需履行的审批手续还没有办完。所以大家再等等吧。

对了,王老师说,最后公开的语料不是整个语料库,但至少也在1000万以上吧。

里边大概包含了什么样的语料?

会由如下子库组成:
2005102208403867.gif

这是一个“通用语料库”,收集的语料均为全文。


[本贴已被 作者 于 2005年10月22日 08时43分51秒 编辑过]
 
这个双语平行语料库的题材是哪方面的啊?文学的?还是其他什么方面的?
现在听说过的双语语料库大都是关于某部作品的翻译版之间的比较哈
 
Both literary and non-literary works, from English into Chinese and from Chinese into English.
 
回复:北外双语平行语料库最新消息

以下是引用 majorlv5112005-10-24 19:52:02 的发言:
这个双语平行语料库的题材是哪方面的啊?文学的?还是其他什么方面的?
现在听说过的双语语料库大都是关于某部作品的翻译版之间的比较哈

既有文学又有非文学百科方面的语料,但是,文学方面的文本占的比重大一些。因为其语料选择注意了语域之间的平衡性原则,因而属于通用语料库,而不仅仅是某部或者几部文学作品之间的比较。该语料库由英->汉,汉->英原创文本和对应的翻译文本构成。
 
找到一篇王克非老师的题为<英汉/汉英语句对应的语料库考察>的文章,不知道是不是关于这个语料库的.
 
通用汉英对应语料库(约3000万汉字/英文词),包括四个子库:

翻译文本库(2000万,文学60%(英汉60%,汉英40%),非文学40%(英汉55%,汉英45%))
百科语料库(1000万,均衡抽样,文学30%,人文25%,社科30%,科技15%)
专科语料库(从文理各挑1-2科做样例,暂缺)
对译语句库(600万,取自各种翻译教材,翻译练习,对译读物,双语工具书等)
 
回复:北外双语平行语料库最新消息

以下是引用 majorlv5112005-10-25 9:56:16 的发言:
找到一篇王克非老师的题为<英汉/汉英语句对应的语料库考察>的文章,不知道是不是关于这个语料库的.

就是关于这个语料库的,100% sure.
 
回复:北外双语平行语料库最新消息

以下是引用 yuliaoku2006-3-14 11:53:38 的发言:
请问这个语料库是在什么层次上对齐的?正确率大约是多少?

也问一句:“在什么层次上对齐的?正确率大约是多少?” 如何对齐的?目前有成熟的对齐工具吗?如果没有,请问人工对齐是如何做到的?
 
王老师在他主编的《双语对应语料库研制与应用》有详细说明的,而且有例证。
 
Back
顶部