有可能把TED汉英库和英汉库合成一个库吗?

最近看见Ted speeches有一个汉英库和一个英汉库,为何不合二为一呢?合与不合,哪个利更大?我完全不懂技术。谢谢!
 
回复: 有可能把TED汉英库和英汉库合成一个库吗?

最近看见Ted speeches有一个汉英库和一个英汉库,为何不合二为一呢?合与不合,哪个利更大?我完全不懂技术。谢谢!

一般完善的双语语料库检索,应允许一个库里,双方向检索。

但目前我们所用的CQPweb系统并不适合做双语语料库检索,我们通过一些变通的办法才实现了双语语料库的在线检索。目前把TED分开是不得已之举。

就TED这个语料库本质来说,它是英译汉平行库,因此,不管从哪个入口进行检索,都需要了解这是一个英译汉口语语料库。
 
Last edited:
Back
顶部