Parallel Corpora和Balanced Corpora

清风出袖

高级会员
parallel corpus 和balanced corpus之间有什么区别?翻译过来是否前者是平行语料库,后者是平衡语料库?谢谢百忙之中回应!
 
回复:一个幼稚的问题!

看来网上大侠们都睡觉去了,我来回答你的问题。

Parallel Corpora涉及不同语言的语料,通常是翻译材料放在一起。

Balanced Corpora涉及不同类型的语料,例如书面语,口语及其细类,而不是
偏向某一(些)类。
 
回复:一个幼稚的问题!

以下是引用 清风出袖2005-7-13 19:57:04 的发言:
parallel corpus 和balanced corpus之间有什么区别?翻译过来是否前者是平行语料库,后者是平衡语料库?谢谢百忙之中回应!
你的译文是对的。

parallel corpus通常是由双语或多语的对应语料构成,常常是翻译文本构成。例如:Babel English-Chinese Parallel Corpus (http://bowland-files.lancs.ac.uk/corplang/babel/babel.htm)。平行语料库常被用做对比和翻译研究之用。

balanced corpus主要是指其语料的取样上是均衡的,有代表性的。这种语料可以用作得出有关某种语言特性的一般性的结论。
例如:Lancaster Corpus of Mandarin Chinese
http://bowland-files.lancs.ac.uk/corplang/cgi-bin/conc.pl
以及
Academia Sinica Balanced Corpus of Modern Chinese
http://www.sinica.edu.tw/SinicaCorpus/
 
A parallel corpus is composed of texts which are translations of each other in different languages. Balance is associated with corpus representativeness.

翻译过来前者是平行语料库,后者是平衡语料库.
 
Richard我俩又有点打架了。说明我俩还是很认真负责的。

我刚发上去,发现你的也来了。
 
Have just come back from the University.

I will not be available July 14-17 during the conference of Corpus Lingusitics 2005 in Birmingham.
 
Back
顶部