红楼梦汉英翻译平行语料库检索平台供测试

laohong

管理员
Staff member
Hongloumeng Parallel Corpus Prototype Query Package
红楼梦汉英翻译平行语料库检索平台



忙了几天,终于把这个检索平台搞出来了,希望大家测试后多提宝贵意见!意见可以留在这里,也可以发到我gmail的邮件里:@前是corpus.laohong,@后是gmail.com。

几点说明

1、测试数据:
这里供测试的数据包括曹雪芹原文的第一、二、三、四、五、六、八、九、十、十一、十二和十三这12个章节;以及上述12个章节的霍克斯的英语译文和上述12个章节的杨氏夫妇的英语译文。目前的测试数据还没有乔利(Joly)和帮赛尔(Bonsell)的。

2、检索方法:
可以分别检索汉语或者英语,也可以同时检索两种语言。作者也可以单独选择霍克斯或者杨氏,或者全选。检索词语或短语时,可以使用通配符,如?(英文问号)或*等。例如,好?可以检索到好人好处等;the*可以检索到theythere等。

3、检索选项:
可以用鼠标选择要检索的章节、句子特征等信息。按住ctrl键同时用鼠标点选,可以同时选择多个选项。重新选择,请使用Reset按钮。

4、句子语言特征:
由于标注的语料未经整理,句子的语言特征只供参考。注意,如果同时选择某些英汉句子特征去检索的话,搜寻结果可能为零。


这里是测试链接
 
Last edited:
回复: 红楼梦汉英翻译平行语料库检索平台供测试

能公开检索的汉英平行语料库很少。Laohong 这里又先行一步了。
一个建议:检索结果中,点击检索词,能否链接回到原文?
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

Laohong is always great!
congratulations!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

[FONT=宋体]恭喜恭喜![/FONT] :)
[FONT=宋体]好简洁的检索界面,我喜欢![/FONT]

[FONT=宋体]为了让她更完美,鸡蛋里挑个小骨头呵:[/FONT]

[FONT=宋体]检索:笑道。结果如下:[/FONT]
[FONT=宋体]那僧笑道:[/FONT]
[FONT=宋体]二仙笑道:[/FONT]
[FONT=宋体]士隱聽了,不便再問,因笑道:[/FONT]
[FONT=宋体]當下雨村見了士隱,忙施禮陪笑道:[/FONT]
[FONT=宋体]恰值士隱走來聽見,笑道:[/FONT]
[FONT=宋体]雨村聽了,並不推辭,便笑道:[/FONT]
[FONT=宋体]......[/FONT]

[FONT=宋体]师父可不可以把冒号后面的“”放在下一句呢,那样更规范些。[/FONT]

[FONT=宋体]师父辛苦了。:)[/FONT]
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

能公开检索的汉英平行语料库很少。Laohong 这里又先行一步了。
一个建议:检索结果中,点击检索词,能否链接回到原文?

谢谢海洋。目前还没有这个打算,因为链接回到原文会把整个章节调出来,消耗资源过大,也不符合设计初衷:检索英汉句对。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

...可不可以把冒号后面的“”放在下一句呢,那样更规范些。 ...:)

谢谢!这是句子标注时留下的问题,还有一些其它问题,如英文中显示的$$符号,句子属性、类别的界定等,都是在标注时发生的。这些都需要时间来对标注的语料进行清理。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

不知道大家对检索速度、界面、以及通用性等方面有什么建议和意见?
通用性指的是如果你自己有同类语料,这样的搜索引擎是否能达到想要的研究目的?或者你还有其它的要求?
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

检索速度很快,检索界面也很简洁。谢谢laohong!
BTW,曹雪芹的红楼梦原文可不可以增加一个简化字体版本的?
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

检索速度很快,检索界面也很简洁。谢谢laohong!
BTW,曹雪芹的红楼梦原文可不可以增加一个简化字体版本的?

简单就是福啊!

字体选择时主要考虑到红楼梦本来就有很多字在简化字中就没有,即使有也不是原著中的本意,所以最终字体选择的是UTF-8,这样检索结果不管是在英文系统、简体中文或者繁体中文系统里都能正确显示。

另外,这样做还有一个好处,那就是用户在输入检索中文字词时,不管是简体还是繁体,都可以得到结果。例如检索“风尘”或者“風塵”,结果都是同样的4个。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

[FONT=宋体][FONT=宋体]界面改观不小呵,有了[/FONT]Help[FONT=宋体],显示结果页面也有了[/FONT]New Query[FONT=宋体],所显示的英文字体也清秀些了,不是那么胀鼓鼓的了。赞一下呵,师父。:)[/FONT][/FONT]

[FONT=宋体][FONT=宋体]能不能在显示结果页面,直接拉一新检索文本“框”,简单检索就不必再返回首界面了;后附“高级检索”,可链接到首界面。:)[/FONT]

[FONT=宋体]还有,师父既然有很充分的理由用繁体字显示中文本,那把中文字体搞大好不好。现有的中文字体过小,且都用了加粗,都挤到一起了,累眼睛呵。:)[/FONT]
[/FONT]
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

好东西!检索了一个词,发现在句子对齐的时候,也就是分句的时候,中文句子过长,所以在检索的时候会出现一段文字,而你所需要的那个找起来却很费劲!但是对于文学研究来讲的确是好事!还有,中科院的那个在线检索的软件在这方面就稍微好一些,可能在分句的时候尽量简短了,且分号也作为一句!但是缺点就是检索的英文句子中有很多有语法错误,比较郁闷了!呵呵!感谢LAOHONG!!!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

多谢laohong 速度好快呢 只是中文字小了些 另外 每页显示数目不可以自己设定么
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

[FONT=宋体][FONT=宋体]能不能在显示结果页面,直接拉一新检索文本“框”,简单检索就不必再返回首界面了;后附“高级检索”,可链接到首界面。:)[/FONT]

[FONT=宋体]还有,师父既然有很充分的理由用繁体字显示中文本,那把中文字体搞大好不好。现有的中文字体过小,且都用了加粗,都挤到一起了,累眼睛呵。:)[/FONT]
[/FONT]

好,回头有时间就改。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

好东西!检索了一个词,发现在句子对齐的时候,也就是分句的时候,中文句子过长,所以在检索的时候会出现一段文字,而你所需要的那个找起来却很费劲!但是对于文学研究来讲的确是好事!还有,中科院的那个在线检索的软件在这方面就稍微好一些,可能在分句的时候尽量简短了,且分号也作为一句!但是缺点就是检索的英文句子中有很多有语法错误,比较郁闷了!呵呵!感谢LAOHONG!!!

这里的中英文的句子都是人工标注的,是基于语法规则来做判定的(其中错误当然难免),句子并不是根据字数的多少或标点来自动分切的。如“伟大的、光荣的、正确的中国共产党在国际正义势力的支持下,在以毛泽东、周恩来、朱德等为核心的老一辈无产阶级革命家的卓越领导下,历尽磨难终于在艰苦卓绝的八年抗战和随后的四年国共内战后胜利地推翻了长期以来压在四万万五千万中国人民身上的三座大山。”这个句子够长吧?其实也就是个简单的主谓句:共产党推翻了大山。

另外,这里的检索结果是按set显示的,即一句翻成一句,一句翻成多句,或多句翻成一句都是按一个set来显示的。因此,这样就十分优于现行的其它平行语料库。比如,我们可以迅速提取出所有一翻多的句子来进一步分析什么样的句子为什么这些句子需要翻译成多个句子,我们也可以迅速统计出多个句子被合并翻译成一个句子的情况如何, 等等。这一点,用户是无法从中科院的、厦门大学的或者句库等平行语料库中得到的。

通常被检索的关键词都会在结果中用背景颜色高亮显示,不明白为什么你觉得不太容易找到检索词。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

多谢laohong 速度好快呢 只是中文字小了些 另外 每页显示数目不可以自己设定么

字体回头就要修改,不过每页显示多少是不能让用户自己设定的。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

根据大家的建议,有了一些修改,请大家再指正!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

For Xiaoz, 这可奇了的三种翻译:

C005 寶玉 一把 拉住 說道 :「 這 可 奇 了 , 好好 的 怎麼 怕 起 她 來 ?」 林 黛 玉 急得 跺腳 , 悄悄 的 說道 :「 你瞧 瞧 我的 眼睛 , 又 該 她 拿著 取笑 開心 了 。」 寶玉 聽說 , 趕忙 的 放了 手 。 黛 玉 三步 兩步 轉過 床 後 , 剛 出了 後 院 , 鳳 姐 從前 頭 已 進來 了 , 問 寶玉 :「 可好 些 了 ? 想 什麼 吃 ? 叫人 往 我 那 裏 取去 。」 接著 , 薛 姨媽 又來 了 。 一時 賈 母 又打 發 了 人 來 。

Y005 Baoyu caught her hand protesting , " That 's a strange thing to do . Why should you be afraid of her ? " Daiyu stamped one foot in desperation . " Look at my eyes , " she whispered . " She'd make fun of me if she saw . " At once he released her and she slipped past his bed and out through the back court just as Xifeng came in from the front . " Are you better ? " she asked Baoyu . " If you fancy anything to eat , send someone to my place for it . " Aunt Xue called next . And then the Lady Dowager sent maids to inquire after the invalid .


H005 Bao - yu seized hold of her hand . ' Now that 's funny . Why should you start being afraid of her all of a sudden ? ' She stamped with impatience . ' Look at the state my eyes are in ! ' she said . ' I do n't want them all making fun of me again . ' At that Bao - yu released her hand and she bounded round to the back of the bed , slipping into the rear courtyard just as Xi - feng was entering the room from the front . ' A bit better now ? ' said Xi - feng . ' Is there anything you feel like eating yet ? If there is , tell them to come round to my place and get it . ' As soon as Xi - feng had gone , Bao - yu was visited by Aunt Xue , and shortly after that by someone whom his grandmother had sent to see how he was getting on .


J005 " This is indeed strange ! " exclaimed Pao - yü as he laid hold of her and tried to detain her . "How is it that you've deliberately started living in fear and trembling of her ! " Lin Tai - yü grew impatient and stamped her feet . " Look at my eyes ! " she added in an undertone . " Must those people amuse themselves again by poking fun at me ? " After this response , Pao - yü speedily let her go . Lin Tai - yü with hurried step withdrew behind the bed ; and no sooner had she issued into the back - court , than lady Feng made her appearance in the room by the front entrance . " Are you better ? " she asked Pao - yü . " If you fancy anything to eat , mind you send some one over to my place to fetch it for you . " Thereupon Mrs . Hsüeh also came to pay him a visit . Shortly after , a messenger likewise arrived from old lady Chia (to inquire after him) .
 
Back
顶部