红楼梦汉英翻译平行语料库检索平台供测试

回复: 红楼梦汉英翻译平行语料库检索平台供测试

请教一下老洪博士,古文的分词在这个工程中是怎么解决的?你们编了相应的分词软件么?还是手工分词?盼复!谢谢。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

中文分词使用了自己开发的一个综合分词器,主要是在台湾中央研究院词库小组(CKIP)的中文自动断词系统AutoTag和北京中科院ICTCLAS分词系统的结果上统计分析后取弥合最好的。当然,错误还是难免的,好在词语并不是本项目的研究重点,这里我们更关注句子及语篇层面的特征。一旦做到了句子层面的对齐,词语、语篇、翻译技巧等就可以进一步的分析和精加工了。希望有兴趣的朋友能加入。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

您好:
"红楼梦汉英翻译平行语料库检索平台供测试"在哪里可以找到?
在网上可以应用吗?
谢谢!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

应该是国内第一个名著平行语料检索!语料研究开路先锋!版主辛苦了!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

恭喜LaoHong,恭喜,但是我只是能用了,却看不懂事怎么做到的,能不能说说制作方法?谢谢!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

恭喜LaoHong,恭喜,但是我只是能用了,却看不懂事怎么做到的,能不能说说制作方法?谢谢!

对大多数用户来说,能用就行,毕竟搞明白制作过程也是需要一些时间的。当然,如果对技术本身感兴趣,或是想处理自己的语料,花点时间研究一下也是值得的。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

谢谢老洪博士的回复,其实我就是对技术比较感兴趣,能不能在这方面给点建议?谢谢
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

对于一个入门汉来说,真是发现了一个宝藏,在此唯有谢谢:)希望还能看到更多更好的东东!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

测试版在这里发布也大约有一年半了,细心的朋友也许已经发现,改进版悄然运行一段日子了(有些方面还得抽空更新),目前主要改动有这样两点:
1、数据大小:以前的版本只放了6个章节做演示,现在的数据是全部120回汉语本 + 霍克思的120回英译本 + 杨宪益夫妇的120回英译本。
2、用户限制:所有用户需要登录才能使用,不过普通用户直接点击guest即可登录,但是只能查看检索结果的前两页。注册用户则可以不受此限制。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

测试版在这里发布也大约有一年半了,细心的朋友也许已经发现,改进版悄然运行一段日子了(有些方面还得抽空更新),目前主要改动有这样两点:
1、数据大小:以前的版本只放了6个章节做演示,现在的数据是全部120回汉语本 + 霍克思的120回英译本 + 杨宪益夫妇的120回英译本。
2、用户限制:所有用户需要登录才能使用,不过普通用户直接点击guest即可登录,但是只能查看检索结果的前两页。注册用户则可以不受此限制。

请问,注册收费么?还是免费?
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

laohong的语料库做的太漂亮了,谢谢分享!刚注册了个wxsong,正等审核。和各位C友一样,希望能得到点技术上的指导!
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

请问,注册收费么?还是免费?

注册不收费,但不是每个申请者都会得到full access,因为这取决于申请者提供的研究说明。简单的写成:for research, for study, corpus lover等等,很遗憾地说,那就没必要注册了,建议使用Guest帐户就可以了。希望大家能理解这样做的苦衷。
 
很感兴趣如何输入一种文字的搜索词会自动调出双语的语境来?

很感兴趣如何输入一种文字的搜索词会自动调出双语的语境来?就是说输入I, 搜索后“我”和"I"各自的例句同时对齐调出??——正在研究我学生口译,所以很急需。可点拨否??
 
回复: 很感兴趣如何输入一种文字的搜索词会自动调出双语的语境来?

很感兴趣如何输入一种文字的搜索词会自动调出双语的语境来?就是说输入I, 搜索后“我”和"I"各自的例句同时对齐调出??——正在研究我学生口译,所以很急需。可点拨否??

在laohong的 红楼梦 检索页面里,左边填,同时右边填I, 敲Search就会得到你要的结果。
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

Laohong laoshi,

Millions of thanks for your effort and generous sharing.

Hongloumeng Parallel Corpus Prototype Query Package
红楼梦汉英翻译平行语料库检索平台


忙了几天,终于把这个检索平台搞出来了,希望大家测试后多提宝贵意见!意见可以留在这里,也可以发到我gmail的邮件里:@前是corpus.laohong,@后是gmail.com。

几点说明

1、测试数据:
这里供测试的数据包括曹雪芹原文的第一、二、三、四、五、六、八、九、十、十一、十二和十三这12个章节;以及上述12个章节的霍克斯的英语译文和上述12个章节的杨氏夫妇的英语译文。目前的测试数据还没有乔利(Joly)和帮赛尔(Bonsell)的。

2、检索方法:
可以分别检索汉语或者英语,也可以同时检索两种语言。作者也可以单独选择霍克斯或者杨氏,或者全选。检索词语或短语时,可以使用通配符,如?(英文问号)或*等。例如,好?可以检索到好人好处等;the*可以检索到theythere等。

3、检索选项:
可以用鼠标选择要检索的章节、句子特征等信息。按住ctrl键同时用鼠标点选,可以同时选择多个选项。重新选择,请使用Reset按钮。

4、句子语言特征:
由于标注的语料未经整理,句子的语言特征只供参考。注意,如果同时选择某些英汉句子特征去检索的话,搜寻结果可能为零。


这里是测试链接
 
回复: 红楼梦汉英翻译平行语料库检索平台供测试

Laohong laoshi,

Millions of thanks for your effort and generous sharing.

谢谢!一点说明:你帖子里引用的内容是很早以前的,现在整个语料库都可以检索,只是普通用户只能看到首两页搜索结果,但这对大多数人来说也已经足够了。如哪位有特殊要求请与本人直接联系。
 
Back
顶部