我用过Trados的WinAlign,从使用者的角度来看,需要注意几点。一,WinAlign对纯文本文件的对齐处理准确率不高,最好能够用doc等带格式的文本,而且在对齐之前最好通过格式设置使原文和译文初步达到对齐,比如标题,正文等不同级别。二,WinAlign对齐处理之后,句子层面是对齐了,但是,原来的行文顺序却被打乱了。最后,WinAlign对齐处理要达到比较高的对齐准确性,最好同时使用双语术语帮助对齐。
大家容易弄到的对齐软件还有机助翻译软件DJV的对齐插件Aligner,对DJV的对齐插件,我只试用过一次,感觉使用起来到是很简单,但是,体会不深。
另外一个对齐软件是雅信的对齐工具。很多人都喜欢大骂自己国产的软件不如外国的,但是,从我自己试用的经验来看。我觉在我试用过的工具里面,雅信的对齐工具对齐效果可以算是最好的。
我等不会编程,不能像laohong那样去自己动手,只能这样比较被。
当然有啊,不过既然你很熟悉WinAlign,在介绍别的工具前,你能不能先讲一讲WinAlign粗在哪些方面了,有什么缺陷,你还需要什么样的功能、改进来达成你的使用和研究目的?
一个被讨论过N次的问题。准确的说这个问题在这里无解,除非自己舍得花钱买商业软件,比如说雪人,雪人的对齐效果还是相当好的。
无解的原因是高手可以自己写软件而不屑于做这种事情,写不了软件的有钱也行,估计多数人不会花解决2000元去买个雪人软件。
还有种解决方案就是找人破解,但这个论坛不允许讨论破解的相关问题。
研究了那么多对齐方法没有人去写一个软件有什么意义?写了很多论文没有投入实际应用,价值几乎等于零。
对少量的完整文本作双语对齐,采用软件辅以人工校对是可以的,但对大批量,目前市面上的软件都是"浮云".即使花钱购买"商业软件"也无法一劳永逸地处理大批量的文本.
再高深的理论(如本帖内的附件"双语语料库段落重组对齐方法研究.pdf" ),
目前似乎仍无法解决双语完整文本句对齐的实际问题.
对齐只是简单劳动.若对完整文本双语对齐感兴趣或有需要,欢迎来绍兴这个小地方交流一下.
PS:
需要说明的是,北大有一款(柠檬水)软件,去年曾在本坛秀了一下,非常棒:能对齐的留着,无法对齐的就扔了. 厦大史博士(mandel)就更厉害了,目前已是硕果累累, 可能也是这样处理的.对于不需要完整文本对齐的语料库,请求教这于这两位高人.
能对齐的保留,无法对齐的扔掉,这种做法有点不负责任。雪人对齐能够通过词典辅助对齐,对齐的效果是目前最好的,....
俺又要得罪人啦:
你是来这里推销雪人,还是真的挺书生气的?
你用过"柠檬水"水软件吗?你了解Mandel的双语语料对齐的设计思路和用途吗?
别给雪人吹牛了, 有机会不用这两位高人出山, 我们就以手工方式和你的雪人PK一下, 如何?