百度统计机器翻译的可喜收获

百度统计机器翻译的可喜收获
http://blog.sina.com.cn/s/blog_72d083c70102dqm3.html
我试了一下,觉得准确率相当的高,没想到百度技术能那么 高啊
机器翻译必定有美好的前途,神马都是浮云
Machine translation will have a bright future, everything is nothing
自然语言(373022139) 9:49:47
这是一个例句
机器翻译加上人工纠正 应该可以成为未来翻译领域的主要潮流,单靠人工翻译效率太低,速度太慢,还是两者结合来得好
Machine translation plus artificial correction should be the main trend of future translation, only by manual translation efficiency is too low, too slow, or both are good
自然语言(373022139) 10:03:38
这句翻译还行,加以人工调整纠正就是个合格句子
 
回复: 百度统计机器翻译的可喜收获

下面是我对百度翻译的一个测试句子。
汉语:
你的话我听不懂。
翻译:
I can't hear you understand.
 
回复: 百度统计机器翻译的可喜收获

百度统计机器翻译的可喜收获
http://blog.sina.com.cn/s/blog_72d083c70102dqm3.html
我试了一下,觉得准确率相当的高,没想到百度技术能那么 高啊
机器翻译必定有美好的前途,神马都是浮云
Machine translation will have a bright future, everything is nothing
自然语言(373022139) 9:49:47
这是一个例句
机器翻译加上人工纠正 应该可以成为未来翻译领域的主要潮流,单靠人工翻译效率太低,速度太慢,还是两者结合来得好
Machine translation plus artificial correction should be the main trend of future translation, only by manual translation efficiency is too low, too slow, or both are good
自然语言(373022139) 10:03:38
这句翻译还行,加以人工调整纠正就是个合格句子

似乎还有很大的提升空间

百度:Seems to have a great room
google:It seems there is much room for improvement
 
回复: 百度统计机器翻译的可喜收获

I can't agree more = 我万分同意。
I cannot agree more = 我不能同意更多。
I can not agree more = 你说得对极了。
 
回复: 百度统计机器翻译的可喜收获

神马都是浮云


baidu: Everything is nothing.

google: Horses are clouds of God

:D:D
 
回复: 百度统计机器翻译的可喜收获

谷歌的机器翻译应该是最好的,机器翻译的牛人一个个的加入谷歌,他们占有谷歌的优势资源,做出来的东西自然更好了。

我们在网上见到的谷歌翻译实际上是短语模型,并不是最好的机器翻译模型,谷歌采用该模型可以兼顾速度与效果。

百度的机器翻译比起谷歌还有很长的路要走,谷歌可实现几十种语言之间的互译,百度只实现两种,几十种互译和两种对译之间的差别还是很大的

但百度终于看到了机器翻译的市场,开始着手研发还是很好的开始。

大家有兴趣可以看看摩西,还有joshua,他们都是开源的机器翻译系统,懂C++(摩西)或者Java(joshua)的老师或同学可以看看这两个机器翻译系统,可以用自己手中的语料(几十万即可)训练个机器翻译系统,不是难事。

PS:摩西是短语模型,开发周期长,效率高,最近也加入了层次短语模型支持
Joshua是层次短语模型,小规模用户使用推荐
 
回复: 百度统计机器翻译的可喜收获

感觉百度的机器翻译
就像是没有充足的语料进行训练
虽然有模型 但是学习不够 所以效果一般。
尤其是平行语料库 比较缺乏。
不管是IBM 1-5 model、短语结构文法等 都是这样的
 
Back
顶部