回复: 看一看我的语料库
就凭这点小儿科,你要申请基金我来评审就不批。这在技术上,弄个简单的词典,不是很难的事情,当然要做好,涉及到分词、新词(词组)识别等问题,还是很不容易。翻译和专业也有关系,目前的语料库来源比较杂乱,不太好弄。当语料库规模有一两千万句对的时候,提取词典需要消耗大量的计算资源(你如只有2G内存就不要试了)。不过我对那些名家小说的翻译比较感兴趣,比如从红楼梦双语语料库中自动提取的翻译词典可能不少人会看一看。欢迎各位大侠协助提供相关语料库。
试用了,很有价值的功能. 大规模语料做到汉英词层面(?模糊)对齐,国内还有第二例吗?建议申请国家基金支持.
就凭这点小儿科,你要申请基金我来评审就不批。这在技术上,弄个简单的词典,不是很难的事情,当然要做好,涉及到分词、新词(词组)识别等问题,还是很不容易。翻译和专业也有关系,目前的语料库来源比较杂乱,不太好弄。当语料库规模有一两千万句对的时候,提取词典需要消耗大量的计算资源(你如只有2G内存就不要试了)。不过我对那些名家小说的翻译比较感兴趣,比如从红楼梦双语语料库中自动提取的翻译词典可能不少人会看一看。欢迎各位大侠协助提供相关语料库。