中英双语在线(CEO)测试已开通

回复: 中英双语在线(CEO)测试已开通

商业软件太贵,mysql对于咱们的语料库应该够了。提高性能从其他方面考虑了。
咱们的语言形式检索不同于信息检索的主题检索,TF*IDF等排序好像不合适。

在MySQL数据库中使用通配符进行数据检索,确实非常慢,毕竟人家是免费软件,对于大数据量的处理确实不够理想。有没有可能使用自带各种优化的Oracle,不过甲骨文公司的这个专业数据库软件大概8-10万元,不知道王老师的课题组有没有可能购置使用。
同时请问熊老师,您对查询出的众多语句是如何进行排序的?是否用的MySQL自带的优化查询语句?
 
1. could be very helpful
2. seems to be writen langauge oriented
3. examples seem to be kind of formal but dated
4. not all words can be found, eg 'leverage', a quite friquently used word, well, cheat is a better example
5. hope it is open ended, allowing conscientious people to add some items before both the versions are verified.
6.some translations are questionalble "commuity"
 
Last edited by a moderator:
回复: 中英双语在线(CEO)测试已开通

中文双语在线语料库,很棒!满足我语言对比的研究。谢谢,辛苦了!
 
回复: 中英双语在线(CEO)测试已开通

謝謝有這么好的一個平行語料庫。Laohong已經提出了很多好的建議。在這里我想補充一點,我覺得語料的內容比較單一,除了部分文學翻譯外,大部分是政治性的題材,而且都是90年左右的題材,有點老了。如果能擴大文本題材的話會更好。
 
回复: 中英双语在线(CEO)测试已开通

謝謝有這么好的一個平行語料庫。Laohong已經提出了很多好的建議。在這里我想補充一點,我覺得語料的內容比較單一,除了部分文學翻譯外,大部分是政治性的題材,而且都是90年左右的題材,有點老了。如果能擴大文本題材的話會更好。

It's easier said than done.
 
Back
顶部