有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

#1
本人想建立一个中韩对齐语料库,以研究某些翻译规律。试了一些老师们分享的软件,如BFSU Sentence Segmenter,BFSU SentCounter,雪人翻译软件,韩语现实的都是小框框。如缩略图所示。其中的汉字是韩语中本来就有的。
不过雪人翻译软件的对齐正确率还是蛮高的。中英、中日都有,推荐使用~这里虽然都是框框,检索时还是能识别出来的。

韩语在TXT中要保存为unicode格式的。是不是因为上述软件不支持UNICODE才导致的?有没有能够现实韩语的软件?paraconc可以吗?
 

附件

#2
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

对齐用 SDL Trados的Winalign,有各种语言版本。
ParaConc可以平行检索,语言设置栏有选项,可以的。对齐应该可以用。
 
#3
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

ParaConc对齐或检索之前,亚洲语言(如中文)要求分词,韩语我不知道怎么分词。梁茂成,李,许三位的教程提到过PowerGrep用正则表达式分词,原则上韩语也可以,一试。但注意,PowerGrep分汉语字而非词,即一个一个的字,分开后ParaConc才认。这也正是正则可以确认字符的方式。韩语,不懂,不知字词的规律是否像汉语一样,可用否?
请教方家吧。
 
#4
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

http://www.newhua.com/softdown/109656_2.htm
HyConc可以检索平行语料,支持unicode字符集。下载语料处理软件试试看能否正常显示。可以在一对一平行语料检索窗口,正则式检索处进行测试。如果有问题可以把语料发给我,我给您看看。
 

xujiajin

管理员
Staff member
#5
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

支持nanyanfei老师的HyConc软件。
 
#6
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

支持nanyanfei老师的HyConc软件。
谢谢!可以把汉语和韩语文本全部保存为UNICODE,在检索的时候,通过下拉框选择字符编码方式为Unicode,在平行语料一对一检索窗口正则式检索页面处进行尝试。正则式检索窗口同样也支持关键词检索,初次检索可以不考虑正则式怎样写,只输入关键词就可以。
 
#7
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

谢谢!可以把汉语和韩语文本全部保存为UNICODE,在检索的时候,通过下拉框选择字符编码方式为Unicode,在平行语料一对一检索窗口正则式检索页面处进行尝试。正则式检索窗口同样也支持关键词检索,初次检索可以不考虑正则式怎样写,只输入关键词就可以。
非常感谢nanyanfei老师的指点!问题已经解决。主要是win7下需要在系统更新里面安装韩文语言包。我表示十分兴奋!:D:D
 
#9
回复: 有没有支持韩语的对齐工具和平行语料库检索工具?paraconc可以吗?

ParaConc对齐或检索之前,亚洲语言(如中文)要求分词,韩语我不知道怎么分词。梁茂成,李,许三位的教程提到过PowerGrep用正则表达式分词,原则上韩语也可以,一试。但注意,PowerGrep分汉语字而非词,即一个一个的字,分开后ParaConc才认。这也正是正则可以确认字符的方式。韩语,不懂,不知字词的规律是否像汉语一样,可用否?
请教方家吧。
非常感谢!!
韩语中不需要分词。句子成分都是用空格隔开的。但是需要曲折变化还原。待我整理韩国学者常用工具一定与大家分享交流。
 
顶部