请教各位高手:
我在使用paraconc做个汉英句对齐的小项目,结果汉语总是出现乱码,应该怎么解决呢?另外,我还想把它做成可以方便搜索的语料库,如何实现paraconc的句对齐结果与语料库的衔接呢?(就是怎样把paraconc的句对齐做成可在网上方便查阅的语料库?)请各位高人指点。不胜感激!
我也想知道。大家谁有个样板库,哪怕很小的,发来看看!
样板文件参阅下面帖子的第46楼: (求教)求以标准通用置标语言辅助人工标注的软件
一早爬到网上,见laohong把两年多以前的好帖给捞了上来了.读了很贴心.好个 德才艺三馨的laohong和xiaoz . 46楼及其它一定让我的同事们好好读一读,因为我们已土法上马,正编着类似的事.procedure 还挺符合的, 没有走偏. 只是对齐我们用的是笨办法,当然若可能,还是想请Laohong当面指导.
诸位高手,能不能回答一下第二个问题?就是怎样把paraconc做成的句对齐成果转变成网上查询的语料库?
呵呵,谢谢,过奖了!当面指导说不上,喝个小酒吹吹牛还是可以的,不过7月要去Liverpool,8月倒可能赋闲……