MMAX Annotation Tool

回复: MMAX Annotation Tool

laohong说,mmax可以用来标注对齐的语料库,有问题想问:

有两个文件,一个是英文文件,一个是汉语译文,用max进行对齐标注的时候,是要把这两个文件合并成一个文件,还是分别调入max?如果是分别调入,如何操作?

两个方法,根据情况选取:
1、把中文、英文文本合并成一个文本文件后,再导入MMAX中标注;
2、先不合并,分别导入MMAX后,然后使用一个merger的程序,把它们合并起来。

我自己用的是第二种方法,因为中英文本POS使用的是不同Tagger,而且Tag Set也不一样。
 
回复: MMAX Annotation Tool

两个方法,根据情况选取:
1、把中文、英文文本合并成一个文本文件后,再导入MMAX中标注;
2、先不合并,分别导入MMAX后,然后使用一个merger的程序,把它们合并起来。

我自己用的是第二种方法,因为中英文本POS使用的是不同Tagger,而且Tag Set也不一样。
谢谢laohong。
merger程序是mmax自带的么,还是第三方软件?

我在试mmax的时候,一次只能导入一个文本,那么,如果要导入两个文本,是否要分别导入,而且要起不同的文件名吗?

再次感谢,并祝节日快乐!
 
回复: MMAX Annotation Tool

谢谢laohong。merger程序是mmax自带的么,还是第三方软件?
我在试mmax的时候,一次只能导入一个文本,那么,如果要导入两个文本,是否要分别导入,而且要起不同的文件名吗?

再次感谢,并祝节日快乐!

Merger程序是自制的。MMAX一次只能导入一个文本,如果要导入多个文本,需要一个一个来,文件名当然也应该不一样。
 
回复: MMAX Annotation Tool

Merger程序是自制的。MMAX一次只能导入一个文本,如果要导入多个文本,需要一个一个来,文件名当然也应该不一样。

感谢laohong的回答。
还有一个问题:双语文件需要进行对齐处理么?如果需要,什么软件好?如果不需要,mmax怎么进行对齐?
 
回复: MMAX Annotation Tool

感谢laohong的回答。
还有一个问题:双语文件需要进行对齐处理么?如果需要,什么软件好?如果不需要,mmax怎么进行对齐?

对齐好的和没有对齐的都可以用MMAX进一步处理,没有对齐的也可以用MMAX人工对齐,不过需要自己订制sentence scheme来达到对齐目的。
 
回复: MMAX Annotation Tool

对齐好的和没有对齐的都可以用MMAX进一步处理,没有对齐的也可以用MMAX人工对齐,不过需要自己订制sentence scheme来达到对齐目的。

是用它的pointer relation么?
 
回复: MMAX Annotation Tool

对齐好的和没有对齐的都可以用MMAX进一步处理,没有对齐的也可以用MMAX人工对齐,不过需要自己订制sentence scheme来达到对齐目的。


laohong能否给出一些样例呢?
 
回复: MMAX Annotation Tool

laohong能否发一份到corpus4u公用邮箱,也好让我们都学习学习。谢谢!
 
回复: MMAX Annotation Tool

请教老洪一个问题:我在使用MMAX2(opensource version)的时候为什么文件一大就打不开呢?xml文件不大时可以打开,如果增加文件就出现错误: java.lang.nullpointerexception.
不可能是内存不够啊,用UAMtool 很快就可以打开.
试了很多次都这样,急盼老洪指教,谢谢!!!
 
回复: 刘泽权《红楼梦》句对齐标注问题求解

mmax2一次只能处理一个文件啊?!那在多个文件做语域标注的时候,貌似没有uam方便啊,当然我知道uam是小学生了,mmax是大学生了。呵呵。但在这一点上,是否如我所说这样。本人是新手,说的不对,大家多见谅。
 
Back
顶部