Z zhizhihuizi 2010-02-03 #1 CLEC里的ST3和ST4只有失误标注,没有语法标注,虽然有语法标注频数表,但只是最后的数字统计结果,没有原始文字资料。如果要检索所有的带TO不定式,我能想出的办法就是用软件先检索出所有的带TO检索行,然后进行人工逐行确认,去除那些非不定式的检索行。 请问各位大侠,还有别的更好的办法吗?
CLEC里的ST3和ST4只有失误标注,没有语法标注,虽然有语法标注频数表,但只是最后的数字统计结果,没有原始文字资料。如果要检索所有的带TO不定式,我能想出的办法就是用软件先检索出所有的带TO检索行,然后进行人工逐行确认,去除那些非不定式的检索行。 请问各位大侠,还有别的更好的办法吗?
ArthurW 2010-02-03 #3 回复: 这个检索只能人工完成吗? 其实这个还是有些困难的,由于是learner corpus,原文本中可能会有许多语法错误,相应地claws标注结果可能会不够准确,这个问题在SECCL的标注结果中就比较明显。
回复: 这个检索只能人工完成吗? 其实这个还是有些困难的,由于是learner corpus,原文本中可能会有许多语法错误,相应地claws标注结果可能会不够准确,这个问题在SECCL的标注结果中就比较明显。