这个检索只能人工完成吗?

CLEC里的ST3和ST4只有失误标注,没有语法标注,虽然有语法标注频数表,但只是最后的数字统计结果,没有原始文字资料。如果要检索所有的带TO不定式,我能想出的办法就是用软件先检索出所有的带TO检索行,然后进行人工逐行确认,去除那些非不定式的检索行。
请问各位大侠,还有别的更好的办法吗?
 
回复: 这个检索只能人工完成吗?

用CLAWS 4.0进行语法标注后,不定式标成:_TO,然后提取出来。
 
回复: 这个检索只能人工完成吗?

其实这个还是有些困难的,由于是learner corpus,原文本中可能会有许多语法错误,相应地claws标注结果可能会不够准确,这个问题在SECCL的标注结果中就比较明显。
 
Back
顶部