ilovecorpu
初级会员
各位好! 我是个新手, 想询问一下,如何使用已标注的语料库? 如何使用索引工具(antconc 3.1.2)搜索类联接?
以下是引用 laohong 在 2006-3-12 10:30:07 的发言:
补充一句:
语篇层面的标注,由于目前几乎没有自动处理的工具可用,建议使用 MMAX Annotation Tool (http://www.eml-research.de/english/research/nlp/download/mmax.php)。 不过需要用户自己制作标注的 Scheme。详情可阅读该软件的页面介绍。
dwhuang 如果愿意试用MMAX来标注体裁分析中的move和step,有问题可以和我联系。
以下是引用 singer 在 2006-3-12 23:48:32 的发言:
我尝试着用gototagger给几篇文章做了pos标注,但是不知道准确率到底是多少,也不知道应该如何去post editing,另外,pos标注的准确率达到多少就能保证研究的结果是有说服力的呢?
以下是引用 patricx 在 2006-3-13 8:00:09 的发言:
说得有道理!!!严重支持!!!我也经常考虑到这个问题,有时候使用统计软件时,经常会问问自己,我需要的数据它都统计出来了吗?有数据遗漏吗?如果有遗漏,那是哪些呢?