我用Gotagger对生语料库进行了自动标注,然后再检索,奇怪的是,没有标注的时候,我检索一个词, 比如people, Antconc3.2还可以行,现在标注完了,检索什么都没有啊。迷茫。
应该是两个软件所使用的附码形式不匹配引起的问题。用Gotagger标注完的文本使用的是Word_Tag(下划线)的形式,而Antcon所适用的要么是未附码的文本,要么是带<Tag>(尖括号)附码的。
可以使用Dr. Xiao在该坛子里提供的Perl程序,将Gotagger附码后的语料转换为附码在尖括号内的后,再使用Antcon检索即可,
很明显,oscar3所提供的截图中有一个很值得注意的地方:在search Term中,所给的三个选项words、case和regex 没有选中任何一个。
我想这肯定会引出个问题,即检索准确度的问题。用oscar3的检索办法, 如果检索词是the,使用word_tag形式的语料进行检索后,所得到的检索行中的结点词除了包含有the之外,还会有其他含有the字符的词,如another.furtherd等。
请见下面截图。
谢谢oscar3的解释!regex检索功能强大,chrisyang正在学习使用PowerGrep, 对其还只是略知皮毛。但是我还是想知道,如何具体设置Antconc(我这边用的是Antconc 3.2.0)才能对word_tag形式的语料进行词(words)的检索。
希望能够利用下面提供的语料给个截图解释一下。向您学习啦!