请教:语料用treetagger赋码后,Antconc和Collocator检索结果不一致问题

各位专家,
我在给Locness部分语料用梁教授开发的treetagger赋了词性码后, 分别用Antconc 和Collocator 1.0检索VV, 得出的结果不同,Antconc检索出5745个VV,而Collocator检索出5665个VV。这是什么原因呢? 在词性赋码前文本需要做什么处理吗?
请各位专家赐教。万分感谢!
 
回复: 请教:语料用treetagger赋码后,Antconc和Collocator检索结果不一致问题

Collocator 1.0不是检索工具,是算搭配的,不知道你是怎么检索的。
还有可能是token definition不一样,

AntConc只有alphabetic才算token。
 
请教:如何避免索引行里出现乱码 ???

我做了一个文本文档,用Antconc检索,但是在检索行里出现 ??这样的符号,通常是在句首出现,请问这是怎么回事?但是在文本文档里确看不到这样的乱码,如果想去掉这样的符号,应该怎么做呢?

我将这个文本文档和检索that 的结果放在附件中,麻烦请各位看看。

多谢帮助解答!
 
请教:如何避免索引行里出现乱码 ???

我无法发表新帖,只好用这个办法。其实乱码不是两个问号,而是两个倒立的惊叹号。附件在这里。
 
Back
顶部