关于claw4 tagging trial的两点问题

我用claw4 tagging trial 给clec 做了词性赋码,是把文本切成了数段, 分次粘贴做的, 有两个疑问
1.这样是不是会影响准确率呢,我的确看到很多介词as被标成了连词, 是不是claw在对多词性词的标注上会有偏差呢
2 赋码完成后, 我用wordsmith查询的时候的确可以有很大的帮助但是pos tagging 占位置, 查询词collocation的位置也就随着向后串了一位, 是否能够有方法吧tagging隐去不看呢?
;)衷心谢谢
 
Back
顶部