ineedgerf
普通会员
我顺着本站提供的链接,下载了TAIParse Part-of-Speech (POS) Tagger。结果如下:
And/CC Durbeyfield/UNKNOWN lay/UNKNOWN back/UNKNOWN comfortably/RB on/IN
[ the/DT grass/NN ]
./. '/'
这个结果和 TOSCA/LOB 相比:
<w CC>And</w> <w NP>Durbeyfield</w> <w VBD>lay</w> <w RP>back</w> <w RB>comfortably</w> <w IN>on</w> <w ATI>the</w> <w NN>grass</w><w SPER>.</w>
我们发现其准确率差很多。
不过 TAIParse Part-of-Speech (POS) Tagger 的功能多了一些,但愿以后的版本能好一些。
推荐 TOSCA/LOB 的原因:
1)基于 DOS;
2)可以批处理;
3)准确率高;
4)允许其它码的存在
等。
WinBrill 是非英语版本,里面的规则虽然可以编辑,但是也很麻烦,虽然是个“基于规则”的好东西,但还是不如 TOSCA/LOB。
其它 TAGGERS 没有使用过。
QTag 也比较好用。
有 CLAWS 能分享就更好了!它现在有了 Windows 版本了。
And/CC Durbeyfield/UNKNOWN lay/UNKNOWN back/UNKNOWN comfortably/RB on/IN
[ the/DT grass/NN ]
./. '/'
这个结果和 TOSCA/LOB 相比:
<w CC>And</w> <w NP>Durbeyfield</w> <w VBD>lay</w> <w RP>back</w> <w RB>comfortably</w> <w IN>on</w> <w ATI>the</w> <w NN>grass</w><w SPER>.</w>
我们发现其准确率差很多。
不过 TAIParse Part-of-Speech (POS) Tagger 的功能多了一些,但愿以后的版本能好一些。
推荐 TOSCA/LOB 的原因:
1)基于 DOS;
2)可以批处理;
3)准确率高;
4)允许其它码的存在
等。
WinBrill 是非英语版本,里面的规则虽然可以编辑,但是也很麻烦,虽然是个“基于规则”的好东西,但还是不如 TOSCA/LOB。
其它 TAGGERS 没有使用过。
QTag 也比较好用。
有 CLAWS 能分享就更好了!它现在有了 Windows 版本了。