ictclas汉语分词求助

iCasino

普通会员
#21
回复: ictclas汉语分词求助

AutoAligner只负责对齐,检索还需借助其他工具。注意AutoAligner默认接受/输出文本均为utf-8编码格式。
 
#23
回复: ictclas汉语分词求助

I am new to the ICTCLAS, but now it has been updated to 2014 version. I am in need of it to POS tag my chinese corpus. I have tried to use YACSI but failed. Can you please advise on it? e.g. is Yacsi compatible with the new version of NLPIR, if not, how can I use Yacsi, since I cannot download ICTCLAS2011. Many thanks.
cphuan@hotmail.com
 
#24
回复: ictclas汉语分词求助

童鞋,你的问题解决了吗。我也遇到同样的问题。我的显示: ICTCLAS系统文件缺失或过期。用户词典与Yacsi.exe 不在同一目录。
 
#25
回复: ictclas汉语分词求助

您好。请问一下,在使用NLPIR2014进行分词之后,怎样将搜索结果中的词性标注去掉?我看到网上有人回答 “const char * NLPIR_ParagraphProcess(const char *sParagraph,int bPOStagged=1); 编程的时候bPOStagged=0就可以去掉词性标注”,但请问一下这个要在哪里改?
非常感谢!
 
#27
回复: ictclas汉语分词求助

Dr. Laurence Anthony 也开发了一款分词软件,试了一下发现还挺好的。http://www.laurenceanthony.net/software.html 致谢!
感谢您的分享!下载了用起来确实很方便。

但Anthony的这款分词软件效果还是没有NLPIR好,很多词分法不对,比如说:
德广伴您 成长开篇 语
而NLPIR把这个分为:
德广/nr2 ?/ww
?/ww ?/ww 伴/v 您/rr 成长/vi
开篇/n 语/ng


但就是这些个英文符号怎么去掉~
 
顶部