推荐第三代智能分词系统3GWS - This is a commerical product

fajava

初级会员
推荐第三代智能分词系统3GWS(the 3rd Generation Word Segmenter)。据说是ICTCLAS3.0的商用升级版本。提供Linux/Windows下的API,可以在线测试并试用API。还有技术专区,有不少专业文献。参见:
http://www.fajava.cn/products_01.asp


(Note: title is edited by this moderator.

[本贴已被 动态语法 于 2006年06月20日 01时22分28秒 编辑过]
 
The link is live. Pls make sure you do not include a redundant space after ....asp.
http://www.fajava.cn/products_01.asp
 
用3gws每次可以比ictclas处理的字数多一些。以前分词时把人名分为姓和名两个词。现在的3gws将其分为一个词,如‘邓小平’。
 
Windows试用版只能处理有限长度/大小的文本(提示说不能超过1KB,试验了个25KB的文本也处理了)。批处理是不可能的任务。分词/标注结果文件搞成HTML的,花里胡哨,吸引眼球,真要用在语料库构建上就不实用了。API 的 dll 试用还必须注册激活,即使激活了也只能用一个月;付费的注册版也要每年更新注册一次。一句话,太麻烦了。
 
回复:推荐第三代智能分词系统3GWS

Makes one wonder if there is a correlation between the appearance of this commercial product and the disappearance of the free ICTCLAS.
 
Back
顶部