基于treetagger在线版的词类标注器与屈折还原器 20140531

李亮1975重庆

语料库快乐军政委
基于treetagger在线版的词类标注器20140531.zip
基于treetagger在线版的屈折还原器20140531.zip
这两款软件都是我开发分享给大家的,特点是小巧快速,都是借助在线的treetagger的官方网站,代替了人工的拷贝和调整格式。
Treetagger在线版 http://web4u.setsunan.ac.jp/Website/TreeOnline.htm

【功能特色】(1)支持对文件夹和多层的所有子文件夹进行自动处理,(2)支持对数百兆或GB级的文本文件的自动处理,因为本软件采用了“小容量分批发送”技术,所以克服了在线版treetagger一次性只能接收1MB体积以下的文本量的局限性;(3)只对当前程序所在文件夹的target文件夹进行操作,要求操作者被语料的复制件拷贝到target文件夹,所以避免了对唯一原始语料的潜在破坏,具有高度安全性!(4)克服了NLTK词形还原无法对形容词和副词的比较级和最高级进行还原的缺陷,因此能把greater还原为great,能把greatest还原为great。

【使用指南】
本软件对当前位置的target文件夹进行操作
请手工新建target文件夹且拷入语料文件
本软件对target文件夹的语料直接操作
因此,请在target文件夹之外做好备份
本软件运行时必须保持网络畅通

【下载地址】在我百度网盘的共享页面
http://pan.baidu.com/share/home?uk=724520607&view=share#category/type=0
 
Back
顶部