李亮1975重庆
语料库快乐军政委
【工具包下载】NLTK免安装完整版.rar
我在完整NLTK安装过程的基础上,进行了少量优化与补充之后,这个压缩包被解压缩之后就可以双击文件夹中的python.exe或“DOS here.bat”而开始你的NLTK之旅了!NLTK免安装完整版.rar让你摆脱了python的安装过程,摆脱了Numpy以及PyYAML的安装过程,摆脱了缓慢且容易出错或中断的完整数据包的下载过程,摆脱了NLTK主程序的安装过程。无论是新手或老手,都能“一键安装与运行NLTK”了,你不用安装Python或ActivePython之类了,哈哈
NLTK是神马?
全称是Natural Language ToolKit(翻译为“自然语言处理工具箱”),官方网站www.nltk.org,是基于Python编程语言而制作的开放源代码的免费软件。如果把1.5GB的60个语料库排除在外,软件及其基本数据包只有130MB。NLTK的开发团队核心成员有6人。
NLTK有哪些强大功能?
[1] 提供了文本分类的3种算法,9种词性标注算法,5种自动断词算法,内置60个语料库;
[2] 借助内置的WordNet,能查询近义词反义词之类的语义场信息,能计算近义词相似度;
[3] 提取文本中的搭配词与语块;
[4] 自建语料库,提取其词表,提取其语块,标注其词性与句法关系,分类其语篇;
[5] 支持对16种语言的自动断句,提供了对15种语言的词形还原,生成句法树;
[6] 对网页进行子链接的提取,对网页进行html标签剔除;
[7] 语料库之间的句对齐(alignment);
【英文版】20页的简明教程《NLTK - the Good, the Bad, and the Awesome》
http://www.docin.com/p-231267036.html
【英文版】272页的2010版的英文教程《Python Text Processing with NLTK 2.0 Cookbook》
http://www.docin.com/p-316846270.html (在线全文阅读)
http://ishare.iask.sina.com.cn/f/15685888.html (免积分,直接下载)
【中文翻译版】《NLTK Natural Language Processing with Python》
http://ishare.iask.sina.com.cn/f/23996193.html (免积分,直接下载)
【英文版】《基于NLTK的文本挖掘》
http://ishare.iask.sina.com.cn/f/21755976.html (免积分,直接下载)
“百度云”的下载页面(NLTK免安装完整版.rar,295MB,解压后是1.6GB,无需百度账号注册就可以下载)
http://pan.baidu.com/s/1gRy7