NLPIR(ICATLAS2014) Python 3.3 调用多文件分词处理

1. 准备条件:
1) 你需要安装python 3.0 以上版本;
2)你需要下载python-NLPIR 封装包,并修改相关文件参数,具体参见 (http://www.52ml.net/14450.html);
3)将附件中我修改的CALLAPI.txt 改名为CALLAPI.py放入你修改好的封装包根目录之中;
4)利用文本编辑器修改CALLAPI.py 中我的文件路径(path="'语句)成你的语料所在路径;
5)运行该项文件,其将在语料所在目录生成热原始文件名+result.txt格式的结果文件。

2. 注意事项:
1)不适用Mac OS,我已经在我的Mac 上试过了,可能是因为封装包或python原因,改成64位也不行;
2) 语料处理前建议清洁一下,最好采用UTF-8编码;
3 程序只是出于处于多文件目的稍作修改,非常简陋,欢迎使用交流!
 

附件

  • result.jpg
    result.jpg
    72.4 KB · 浏览: 2
  • CALLAPI.txt
    1.1 KB · 浏览: 7
回复: NLPIR(ICATLAS2014) Python 3.3 调用多文件分词处理

Mac 底下是内核不支持吗?以前好像就是这样。
 
Back
顶部