关于整理AntConc可分析文本格式的问题

我爬取了一些微博的posting得到了.xlsx文档,复制入MS Word仅粘贴文本,然后复制入记事本并保存为UTF-8格式。
导入AntConc ver.4.1.2,在File下能正常显示,但是所有针对汉字的搜索都显示No hits found。
这种情况请问该如何处理?我准备先使用处理软件进行分词,但论坛常见问题集锦推荐的网址都已无法打开,正在尝试使用PowerGREP
 
这个工具是山东农业大学葛晓帅老师开发的界面,底层是清华大学的分词工具。葛老师这个界面很友好。
需要安装Java运行环境。
 
这个工具是山东农业大学葛晓帅老师开发的界面,底层是清华大学的分词工具。葛老师这个界面很友好。
需要安装Java运行环境。
另,请问我需要cite这个工具的情况下是只cite THULAC还是需要同时cite葛老师的相关文章?
 
Back
顶部