WordSmith 3其实可以处理中文

回复: 回复:WordSmith 3其实可以处理中文

The tokenized result from Segtag or ICTCLAS should be resaved as GB format before you make concordances with WS3. However, you need resave the files as Unicode (not UTF-7 or UTF-8) to make concordances and wordlist with WS4.

您真是太棒了,师父!我的文本分字了,WS5检索出来仍是乱七八糟一大堆。

乱麻一团的疑惑,让您轻轻一句话就解决了。:)
 
回复: WordSmith 3其实可以处理中文

我的操作系统是中文的,在对文本进行分格之后,为什么用wordsmith 搜出来的结果还是乱码呢?
 
回复: WordSmith 3其实可以处理中文

刚看到楼上的留言,呵呵...试了一下,问题真的解决了!Thanks a lot!
 
回复: WordSmith 3其实可以处理中文

不能。语料库检索软件一般都是存文本格式 (.txt)。你可以考虑把 Word 文档批量转换为 Text 然后再进行检索。
 
回复: WordSmith 3其实可以处理中文

请教各位老师,为什么我的文本分过词了,也存成UNICODE格式了,用wordsmith tools 做wordlist, 做出来还是乱码呢?
 
Back
顶部