WordSmith 4可以,WordSmith 3不可以。
但要经过预处理,即将文本转换成unicode。方法是:
a) Multilingual Corpus Tool by Scott Piao, 成批转换
http://www.lancs.ac.uk/staff/piaosl/research/download/download.htm
b) WordSmith Tools 4, GB/BIG5 -> UNICODE (UTF-16) 成批转换
c) 南极星NJ Star 文本转换器, 单个转换
http://www.njstar.com
d) b) Chinese Annotation Tool可在线处理简体汉语文本, 单个转换
http://www-rohan.sdsu.edu/~chinese/annotate.html
Perl 版本:http://www.mandarintools.com/segmenter.html
e) MS Word/Notepad, 单个转换