回复: 请问有话语标记语的自动标记软件么
谢谢许博士,我在论坛上看到了您对Concordancer的介绍,但是我还是有些困惑,如果要对英语话语标记语进行检索,用什么软件最合适呢? 还有定性分析一般包括那些方面的内容呢?为什么定性分析要在定量分析之前呢?期待您的答复!谢谢!
所谓Concordancer(常译为索引软件)
Concordancer的主要功能包括KWIC(Key Word In Context)索引、搭配统计、排序、词簇统计、词表统计、功能比较强的还包括其他一些功能,包括类符(type)频数、形符(token)频数、类/形比(type/token ratio)、平均词长(mean length of words)、平均句长(mean length of sentences)等。
绝大部分的Concordancer只支持纯文本的(ASCII)编码格式文件。
现在国内外用的最多的Concordancer要算WordSmith。最专业精致的要算TACT2.1,为加拿大多伦多大学开发的,但该软件是DOS版的,处理语料量有限。
目前可以处理汉语Concordancer有R. J. C. Watt的concordance, MLCT, ConCapp, ParaConc, WordSmith 4等),但是对编码有要求,比如需要UTF-8编码。