回复: 问题:如何在wordsmith中计算MI
感谢armstrong! 《语料库应用研究》中,濮建忠的《对比中间语分析的主要统计方法》(119-123)一文,详细论述了MI的计算方法。具体内容如下:
在W\ordsmith中,计算MI值需要使用索引文件,即index文件,该
文件包括三个独立又相互联系的文件,即wdx文件,含有设置信息及文件数据;xfo文件,含有每个此的文件顺序和位置,并允许计算互信息值;xal文件,含有所有词的位置信息,用于快速索引(Scott, 2003)。
计算步骤:
1. 设置索引文件和互信息值的各种参数
在主控程序(wordsmith tools controller)中,打开settings/adjust settings/indexing, 设置有关索引文件和互信息值的各种参数。在file-name中,要先输入索引文件的名字(必须自己提供),并输入正确的路径及文件后缀名(.wdx) (后缀名是必须的)。选择Activated, File Order too及Log base 2等复选框,选择Save, 单击OK。
2. 生成索引文件
打开Wordlist子程序,选择文件,生成词表。然后选择Wordlist子程序菜单中Index/New Index, 生成索引文件,生成过程要经过三个阶段(参见Wsmith帮助文件)。
3. 计算MI值
关闭Wordlist子程序及词表。重新从主程序打开Wordlist子程序,选择Index/Alphabetical list,选择自己开始时输入的带wdx后缀的文件名,打开此文件。单击“Compute Mutual Information”图标 ,经过一段时间处理之后(比较缓慢),就可以看到结果。
卫乃兴。 《语料库应用研究》。 上海:上海外语教育出版社, 2005。