[FONT=宋体]我试验了一下,下面这个办法或许可以。附件为示范文本。
[/FONT]
1. A[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]A1[FONT=宋体];[/FONT]
2. B[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]B1[FONT=宋体];[/FONT]
3. [FONT=宋体]将[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个文本载入[/FONT]AntConc[FONT=宋体],运行[/FONT]wordlist[FONT=宋体]功能,生成一个新的词频表,保存为[/FONT]txt[FONT=宋体]文本,取名为[/FONT]C1[FONT=宋体]。其中频率为[/FONT]2[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个词表中同时包含,频率为[/FONT]1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的;[/FONT]
4. [FONT=宋体]用[/FONT]Excel[FONT=宋体]打开[/FONT]C1[FONT=宋体],把频率为[/FONT]1[FONT=宋体]的词汇单独保存为一个[/FONT]txt[FONT=宋体]文本,取名为[/FONT]D1[FONT=宋体];[/FONT]
5[FONT=宋体].把[/FONT]D1[FONT=宋体]中的词汇计入[/FONT]B[FONT=宋体]词表,频数计为零既可。[/FONT]
频率为1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的?[/FONT]
频率为1[FONT=宋体]的词汇也可能为B[/FONT]1[FONT=宋体]词表中有而A[/FONT]1[FONT=宋体]词表中没有的?[/FONT]
不错,需要考虑后一种情况。
不错,需要考虑后一种情况。
楼上的思路还是有可取之处的。
假如A表= abcde
B表=bcdef
(a和f可以是N个单词)
照楼上的做法选频率为1的词,
那么C表=af (频率为1)
既然要求A表有B表无的词a (a可以是N个单词),那么把BC 2表同时载入用ANTCONC再做一次词表,那么结果为D=abcde f2 (f出现2次)。
再把BD 2表同时载入用ANTCONC再做一次词表,将有E=a1 b2 c2 d2 c2 f3, 那么出现1次的a就可以锁定了。
我觉得这个方法解决了2个词表的之间差异词汇统计的问题。当然用WST的consistency 功能也可以,用EXCEL也可以。
同理, 可以做出B有A无的词f。
厉害!上面的方法还太复杂了。简单总结一点:
2A+B(或2B+A)就可以很容易一次搞定。
e.g. 2A+B=a2 +b3+c3+d3+e3+f1
出现2次的为A独有 (a2)。
出现1次的为B独有 (f1)。
出现3次的为AB共有 (b3 c3 d3 e3 )。
希望对大家有帮助。
上面的方法还太复杂了。简单总结一点:
2A+B(或2B+A)就可以很容易一次搞定。
e.g. 2A+B=a2 +b3+c3+d3+e3+f1
出现2次的为A独有 (a2)。
出现1次的为B独有 (f1)。
出现3次的为AB共有 (b3 c3 d3 e3 )。
希望对大家有帮助。