【求助】求教一个合并词表的问题

向计算机达人们紧急求助呀:有A、B两词表,包含频数等信息,A词表较全,现在想把A表中有但B表中没有的单词都记入B词表中,把它们的频数记为零,请问该用用什么软件如何操作呢?:confused:
 
回复: 【求助】求教一个合并词表的问题

这个可以把两列词表都导入excel,然后用Vlookup函数找出相同的部分,再筛选出A列中不含这些词的其余部分,单独列成一列,频数全部记作0就可以了,具体公式不记得了,你可以看看excel的帮助文件,不难的。
或者笨一点的办法,两列数据都按字母排序,然后对照着人工筛选出A列有而B列没有的,单独列出,这个就累一点,如果词表不是太长的话,也可以用这个方法。
 
回复: 【求助】求教一个合并词表的问题

[FONT=宋体]我试验了一下,下面这个办法或许可以。附件为示范文本。
[/FONT]
1. A[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]A1[FONT=宋体];[/FONT]
2. B[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]B1[FONT=宋体];[/FONT]
3. [FONT=宋体]将[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个文本载入[/FONT]AntConc[FONT=宋体],运行[/FONT]wordlist[FONT=宋体]功能,生成一个新的词频表,保存为[/FONT]txt[FONT=宋体]文本,取名为[/FONT]C1[FONT=宋体]。其中频率为[/FONT]2[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个词表中同时包含,频率为[/FONT]1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的;[/FONT]
4. [FONT=宋体]用[/FONT]Excel[FONT=宋体]打开[/FONT]C1[FONT=宋体],把频率为[/FONT]1[FONT=宋体]的词汇单独保存为一个[/FONT]txt[FONT=宋体]文本,取名为[/FONT]D1[FONT=宋体];[/FONT]
5[FONT=宋体].把[/FONT]D1[FONT=宋体]中的词汇计入[/FONT]B[FONT=宋体]词表,频数计为零既可。[/FONT]
 

附件

  • 示范文本.rar
    12.9 KB · 浏览: 17
回复: 【求助】求教一个合并词表的问题

[FONT=宋体]我试验了一下,下面这个办法或许可以。附件为示范文本。
[/FONT]
1. A[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]A1[FONT=宋体];[/FONT]
2. B[FONT=宋体]词表保存为[/FONT]txt[FONT=宋体]文本,取名[/FONT]B1[FONT=宋体];[/FONT]
3. [FONT=宋体]将[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个文本载入[/FONT]AntConc[FONT=宋体],运行[/FONT]wordlist[FONT=宋体]功能,生成一个新的词频表,保存为[/FONT]txt[FONT=宋体]文本,取名为[/FONT]C1[FONT=宋体]。其中频率为[/FONT]2[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]、[/FONT]B1[FONT=宋体]两个词表中同时包含,频率为[/FONT]1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的;[/FONT]
4. [FONT=宋体]用[/FONT]Excel[FONT=宋体]打开[/FONT]C1[FONT=宋体],把频率为[/FONT]1[FONT=宋体]的词汇单独保存为一个[/FONT]txt[FONT=宋体]文本,取名为[/FONT]D1[FONT=宋体];[/FONT]
5[FONT=宋体].把[/FONT]D1[FONT=宋体]中的词汇计入[/FONT]B[FONT=宋体]词表,频数计为零既可。[/FONT]


频率为1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的?[/FONT]
[FONT=宋体][/FONT]
频率为1[FONT=宋体]的词汇也可能为B[/FONT]1[FONT=宋体]词表中有而A[/FONT]1[FONT=宋体]词表中没有的?[/FONT]
 
回复: 【求助】求教一个合并词表的问题

频率为1[FONT=宋体]的词汇为[/FONT]A1[FONT=宋体]词表中有而[/FONT]B1[FONT=宋体]词表中没有的?[/FONT]

频率为1[FONT=宋体]的词汇也可能为B[/FONT]1[FONT=宋体]词表中有而A[/FONT]1[FONT=宋体]词表中没有的?[/FONT]

不错,需要考虑后一种情况。
 
回复: 【求助】求教一个合并词表的问题

不错,需要考虑后一种情况。


楼上的思路还是有可取之处的。
假如A表= abcde
B表=bcdef
(a和f可以是N个单词)
照楼上的做法选频率为1的词,
那么C表=af (频率为1)
既然要求A表有B表无的词a (a可以是N个单词),那么把BC 2表同时载入用ANTCONC再做一次词表,那么结果为D=abcde f2 (f出现2次)。
再把BD 2表同时载入用ANTCONC再做一次词表,将有E=a1 b2 c2 d2 c2 f3, 那么出现1次的a就可以锁定了。

我觉得这个方法解决了2个词表的之间差异词汇统计的问题。当然用WST的consistency 功能也可以,用EXCEL也可以。

同理, 可以做出B有A无的词f。
 
回复: 【求助】求教一个合并词表的问题

不错,需要考虑后一种情况。

其实,您提到的这个问题当时我是考虑过的,要想解决这个问题并不难。接着我的那个步骤:
1. 把C1中频率为2的词汇也保存为一个txt文本,取名为E1;
2. 用AntConc载入A1、E1,运行Wordlist功能,生成的词汇表中,频率为1的词汇即为A1中有而B1中没有的;(同理,AntConc载入B1、E1,生成的词汇表中,频率为1的词汇即为B1中有而A1中没有的;)
这样就能解决问题了。
 
回复: 【求助】求教一个合并词表的问题

楼上的思路还是有可取之处的。
假如A表= abcde
B表=bcdef
(a和f可以是N个单词)
照楼上的做法选频率为1的词,
那么C表=af (频率为1)
既然要求A表有B表无的词a (a可以是N个单词),那么把BC 2表同时载入用ANTCONC再做一次词表,那么结果为D=abcde f2 (f出现2次)。
再把BD 2表同时载入用ANTCONC再做一次词表,将有E=a1 b2 c2 d2 c2 f3, 那么出现1次的a就可以锁定了。

我觉得这个方法解决了2个词表的之间差异词汇统计的问题。当然用WST的consistency 功能也可以,用EXCEL也可以。

同理, 可以做出B有A无的词f。


上面的方法还太复杂了。简单总结一点:

2A+B(或2B+A)就可以很容易一次搞定。

e.g. 2A+B=a2 +b3+c3+d3+e3+f1

出现2次的为A独有 (a2)。
出现1次的为B独有 (f1)。
出现3次的为AB共有 (b3 c3 d3 e3 )。

希望对大家有帮助。
 
回复: 【求助】求教一个合并词表的问题

上面的方法还太复杂了。简单总结一点:

2A+B(或2B+A)就可以很容易一次搞定。

e.g. 2A+B=a2 +b3+c3+d3+e3+f1

出现2次的为A独有 (a2)。
出现1次的为B独有 (f1)。
出现3次的为AB共有 (b3 c3 d3 e3 )。

希望对大家有帮助。
厉害!
 
回复: 【求助】求教一个合并词表的问题

上面的方法还太复杂了。简单总结一点:

2A+B(或2B+A)就可以很容易一次搞定。

e.g. 2A+B=a2 +b3+c3+d3+e3+f1

出现2次的为A独有 (a2)。
出现1次的为B独有 (f1)。
出现3次的为AB共有 (b3 c3 d3 e3 )。

希望对大家有帮助。

seanxpq的办法非常好。
 
Back
顶部