我想考查两套英语教材每册的单词在每册的课文中的复现率。现在已经有了课文语料库和单词语料库。然后我把每册的单词做成一个wordlist词表,再把每册的课文作成wordlist词表,然后只需要用wordsmith里wordlist中的detailed consistency功能就可以对比这两个词表,得出单词在课文中的出现次数。
但是这存在一个问题,因为单词表中的单词全部都是原形,而课文中的单词不可能都是原形,有很多曲折变化。
所以我想到了两种方法,第一就是把课文中的所有曲折变化全部归为原形,就是lemmatization. 但是,在wordsmith中实现不了,因为wordsmith有这样一个“缺点”:当语料库中没有那个原形的词出现的时候,而只出现了它的曲折变化词的时候,wordsmith无法对这个词进行lemmatization. 比如说,如果有abandon,abandons,abandoning,abandoned,那么可以得出结果abandon出现4次。但如果只有abandons,abandoning,abandoned,而没有abandon, 那么wordsmith就把它们看成三个不同的词了。这个缺点在ANTCONC中不存在,它可以进行很好的lemmatization,但是好像ANTCONC又无法作wordlist中的detailed consistency, 所以哦我很郁闷。
然后我就想了第二种办法,就是既然我不能把课文进行削尾处理,那么我就把单词表丰富了也行啊。我就想把它丰富成各种曲折变化的形势。然后放入课文中考查复线率。但是这种方法貌似很笨。
ANTCONC中有没有对比两个词表的功能呢?就是类似于wordlist中的detailed consistency功能,有的话就太好了,但是我找不到阿。
各位学长和老师们帮帮忙,据你们所知,ANTCONC中有没有对比两个词表的功能呢?就是类似于wordlist中的detailed consistency功能,有的话就太好了,但是我找不到阿。
不知道各位C友还有没有更好的办法?我相信众人的智慧怎么也胜过我这个臭皮匠拉。
但是这存在一个问题,因为单词表中的单词全部都是原形,而课文中的单词不可能都是原形,有很多曲折变化。
所以我想到了两种方法,第一就是把课文中的所有曲折变化全部归为原形,就是lemmatization. 但是,在wordsmith中实现不了,因为wordsmith有这样一个“缺点”:当语料库中没有那个原形的词出现的时候,而只出现了它的曲折变化词的时候,wordsmith无法对这个词进行lemmatization. 比如说,如果有abandon,abandons,abandoning,abandoned,那么可以得出结果abandon出现4次。但如果只有abandons,abandoning,abandoned,而没有abandon, 那么wordsmith就把它们看成三个不同的词了。这个缺点在ANTCONC中不存在,它可以进行很好的lemmatization,但是好像ANTCONC又无法作wordlist中的detailed consistency, 所以哦我很郁闷。
然后我就想了第二种办法,就是既然我不能把课文进行削尾处理,那么我就把单词表丰富了也行啊。我就想把它丰富成各种曲折变化的形势。然后放入课文中考查复线率。但是这种方法貌似很笨。
ANTCONC中有没有对比两个词表的功能呢?就是类似于wordlist中的detailed consistency功能,有的话就太好了,但是我找不到阿。
各位学长和老师们帮帮忙,据你们所知,ANTCONC中有没有对比两个词表的功能呢?就是类似于wordlist中的detailed consistency功能,有的话就太好了,但是我找不到阿。
不知道各位C友还有没有更好的办法?我相信众人的智慧怎么也胜过我这个臭皮匠拉。