请教,急!自建语料库中重复出现的搭配类型如何处理

诚心求教。在写毕业论文,要研究动+名词搭配错误,语料整理时碰到问题。自建语料库选取了20篇文章,附码检索后,有重复出现的搭配。应该如何处理,是把一篇中重复出现的搭配归为一类,去掉各篇内的重复搭配,保证每篇中没有重复的,如pay attention to , pay much attention to,还是把20篇中所有的该类归为一个,去掉其他重复的,保证整个库中没有重复出现的?还是不去掉重复的?希望能尽快得到各位高人的指导,谢谢。
 
Back
顶部