现在分词的词性赋码是 <VDG>,动名词的才是 <VVG>!
建议你使用正则表达式,先对附码文件进行搜索,找出所有以ing结尾的动词(表达式\w+ing/VBG,CLAWS应该是\w+ing/(VBG|VVG|VDG)),然后使用表达式(a)找出be+-ing和介词+-ing的表达(当然,be动词有很多种形式,在这些形式和-ing之间还会有否定词和其他副词或结构,比如:not,n't等 ),最后运用正则表达式的取非符号^,剔除表达式(a)所包含的结构,得出你想要的结果。我用的是Gotagger附码器,对CLEC的小语料分析了下,效果还算差强人意。弄不到CLAWS,没办法。个人建议,仅供参考。我想用AntConc检索SwECLL里的非限定动词:现在分词。我首先检索VVG(即现在分词),出现的是所有含-ing的动词。接下来我想剔除作为限定动词(即be+-ing动词)和介词+-ing动词,请问(除了手工外)怎样还能在第一次基础上剔除这两项呢?谢谢!!
CLAWS应该是\w+ing/(VBG|VVG|VDG)),然后使用表达式(a)找出be+-ing和介词+-ing的表达(当然,be动词有很多种形式,在这些形式和-ing之间还会有否定词和其他副词或结构,比如:not,n't等 ),最后运用正则表达式的取非符号^,剔除表达式(a)所包含的结构,得出你想要的结果。我用的是Gotagger附码器,对CLEC的小语料分析了下,效果还算差强人意。弄不到CLAWS,没办法。个人建议,仅供参考。
首先,一般在检索的之前就可以制定一个“切实可行”的search string,不要先粗略检索,然后再筛选。当然不同的研究目的,可能做的时候需要那样。我有如下建议:
1。在检索库之前要先搞清楚,研究的库是用哪个tagset赋的。比如 c5 or c7。不同的tagset,各个词汇的码会有不同。
2。既然检索软件可以检索文本,你在把第一次结果保存为文本后,当然可以进行再检索。
SWECCL用的是CLAWS4,有个疑问:我把第一次检索结果用save output to files保存起来,出现一个antconc_results.txt文件,但当对这个文件进行检索时VVG的数量要比第一次检索的数量还多近倍(检索项都是VVG),是不是不能这样保存再检索? 谢谢。
能不能麻烦您指导一下如何保存再检索?或者如何把第一次检索结果设计成一个次语料库再进行二次检索?谢谢了。
这个问题已经在这里讨论过几次了。简单说来,假如某一行文字中有三个VVG:......VVG1......VVG2......VVG3......, 当你做VVG的Concordances时,这三个VVG会分别得到一个concordance 行,通常显示是如下的,红色部分就是concordances的headword:
......VVG1......VVG2......VVG3......
......VVG1......VVG2......VVG3......
......VVG1......VVG2......VVG3......
当你把这个结果存成文本文件,再去做VVG的concrodances,这时候上面每行中的三个VVG都会分别成为headword,从而一起得到9个concordance行。