求助:watch ... do和watch ... doing 的正则表达式

求助:本人收集了VOA慢速英语的语料,有raw版本和Treetagger附码两种版本,想通过antconc利用正则表达式检索出watch ... do和watch ... doing的KWIC, 请问各位专家这两个正则表示式如何编写?再考虑watch的各种屈折形式的话,又怎么编写?
 
回复: 求助:watch ... do和watch ... doing 的正则表达式

你是想要检索 "watch + 名词/代词 + do/doing" 吧? 用生语料库检索的话, 结果中可能会有一些不是你想要的, 例如可能会包括 watch without intervening 这种结构。

用附码语料库就好办一些, 想要搜索 "watch (包含其各种形式) + 名词/代词 + doing", 我知道的有两种方法:

1. 在 Words 状态下检索:
watch*_V* *_P* *_V?G (watch 后是代词)
watch*_V*@@*_N* *_V?G (watch 后是名词, 名词前可有两个任意修饰词)
或者把两者合在一起, watch*_V* *_P* *_V?G|watch*_V*@@*_N* *_V?G

(: 用这种方法时, 主要事先要在 AntConc 的 Globe Setting 设置一下 Token[Word] Definition, 要选中 Punctuation 和 Number 复选框。)

2. 在 Regex (也即是正则表达式) 状态下搜索:
watch\w*_V\w+\s(\S+\s){0,2}\w+_[PN]\w+\s\w+_V\wG (watch 后是名词或代词, 名词前可有两个任意修饰词)

搜 "watch 名词/代词 do" 时把上面表达式中最后一个字符 G 换成 I 即可。


求助:本人收集了VOA慢速英语的语料,有raw版本和Treetagger附码两种版本,想通过antconc利用正则表达式检索出watch ... do和watch ... doing的KWIC, 请问各位专家这两个正则表示式如何编写?再考虑watch的各种屈折形式的话,又怎么编写?
 
Last edited:
回复: 求助:watch ... do和watch ... doing 的正则表达式

非常感谢dingguoqi的快速回复!另外,请问前辈:这是您根据经验写出来的,还是有软件协助?可否告知学习正则表达式的方法、策略?
 
回复: 求助:watch ... do和watch ... doing 的正则表达式

别叫前辈, 我也是不久前才学会的。第一种表达式是从 AntConc 的作者 Anthony 前不久发给我的一个式子中学来的, 第二个式子的编写方法是从暑期培训三位老师编的《语料库应用教程》中学的。我的感觉是:
首先知道基本的符号代表的意义, 然后自己不断揣摩尝试, 很快就会编写了。
刚开始可以看看书, 对书上的例子进行修改, 查找自己需要的东西。
不过也可以使用 Patternbuilder 这样的工具来帮忙, 可以省很多事。

非常感谢dingguoqi的快速回复!另外,请问前辈:这是您根据经验写出来的,还是有软件协助?可否告知学习正则表达式的方法、策略?
 
回复: 求助:watch ... do和watch ... doing 的正则表达式

万分感谢,无以言表!您参加的是不是今年暑假的那一期?我也参加了,日后是否可以继续与您保持联系,向您学习。我的邮箱transtime@126.com
 
回复: 求助:watch ... do和watch ... doing 的正则表达式

丁老师,您好!刚给您发的邮件,方便的您查收一下。
 
Back
顶部