求助colligator2.0正则表达式一问题,想同时检索is和are,N\S+ VBZ|VBR 好像不可以

wendycao

初级会员
请教一下colligator2.0里,如果表示“或者”关系,用“|"符号为什么不对呢?

例如,名词+be,想同时检索is和are,N\S+ VBZ|VBR 好像不可以,问题出在哪呢?
 
回复: 求助colligator2.0正则表达式一问题

为避免误导,原帖已删除


试试N\S+ VB[ZR]
 
回复: 求助colligator2.0正则表达式一问题,想同时检索is和are,N\S+ VBZ|VBR 好像不可以

许老师,非常感谢您的答复。可是为什么我的电脑里两个表达式检索到的结果跟您的都不一样呢?我把左右边界设为0,也就是只检索"N+be",然后count。

N\S+ VBR|VBZ(名词没有问题,但只得到|前面的VBR)
1. 2334 NN2 VBR
2. 718 NN1 VBR
3. 125 NN VBR
4. 100 NP1 VBR
5. 11 NNT1 VBR
6. 9 NNU VBR
7. 9 NNT2 VBR
8. 8 NP2 VBR
9. 4 NPM1 VBR
10. 4 NNU2 VBR
11. 1 ND1 VBR

N\S+ VBZ|N\S+ VBR(主要是|前面的VBZ,后面的VBR数据不对)

1. 4011 NN1 VBZ
2. 609 NN2 VBZ
3. 213 NP1 VBZ
4. 44 NN VBZ
5. 26 NN2 VBR
6. 26 NNT1 VBZ
7. 22 NNU VBZ
8. 13 NNL1 VBZ
9. 12 NP2 VBZ
10. 10 NP1 VBR
11. 7 NN1 VBR
12. 6 NNT2 VBZ
13. 2 NPM1 VBZ
14. 1 ZZ1 VBR
15. 1 PN VBR
16. 1 FO VBR
17. 1 NNA VBZ
18. 1 NNB VBZ
19. 1 NNU2 VBZ
20. 1 ND1 VBZ


如果把VBR和VBZ倒过来,
N\S+ VBR|N\S+ VBZ(则主要是VBR,VBZ数据不对)
1. 2334 NN2 VBR
2. 718 NN1 VBR
3. 125 NN VBR
4. 100 NP1 VBR
5. 55 NN1 VBZ
6. 24 ZZ1 VBZ
7. 11 NP1 VBZ
8. 11 NNT1 VBR
9. 9 NNT2 VBR
10. 9 NNU VBR
11. 9 NN2 VBZ
12. 8 NP2 VBR
13. 4 FO VBZ
14. 4 NPM1 VBR
15. 4 NNU2 VBR
16. 4 JJ VBZ
17. 2 VVG VBZ
18. 2 PN VBZ
19. 2 AT VBZ
20. 1 UH VBZ
21. 1 ND1 VBR
22. 1 MC VBZ
23. 1 II VBZ

扩展语境,结果也是一样的,搞不懂为什么
 
回复: 求助colligator2.0正则表达式一问题,想同时检索is和are,N\S+ VBZ|VBR 好像不可以

你贴一个截图上来吧。

这个|在用于前后有空格的表达式时,可能是有问题的。

为避开这个问题,可以试试N\S+ VB[ZR],是等效的。

可能还是所用的regex引擎的问题。
 
回复: 求助colligator2.0正则表达式一问题,想同时检索is和are,N\S+ VBZ|VBR 好像不可以

也可以试一试这个(N\S+ VBZ)|(N\S+ VBR)
N\S+ VBR|N\S+ VBZ 这个表达式是有歧义的
N\S+ VBR|VBZ同样有歧义
为了避免歧义可以使用()或[]
 
回复: 求助colligator2.0正则表达式一问题,想同时检索is和are,N\S+ VBZ|VBR 好像不可以

谢谢两位老师的指点。试过了,N\S+ VB[ZR]好用。(N\S+ VBZ)|(N\S+ VBR)在我这里还是不对,和没有()的结果一样。正合适N\S+ VB[ZR]如果用于长一些的表达式里会更省事些。

两位老师研发了这么有用的工具,无偿与我们分享,在这里一并谢过了!
 
请教:正则表达式

用PatCount分析用CLAWS赋码过的文本中的non-finite adverbial clauses (包括infinitival,present participal and past participal),请问正则表达式是什么? 谢谢!:confused:
 
Back
顶部