[1] 正则式只是一种模糊匹配表达式,被动语态的匹配必然涉及到词类标签与句法标签,而且句法标签与词类标签全世界有好几套且差异较大;我是语料库的初学者,想请教各位大咖英语被动语态的正则表达式的写法。想法是把被动语态的表达式进行在线语料库搜素,提取出所有的英语被动语态的句子。还有一个疑问,汉语的“带有形式标记的被动语态”也能否用正则表达式写出来。同时,能否推荐正则表达式写法的教程。谢谢
感谢李老师您的热心回复,我先学习这个正则式,有问题的话再要向您请教[1] 正则式只是一种模糊匹配表达式,被动语态的匹配必然涉及到词类标签与句法标签,而且句法标签与词类标签全世界有好几套且差异较大;
[2] 在线版语料库往往为了响应速度,并不支持最齐全的正则式符号范围,往往采用了某些特殊的表达模糊的符号,需要具体问题具体分析;
[3] 英语被动语态的形式化表达极为复杂,因为被动语态有多种引导词、被动语态有可能没有引导词、被动语态有by有with这两个标志词但缺少这两个标志词也依然可能是被动语态;
[4] 无论中英文的被动语态,正则式到底试图提取句子还是局部短语,这个抉择也严重影响正则式的复杂度;
[5] 正则式并不复杂,完全可以自学;
[6] 如果学不会或没掌握正则式,就算是用正则式或其他手段提取出来了所需的“大量语料”,自己也没法针对这些大量语料而进行后续的较好的量化研究。
我微信号liliang_1975,欢迎加友,可帮你继续寻找“折中方案”。