回复: 正则表达式讨论
It + 系动词+ adj的正则表达式可以这样写,如下:
(?i)((?=[^.\n]*\w{1,}_PPH1 (?i:is|'s|was|seems|seemed|appears|appeared|looks|looked|tastes|tasted|smells|smelled|sounds|sounded|feels|felt|keeps|kept|gets|got|turns|turned|grows|grew|stays|stayed|remains|remained|resembles|resembled|becomes|became)_V\w{1,} \w{1,}_J\w{1,})[^.\n]+\.?)
这个表达式是用于提取完整的It + 系动词+ adj的句子的,在南燕飞(程南昌)的CN_Regex软件中测试成功,但是提取时间可能稍长点。
如果是要提取 系动词+ adj的结构的句子可能就比这个复杂些,而且提取的时间更长,也是采用CN_Regex,提取的时候软件显示未响应,其实是在工作中,需要的时间非常长,需要耐心等待。
系动词+ adj的正则表达式
(?i)((?=[^.\n]*(?i:am|is|are|r|be|being|'s|'re|'m|was|were|been|s|ai|m|art|ar|wase|seem|seems|seemed|seeming|appear|appears|appeared|look|looks|looked|taste|tastes|tasted|smell|smells|smelled|sound|sounds|sounded|feel|feels|felt|keep|keeps|kept|get|gets|got|turn|turns|turned|grow|grows|grew|stay|stays|stayed|remain|remains|remained|resemble|resembles|resembled|resembling|become|becomes|became|becoming)_V\w{1,} \w{1,}_J\w{1,})[^.\n]+\.?)
说明一下:这个表达式中含有几个古英语用词,不要感觉奇怪。
CN_Regex没有对正则表达式长度进行限制,对于并列特别多的这种表达式需要等的时间较长。上面的表达式中的系动词涵盖了绝大多数系动词,还有少量的没有包含在内,对于没有包含在内的可以根据自己需要进行添加。