在语料库中,符号有没有正则表达式啊

在CQP在线语料库里面,检索的条件是按左或右第一个字排列的话,结果是包括符号,可是将这些结果下载下来,放在Word Smith 里面的话,同样的检索条件,结果是不包括符号的,比如,检索“有时候”一词, 按节点词右边第一个词排列,在CQP的Torch 在线语料库中,检索结果里面就有“有时候”与句号在一起的全部例子,也就是“有时候”一词在句末的情况。可是,在WS里面就完全根据字来排序。想知道这是为什么?是不是WS里面也有按符号排列的功能?还有,如果我要将“有时候”左右的第一位置是符号的例子都搜出来,有没有相应的通配符,或者说用什么样的正则表达式?请求各位老师百忙之余给予指导?非常感谢呵
 
回复: 在语料库中,符号有没有正则表达式啊

试试这个正则表达式 [,。《》()、—]+ 。 该正则表达式可以找到所有标点符号(中括号里可以增加符号)。你提的“有时候”的例子,可以这样查:
有时候[,。《》()、—]+
[,。《》()、—]+有时候
 
Back
顶部