回复: BFSU ParaConc 1.2.1 检索出现问题
将底层的正则检索改成了Unicode模式,解决了汉字检索的问题。原来的问题解释如下:
假如一个句子的编码如下: AA BB CC DD,现在检索“CC”如果按Unicode检索不会有问题,按ANSI检索也不会有问题。但是如果检索“AB”时,按ANSI就会出问题,第一个字的一半和第二字的另一半编码,碰巧合唱了AB,即:A[A B]B CC DD,其实这个句子中根本不含AB这个字。这就是为什么检索出来一些不含“说”字的句子的原因,现在已经修复了。