几乎唯一亮点是通配符而不是正则表达式,最突出缺点是没有宏
快速浏览了它的整个帮助,本人觉得,与UltraEdit这样的大鳄相比,就多语种语料库建设的预处理需求而言,它的绝大部分功能并不突出(例如,删除重复行呀,删除空行呀,删除行首或行尾的空格呀),因为在其他类似的文本编辑软件中也能找到(例如,Office Word就具有“简体繁体中文之间的转换”),这款软件的几乎全部功能用法套路都是“替换”,在“自定义替换表”中,用“正则表达式”和“通配符”来实现批量文本处理。
这款软件的能够处理的多个语种,就是“英日俄汉”这四大语种的文字,尚没有对“德语或法语或韩语”的字母处理的通配符。
最令人欣喜和最令人侧目的事情,就是这款软件让我们意识到“原来通配符也可以大大减轻正则表达式的构造难度,从而大大减轻非计算机背景的语言工作者的负担”呢!这是为广大用户着想的“创新点,闪光点”,大赞!但愿,AntConc和WordSmith Tools的开发者也能从这里吸取滋养,为广大的corpus disciples带来异曲同工的“用户友好性”。
不过,它的配套帮助的5.2节(整个帮助的最后一个节)的标题竟然出现一个严重的小疏漏,此处的标题“应用举例(二)”,应该是“应用举例(三)”才对呀,因为之前的5和5.1已经有了“应用举例(一)”和“应用举例(二)”了呀。
瑕不掩瑜,这款软件可以暂且视为一款有些个性且有些创新的语料预处理工具。然而,开发者的兴趣在于“弘扬佛教和佛法经典”,因此侧重繁体中文和某些语种,因此应用举例也是佛学词典的处理问题,因此其设计初衷并非语料库语言学或西欧文字,因此对于新手而言,用一用,不至于像UltraEdit的菜单那么令人生畏地“丰富”……阿弥陀佛,善哉善哉!