薛学彦:文本检索软件简介 语料库的通用检索技术

其实Michael Barlow教授的软件MonoConc Pro就支持正则表达式 (Regular Exression) 的检索.
个人认为检索软件是否支持正则表达式是一个属于软件本身的问题,和语料库采用的何种赋码标准好像关系不大;文中末尾结论部分提到的外语教学上的应用在文中也并没有探讨。
 
是的,好多软件支持正则表达式 (Regular Exression) 的检索,Michael Barlow教授的系列软件,如MonoConc Pro,Collocate,ParaConc都支持正则表达式,另外MCLT,PhraseContext,Concordance等等也支持Regular Exression.
所不同的是它们所支持的正则表达式在具体实施上(式中符号的规定)有的区别.
生语料库经过附码后只是可提取的信息量增大,和语料库采用的何种赋码标准好像关系不大.当然赋码的粒度越细,信息量就越多.
 
回复: 薛学彦:文本检索软件简介 语料库的通用检索技术

attached
 

附件

  • 文本检索软件简介_薛学彦.pdf
    465.8 KB · 浏览: 212
回复: 薛学彦:文本检索软件简介 语料库的通用检索技术

Regular Expression确实强悍,在自建语料库的预处理过程以及语料库复杂检索中几乎不可避免的要和它打交道,相信最后大家都会为它着迷(或抓狂?:))。
 
Last edited:
Back
顶部