《语料检索的速成教程:DOS神威之FindStr.pdf》

李亮1975重庆

语料库快乐军政委
[FONT=新細明體]语料检索的[/FONT][FONT=新細明體]速成教程[/FONT]:DOS神威之FindStr.pdf

【新浪爱问的Intro】FindStr.exe小巧高速免费,不用安装,不用下载,竟然也能间接实现ConcGram和较为简单的语料检索,虽然它只能以段落为提取单位,在最新的Windows 7上也依然风采奕奕!针对1GB的txt也只要10秒不到的检索耗时,因此,具有不可忽视且不可替代的独特地位!


【教程正文的Intro】[FONT=&quot]80[/FONT][FONT=宋体]年代和[/FONT][FONT=&quot]97[/FONT][FONT=宋体]年之前,电脑上盛行[/FONT][FONT=&quot]dos[/FONT][FONT=宋体]命令;如今的电脑,普通人很少使用[/FONT][FONT=&quot]dos[/FONT][FONT=宋体]命令了。不过,即使在最新的[/FONT][FONT=&quot]Windows 7[/FONT][FONT=宋体]和[/FONT][FONT=&quot]Windows Vista[/FONT][FONT=宋体]中,[/FONT][FONT=&quot]dos[/FONT][FONT=宋体]命令依然大有用武之地。“[/FONT][FONT=&quot]FindStr[/FONT][FONT=宋体]”是[/FONT][FONT=&quot]Find String[/FONT][FONT=宋体]的缩写,就是“查找字符串”,也就是“语料检索”,虽然这个[/FONT][FONT=&quot]dos[/FONT][FONT=宋体]命令不能跟功能丰富的语料检索软件相抗衡,但它有“不可忽视甚至不可替代的[/FONT][FONT=&quot]12[/FONT][FONT=宋体]大独特优势”:[/FONT][FONT=&quot][1][/FONT][FONT=宋体]免费,[/FONT][FONT=&quot][2][/FONT][FONT=宋体]不用安装,[/FONT][FONT=&quot][3][/FONT][FONT=宋体]不用下载,[/FONT][FONT=&quot][4][/FONT][FONT=宋体]小巧,[/FONT][FONT=&quot][5][/FONT][FONT=宋体]高速,[/FONT][FONT=&quot][6][/FONT][FONT=宋体]面对超大体积的[/FONT][FONT=&quot]GB[/FONT][FONT=宋体]级的[/FONT][FONT=&quot]txt[/FONT][FONT=宋体]文件也依然高速,[/FONT][FONT=&quot][7][/FONT][FONT=宋体]支持初步的正则表达式,[/FONT][FONT=&quot][8][/FONT][FONT=宋体]支持多个搜索词的同时检索,[/FONT][FONT=&quot][9][/FONT][FONT=宋体]支持大小写区别,[/FONT][FONT=&quot][10][/FONT][FONT=宋体]以段落为提取与呈现单位,[/FONT][FONT=&quot][11][/FONT][FONT=宋体]能检索不含搜索词的自然段,[/FONT][FONT=&quot][12][/FONT][FONT=宋体]间接实现了[/FONT][FONT=&quot]ConcGram[/FONT][FONT=宋体]。……[/FONT]


采用FastStone进行抓屏,诙谐简洁,新浪爱问的在线阅读很不错!

[FONT=黑体]在线全文阅读,免积分整体下载![/FONT]

http://ishare.iask.sina.com.cn/f/33550581.html

 
“百度文库”可以在线全文阅读!

[FONT=黑体]“百度文库”可以在线全文阅读![/FONT]

http://wenku.baidu.com/view/e8782ad5...9bc642d05.html
《语器》

http://wenku.baidu.com/view/240186ff...e58fa04fa.html
《语料检索的速成教程:已经词性赋码语料的检索》

[FONT=黑体]“豆丁网”可以在线全文阅读![/FONT]​

《语器》
http://www.docin.com/p-463194312.html
http://www.docin.com/p-466643055.html

《语料检索的速成教程:DOS神威之FindStr》

http://www.docin.com/p-466643056.html

《语料检索的速成教程:已经词性赋码语料的检索》
http://www.docin.com/p-466643054.html

 
Last edited:
回复: 《语料检索的速成教程:DOS神威之FindStr.pdf》

有意思,我在用 AntConc 处理大文件的时候,确实遇到这个问题。没想到 Dos 时代的东西功能还这样强。不知道微软的 findstr 与 Unix 下面的 grep 命令效率上有何差异。
 
回复: 《语料检索的速成教程:DOS神威之FindStr.pdf》

《自己做个半自动标注器》 这篇非常好,很适合语言研究方面的标注工作。
 
回复: 《语料检索的速成教程:DOS神威之FindStr.pdf》

恩,看来有一拼啊。这个 grep.exe 和 Linux 系统里的 grep 命令效率上也类似吗?
 
回复: 《语料检索的速成教程:DOS神威之FindStr.pdf》

恩,看来有一拼啊。这个 grep.exe 和 Linux 系统里的 grep 命令效率上也类似吗?

我估计,Windows版和Linux版的grep是几乎一样的运行效率。理由一,都是单进程且单线程的;理由二,都是纯C编程;理由三,都是最简单的磁盘读写与最原始的字符串搜索;理由四,源代码与算法都完全一致。这些理由都基于相同的硬件的话,执行效率应该很相同的。如果相同硬件都不同的执行效率就说明Linux对硬件的操控竟然比Windows更优秀。当然,某个硬件配置并不能代表各种各样的硬件配置。
 
Back
顶部