在CLEC 语料库中怎样检索同题,九分以上作文呢?

回复:在CLEC 语料库中怎样检索同题,九分以上作文呢?

介绍一个简单的办法,不过需要用到 EditPlus, 可以到 http://www.editplus.com/ 下载这个多功能编辑器。下面是搜索方法:

1、 打开 EditPlus,敲 View, 选择 Output Window, 这样就得到图一:
2005102309530433.jpg


2、敲 Search 下的 Find in Files, 在弹出来的窗口里填入要搜索的信息,如图二:
2005102309571775.jpg


其中第一个框中填入要搜寻的关键词,也可以是通则表达式;第二栏填入文件类型;第三栏填入所要搜寻的文件夹;之下是一些选项,根据情况选用。

3、敲 Find 后就得到搜寻结果,显示在 Output Window 里。可以看到 <SCORE 9> 在CLEC中有698 例, 也可以看到同题作文也基本上排列在一起了。若还不是很理想,可以把结果稍加整理,具体见下面。
2005102310054997.jpg


4、若想要存下搜索结果,鼠标右键敲 Output Window 中的任意一行,选择 Copy All, 然后就可以复制到一个新文档里了。把新的文档稍加整理后,就可以用 Excel 打开,把 作文Title 放在一栏里,Sort 一下就可以了。

5、若想要查看原文,鼠标双击搜索结果中的任何一行就会打开原文,光标跳动的地方就是关键词所在的位置。

6、同理可以得到其它分数的作文。


注意:由于CLEC不是一篇作文一份文档,使用起来不是很方便,可以考虑把它分拆成一片作文一个文档,统一编号,对应查找搜索结果也容易些。
 
以<score 9为检索词,用corcordance工具检索,就可以将每一篇置于corcordance line中。问题是每次只能看其中一篇的全文,即双击对应的一行。
 
Back
顶部