[原创]中文语料库检索的福音

hancunxin

Moderator
非常感谢许博士的提示,我发现了中文检索的方法。步骤一,先去www.ict.ac.cn/freeware/ 免费下载ICTCLAS(汉语文本词性标注标记工具); 步骤二,用ICTCLAS将中文语料库处理以下,变成带 -cla后缀的TXT文件;步骤三, 使用CLEC的语料库检索软件检索即可。
 
对,就是那个带 -cla的文本文件。这样分词处理之后,用其他检索软件(concordancer)就都可以了。
2005070521395995.jpg



[本贴已被 作者 于 2005年07月05日 21时40分25秒 编辑过]
 
不过有个疑问,我用CLEC的语料库检索软件检索后,得出的结果怎么保存呢?软件本身提供保存的格式是*.rst。rst 格式怎么浏览,怎么编辑,怎么与WORD 对接呢?
 
如果不能save的话,试试看能不能在结果窗内,用Ctrl + A(全选),然后Ctrl + C(复制),然后打开MS Word再Ctrl + V(粘贴),看行不行?
 
新手请教:
CLEC的语料库检索软件 哪里可以下载?

[本贴已被 作者 于 2005年08月09日 21时27分42秒 编辑过]
 
不好意思,我也请问CLEC是什么东东?
自己要作硕士论文,需要建立一个小型的语料库,可是遇到很多麻烦,比如语料的标注,请问语料的标注符号是通用的吗。如果自己辛苦的标注半天,却得不到检索工具的默认怎么办?
还有检索工具和统计工具,我在论坛里找了很久,还是没有找到合适好用的检索汉语文本的东西。
不知高手有没有经验之谈可以介绍一下!
 
回复: [原创]中文语料库检索的福音

不好意思,我也请问CLEC是什么东东?
自己要作硕士论文,需要建立一个小型的语料库,可是遇到很多麻烦,比如语料的标注,请问语料的标注符号是通用的吗。如果自己辛苦的标注半天,却得不到检索工具的默认怎么办?
还有检索工具和统计工具,我在论坛里找了很久,还是没有找到合适好用的检索汉语文本的东西。
不知高手有没有经验之谈可以介绍一下!

antconc就可以,是免费的,无需安装。见这个帖子:http://www.corpus4u.org/showthread.php?t=1714&highlight=%E5%A4%84%E7%90%86%E4%B8%AD%E6%96%87

统计用SPSS。

标注一般用XML语言。

建议阅读《语料库应用教程》,你提到的这几个问题都可以得到解决。

刚发现这个帖子是06年发的,汗...
 
回复: [原创]中文语料库检索的福音

abbb12的问题是06年提的。也好,也许有新人有类似的疑问。
 
Back
顶部