有关中文语料库检索功能兼容性较强的软件?

清风出袖

高级会员
谁那里有有关中文语料库检索功能兼容性较强的软件?能否给介绍一下?谢谢赐贴方家!!

[本贴已被 Ocean 于 2005年06月20日 10时20分39秒 编辑过]
 
另外,本版的置顶贴里提供的链接都可以在线检索的,很方便的。

现在,concordancer对英文的处理很便利,但对中文都不太好用。主要是汉语字词之间没有空格加以区分,这即经常将的汉语的分词问题。常见的concordancer中里,ConcApp可以检索简体中文的。像MonoConc对经过分词处理的文本也可以检索。Xaira当然是很强大的,只是需要先将ANSI编码的txt文本转换为unicode(UTF-8)编码形式。
 
怎么转换呢?(Xaira当然是很强大的,只是需要先将ANSI编码的txt文本转换为unicode(UTF-8)编码形式。)
 
在notepad,即写字板里“另存为”中可以找到ANSI,然后将其改为UTF-8
 
网上有下载的Java,但太大,差不多100MB左右。我是在超级解霸的某个版本的spport程序中发现了一个javasetup,10MB不到,你看能不能自己找一下。我这里拨号上网,实在没法传给你。抱歉。
MLCT
Free multilingual corpus tool. Functionalities include concordancing, pre-processing corpus, and encoding converstion etc. Strongly recommended. See for yourself.

http://www.lancs.ac.uk/staff/piaosl/research/download/download.htm
 
Java interpreter (JRE) or developer envirornment (SDK) can be downloaded freely at Sun. If you do not write and compile Java scripts, JRE is sufficient:

http://java.sun.com/j2se/1.5.0/download.jsp
 
回复:有关中文语料库检索功能兼容性较强的软件?

以下是引用 xiaoz2005-7-3 4:05:31 的发言:
Java interpreter (JRE) or developer envirornment (SDK) can be downloaded freely at Sun. If you do not write and compile Java scripts, JRE is sufficient:

http://java.sun.com/j2se/1.5.0/download.jsp
可是我试过下载你说的这个,但是好像是100MB的。
 
Back
顶部