有关于"古代汉语语料库"的介绍或检索工具吗?

patricx · 2005-07-22

不知道Xaira可不可以检索"古代汉语语料库",我手上倒是有国学宝典的TXT文档,但对建语料库的知识知道的很少,请教高手指点.

xujiajin · 2005-07-22

检索工具是不管你是古汉语还是现代汉语的，它只认汉字。只要你的电子文本编码和索引等处理符合工具的要求应该就没问题。

不过确实有一个问题，现在我们采用的汉语分词的词库都是现代汉语的，所以古代汉语的分词可能是个问题。如果不能正确的分词，检索就成了问题。其实，你可以利用北大汉语中心的在线语料库检索。其中有古代汉语部分。网址你到汉语语料库版去找找。

patricx · 2005-07-22

个人觉得现代汉语分词和古代汉语的分词应该有很大的不同啊!好像目前的古代汉语分词方面的研究不是很成熟?至少没有现代汉语这么成熟吧

xujiajin · 2005-07-22

应该有很大差别才是，不是吗？

其实你可以到www.baidu.com上去搜一个叫search and replace的软件，它在一定意义上也可以起到检索的作用。不过不算太强大，只是它不必分词。

patricx · 2005-07-22

谢谢许博士,你和肖博士知识都很渊博啊,俺心中的偶像啊,佩服佩服!!!

xiaoz · 2005-07-22

There are some samples of the Sheffield corpus:

http://www.hrionline.ac.uk/scc/

xujiajin · 2005-07-22

dzhigner提到UltraEdit里也可以统计文本字符等的出现次数，试试把。另外也参看一下，用WORD统计文本出现次数WordConcordancer。

xujiajin · 2005-07-28

古籍语料库字体与结构研究

提供一篇基于语料库的古汉语的研究论文。
http://www.corpus4u.org/upload/forum/2005072800061116.pdf

patricx · 2005-07-28

great. and very few articles in this field.

hancunxin · 2005-07-28

DR xiao 在以前的帖子当中已经有详细介绍。你可以搜索，也可以去论坛的分栏目查找。这样的信息有很多。

有关于"古代汉语语料库"的介绍或检索工具吗?

patricx

高级会员

xujiajin

管理员

patricx

高级会员

xujiajin

管理员

patricx

高级会员

xiaoz

永远的超级管理员

xujiajin

管理员

xujiajin

管理员

patricx

高级会员

hancunxin

Moderator