xujiajin 管理员 Staff member 2005-07-22 #2 检索工具是不管你是古汉语还是现代汉语的,它只认汉字。只要你的电子文本编码和索引等处理符合工具的要求应该就没问题。 不过确实有一个问题,现在我们采用的汉语分词的词库都是现代汉语的,所以古代汉语的分词可能是个问题。如果不能正确的分词,检索就成了问题。其实,你可以利用北大汉语中心的在线语料库检索。其中有古代汉语部分。网址你到汉语语料库版去找找。
检索工具是不管你是古汉语还是现代汉语的,它只认汉字。只要你的电子文本编码和索引等处理符合工具的要求应该就没问题。 不过确实有一个问题,现在我们采用的汉语分词的词库都是现代汉语的,所以古代汉语的分词可能是个问题。如果不能正确的分词,检索就成了问题。其实,你可以利用北大汉语中心的在线语料库检索。其中有古代汉语部分。网址你到汉语语料库版去找找。
xujiajin 管理员 Staff member 2005-07-22 #4 应该有很大差别才是,不是吗? 其实你可以到www.baidu.com上去搜一个叫search and replace的软件,它在一定意义上也可以起到检索的作用。不过不算太强大,只是它不必分词。
X xiaoz 永远的超级管理员 Staff member 2005-07-22 #6 There are some samples of the Sheffield corpus: http://www.hrionline.ac.uk/scc/
xujiajin 管理员 Staff member 2005-07-22 #7 dzhigner提到UltraEdit里也可以统计文本字符等的出现次数,试试把。另外也参看一下,用WORD统计文本出现次数WordConcordancer。
xujiajin 管理员 Staff member 2005-07-28 #8 古籍语料库字体与结构研究 提供一篇基于语料库的古汉语的研究论文。 http://www.corpus4u.org/upload/forum/2005072800061116.pdf