回复: 看一看我的语料库
谢谢Mandel,把自己的成果向C友开放. 容量之大,搜索速度之快令人惊叹.Standard reference是McEnery所谓的语料库四要点之一. 国内英语界真该向您(当然还有Laohong等)多学一点开放精神.(不过想学也难
)
国内第一无疑,但仍有一点建议,分三小点:
1.1汉语单语,可否参考Mark Davies http://corpus.byu.edu/[/url].[/SIZE]不是简单的模仿,而是借鉴以创新.您的学识和能力和团队,在这一领域,你们一定是世界第一.
1.2检索结果的排序.这一功能对使用者非常重要.比如有C友希望检索“吧”的一些新表达,或称"搭配",如火吧,彩吧等,若能对 单字"吧"的 检索结果作基于L1的排序,这个问题就可以解决了.
1.3 不论是单语还是双语,建议标注必要的语料信息,功德无量. 以Mark Davies为例. 检索结果前显示有序号,时间,语料\体裁,和来源; KWIC显示 更为具体,以便于研究者援引标注.如"artificial intelligence"最后一条KWIC显示的信息是:
Source information:
Date 1990 (Spring)
Publication information Spring90, Vol. 4 Issue 2, p15-37, 23p, 4 diagrams
Title CO-STAR: A Semantic Representational Schema for Cost Management.
Author Reuber, A. Rebecca1
Source Journal of Information Systems