大家好,最近因为要写一篇关于语料库的作业,找到这个论坛。这里面真的有好多有用的东西,平台建的也是相当的好于是忍不住注册,更收到了论坛管理团队的邮件,于是便下定决心要来常常关注这个版面(当然啦,前期的关心总是从任务开始的)。
在我们查到的资料中,对“语料”和“语料库”是这样定义的:
[FONT=宋体]?[FONT=宋体] 语料:用于任何研究的语言材料集合 [/FONT]
[FONT=宋体] 语料库(Corpus)——存储语言材料的仓库[/FONT]
[FONT=宋体] [/FONT]
[FONT=宋体] 但是很多基于语料库的研究,都是使用了语料库的统计功能,然后才进行进一步的研究。所以,也许在这个意义上,语料库是指以承载着结构化了的语料并能提供上层服务的数据库(自己的感觉)。那么,在前面的一篇文章《常用语料库链接页面Corporalink:小许的语料天涯0407更新》中的链接,诸如“百度、google、北大图书馆、CNKI”等怎么也算作“语料库”了呢?还是这里的“语料库”是广义上的?因为我感觉的语料库,应该能实现统计的东西吧~[/FONT]
[FONT=宋体] 呵呵,一点疑问。因为我本来也对基于统计的研究比较感兴趣,所以应该会继续关注语料库的,也会常常来~[/FONT]
[FONT=宋体] 期待大牛的解答 [/FONT]
[/FONT]
在我们查到的资料中,对“语料”和“语料库”是这样定义的:
[FONT=宋体]?[FONT=宋体] 语料:用于任何研究的语言材料集合 [/FONT]
[FONT=宋体] 语料库(Corpus)——存储语言材料的仓库[/FONT]
[FONT=宋体] [/FONT]
[FONT=宋体] 但是很多基于语料库的研究,都是使用了语料库的统计功能,然后才进行进一步的研究。所以,也许在这个意义上,语料库是指以承载着结构化了的语料并能提供上层服务的数据库(自己的感觉)。那么,在前面的一篇文章《常用语料库链接页面Corporalink:小许的语料天涯0407更新》中的链接,诸如“百度、google、北大图书馆、CNKI”等怎么也算作“语料库”了呢?还是这里的“语料库”是广义上的?因为我感觉的语料库,应该能实现统计的东西吧~[/FONT]
[FONT=宋体] 呵呵,一点疑问。因为我本来也对基于统计的研究比较感兴趣,所以应该会继续关注语料库的,也会常常来~[/FONT]
[FONT=宋体] 期待大牛的解答 [/FONT]
[/FONT]