大家来说说专业语料库到底怎么了?

#1
最近想做点关于专业语料库方面的研究,可是上网一查没有几个专业的语料库的信息可以查到,大多都是但闻其声不见其形,就连基本的库容信息都看不到,怪哉。论坛里的帖子也看了一遍,还是一无所获。这和学习者语料库的发展相差太悬殊了!!!想想我国第一批建成的语料库就是科技英语语料库和广州石油英语语料库,这么多年过去了,专业语料库不进反退,这到底是为什么啊?谁能给我一个答案啊?
 

Haiyang Ai

Administrator
Staff member
#3
回复: 大家来说说专业语料库到底怎么了?

这也不奇怪,因为课题的基金通常没有要求结项后语料库必须公开。
 
#4
回复: 大家来说说专业语料库到底怎么了?

这也不奇怪,因为课题的基金通常没有要求结项后语料库必须公开。
那起码对语料库的建设及应用方面进行些介绍啊,这既可以给其他的建库者提供借鉴或提供研究平台,对他们的语料库也是个提高知名度和影响力的途径啊
 

iCasino

普通会员
#5
回复: 大家来说说专业语料库到底怎么了?

外语专业和其他专业结合比较疏松可能是主要原因,另外可能还有学科间学术领导权的问题和版权问题
 
#6
回复: 大家来说说专业语料库到底怎么了?

建库苦活累活,就那点点课题资金,杯水车薪,零花钱都不够。看看自然科学资金,动辄几十万上百万,人文社科未得到重视。别人辛苦建库,不公开有何怪哉:rolleyes:
 
#7
回复: 大家来说说专业语料库到底怎么了?

我觉得语料库不公开,部分原因是考虑到版权和付出收获比,还有一些专业英语语料库,虽然立项了,介绍的文章也写了,但实际上根本没有实际建库,虚张声势而已。另一方面,国内有影响力的专业英语语料库实在太少了,前景不太看好啊
 

Haiyang Ai

Administrator
Staff member
#8
回复: 大家来说说专业语料库到底怎么了?

你怎么知道人家没有 “实际建库” 呢?
 
#9
回复: 大家来说说专业语料库到底怎么了?

你怎么知道人家没有 “实际建库” 呢?
我们学校有两个老师做的专业库,一个根本没有启动,另一个就是收集了语料,词性标注之后就没有了下文。我想这不是个例吧?
 

Haiyang Ai

Administrator
Staff member
#10
回复: 大家来说说专业语料库到底怎么了?

没有启动的话,不好结项吧。其实有了原始语料,也可以称为语料库了。具体的各种标注依研究目的不同而有区别的。很多时候,大家拿到别人的语料库,第一件事就是去掉原始的标注。
 
#11
回复: 大家来说说专业语料库到底怎么了?

大概是通过发理论方面的文章来结项的,标注的问题确实很值得研究,不标注达不到研究的目的,而标注之后给资源共享又带来了一定的问题
 
#12
回复: 大家来说说专业语料库到底怎么了?

还是结成小组,共同建设,资源共享好。中文标注各家有各家的软件,相互矛盾的也有。。。。
 
#13
回复: 大家来说说专业语料库到底怎么了?

May be the corpus studies are not very public. Therefore we wont get more resources about corpus studies.
 
顶部