请问:有把语料库从文本转到数据库的相关资料吗?

请问:有把语料库从文本转到数据库的相关资料吗?
各位有把语料库从文本转到数据库的相关资料或相关经验吗?我是计算机系的,想做一篇这方面的论文,其中的语料库是为信息抽取服务的,各位有这方面的经验的话请指点下,不胜感激!
 
回复: 请问:有把语料库从文本转到数据库的相关资料吗?

能把要求讲的再具体一点吗?
 
回复: 请问:有把语料库从文本转到数据库的相关资料吗?

to dychen:
有一点我描述的不是很准确:应是把语料库从文本型的改成到关系型的数据库上(因为数据库也有文本型的数据库).具体功能是设计一分布式语料数据库,它对语料进行分布式存放,并且按照信息抽取的规则设计表的各个属性及其关系.对于同一个领域相关信息表,对其建立其于领域关键词的倒排索引.

to laohong:
thanks very much!
在你所给的网站上我果然找到了几篇相关的文章,稍感遗憾的是下面几篇文章没找到地方下载,
Semantically-based queries with a joint BNC/WordNet database". In Corpus Linguistics twenty-five years on, ed. Roberta Facchinetti. Amsterdam: Rodopi. 149-167.
Relational databases as a robust architecture for the analysis of word frequency”. AHRC ICT Methods Network: Expert Seminar on Linguistics: Word Frequency and Keyword Extraction. Univ. of Lancaster, England. (Invited speaker)
(2004) "Incorporating register variation into BNC queries: a relational database approach." Sixth International Conference on Teaching and Language Corpora. Granada, Spain
2004) "A match made in corpus heaven: the BNC and WordNet in relational database form." 25th Conference of the International Computer Archive of Modern and Medieval English. Verona, Italy
(2002) "Using Relational Databases to Create Highly Searchable and Very Large Corpora". The Fourth North American Symposium on Corpus Linguistics. IUPUI, Indianapolis, IN.
哪位能给我一些帮助?
再次感谢laohong!
 
回复: 请问:有把语料库从文本转到数据库的相关资料吗?

其实没有必要读那么多,看这一篇就行了:

(2005) "The advantage of using relational databases for large corpora: speed, advanced queries, and unlimited annotation". International Journal of Corpus Linguistics 10: 301-28.

用Mark自己的话说,文章上的东西也不能完全说明实际操作,有很多能解决问题的操作和方法却没法写成文章。

你所描述的设想是可行的,而且也有人这样尝试过了。在今年3月的AACL2008的会议上(http://corpus.byu.edu/aacl2008/schedule.asp)有两个presentations也介绍了我们的做法,只是目前程序还在调试中,文章也还在撰写中,尚不能供你参考。不过,有一点可以告诉你,那就是Mark在他办公室里讲的一番话对我们启发很大,那就是他自己的经验证明,不要完全照书本上说的那些建数据库的方法和原则来做,不然要徒费功夫,走冤枉路的。
 
回复: 请问:有把语料库从文本转到数据库的相关资料吗?

to laohong:
谢谢!
"今年3月的AACL2008的会议上两个presentations"在你给的网页上我没找到,请问我想找这类论文有什么好的网站或数据库或期刊推荐吗?
 
Back
顶部