听计算机专业朋友说,在线检索不用sql可能更快。。

maggieq58

语料人生
大家什么观点。我以前一直认为应该采用数据库比如mysql来统一管理数据。但最近和一个计算机专业的朋友交流。他说如果我只是检索一些文本的话,直接采用php框架可能速度更快,而不是非要调用mysql。大家是什么观点那?
 
回复: 听计算机专业朋友说,在线检索不用sql可能更快。。

也不一定。数据库建立索引以后,检索起来也快。可以参考这篇文章:
Davies, M. (2005). The advantage of using relational databases for large corpora: speed, advanced queries, and unlimited annotation. International Journal of Corpus Linguistics, 10(3), 307-334.
 
回复: 听计算机专业朋友说,在线检索不用sql可能更快。。

感谢海洋!
 
回复: 听计算机专业朋友说,在线检索不用sql可能更快。。

我对这个问题的看法:
如果您使用的是桌面程序,如WordSmith等,而且频繁更换语料库(或文章库),最好不要用数据库,因为这样操作很麻烦,使用数据库是有成本的,每次建立连接和插入数据,都需要时间,而且数据库对基于正则表达式的查询支持有限。最好是直接在内存中操作,这是最快的方法,同时要优化算法,加快查询速度,也可以先产生索引,再检索,这等于用空间换时间。

如果您要查询的语料库是固定的,如基于BNC或CLEC,那么用数据库是很好的选择。如果您准备在线发布程序,就更应该使用数据库,不然服务器负担会很重。不过可以同时使用lucene搜索引擎,建立索引后,很快很方便。
 
Back
顶部