请问:如何可以做到把文本形式的语料库可以在线检索?

回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

我刚搞完几个,都可以在线检索。简单说来,需要的工具如下:

1、语料:词性标注过的或没有都行,最好有词性标注的。
2、Xaira:用Xaira索引后就可以直接用Xaira来检索了。
3、PHP5.0 + IIS6.0 + Tomcat:如果想搞成在线检索的,那还得需要这三个东西。

这些工具都是免费的,只是要使用起来是需要一些探索精神的。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

老洪能不能具体点?
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

这些工具都是免费的,只是要使用起来是需要一些探索精神的。

这些精神我们都有呵, 现就缺位导师.盲目探索是不行滴,是不,师父:)

师父就在这里开讲座吧,我们洗耳恭听:)
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

开讲座就有点班门弄斧了。正好也得写documentation,回头有时间就把心得总结出来跟大家分享吧。大家也可以先把Xaira下载下来自己摸索一哈。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

我刚搞完几个,都可以在线检索。简单说来,需要的工具如下:

1、语料:词性标注过的或没有都行,最好有词性标注的。
2、Xaira:用Xaira索引后就可以直接用Xaira来检索了。
3、PHP5.0 + IIS6.0 + Tomcat:如果想搞成在线检索的,那还得需要这三个东西。

这些工具都是免费的,只是要使用起来是需要一些探索精神的。


多谢师傅为俺们指明方向!:)
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

laohong的绰号是师傅?
如果laohong可以带博士生的话,我愿意拜师。
呵呵。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

我刚搞完几个,都可以在线检索。简单说来,需要的工具如下:

1、语料:词性标注过的或没有都行,最好有词性标注的。
2、Xaira:用Xaira索引后就可以直接用Xaira来检索了。
3、PHP5.0 + IIS6.0 + Tomcat:如果想搞成在线检索的,那还得需要这三个东西。

这些工具都是免费的,只是要使用起来是需要一些探索精神的。

laohong 能否给出一个,您采用这个技术做的库的连接,我具体学习下。我用xaira做了索引后,没思路怎么把他放在网上,iis和tomcat我都了解一些。
 
Re: 回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

laohong 能否给出一个,您采用这个技术做的库的连接,我具体学习下。我用xaira做了索引后,没思路怎么把他放在网上,iis和tomcat我都了解一些。

很久以前的舊帖了,現在只用Tomcat和MySql了。 Xaira開發者很久也沒有更新了,客戶端用還可以,服務器端有很多問題。
 
很久以前的舊帖了,現在只用Tomcat和MySql了。 Xaira開發者很久也沒有更新了,客戶端用還可以,服務器端有很多問題。

Laohong,你是编制在线检索语料库的专家,能具体点指导我们怎么做吗?谢谢呵!
 
谢谢Laohong的回复,您太谦虚了!
我自己在黑暗中摸索滚打半年多了,但终无头绪。是不是把Tomcat和MySql整明白了就能够把语料库放网上检索啊?还需要其他什么软件(譬如Xaira、PHP)么?
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

Tomcat和MySql就够了,一个web端的,一个是数据库,这两个就行了。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

用进来感觉好象Tomcat和MySql能够处理的语料数量小,速度慢。

当然如果语料库在50万以下,还是很快的。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

用进来感觉好象Tomcat和MySql能够处理的语料数量小,速度慢。

当然如果语料库在50万以下,还是很快的。

不一定。红楼梦不够快吗?Mark Davies的BNC、Time、ANC也不够快吗? 这些都是远远超过50万的。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

Tomcat和MySql就够了,一个web端的,一个是数据库,这两个就行了。

想当年导师训我们,讲得最多的话就是:“都学到这种程度了,还需要人手把手地教吗?!”然后,该手把手还是手把手。

可是Tomcat和MySql啊,想说爱你不容易,一个人进去,那感觉,怎一个天旋地转了得。没等看见手在哪,肯定就晕过去。
 
回复: 请问:如何可以做到把文本形式的语料库可以在线检索?

用lucene可以实现,速度奇快无比,java语言,
 
Back
顶部