求指点:你都想要语料库实现何种搜索功能

最近我在做一个语料库的搜索引擎项目,这个搜索是有一定的扩展功能的,也就是说,无论你给的是哪里切好的语料,只要在搜索引擎中输入你的切分标识,然后都可以使用。
本来是准备开发一个更高层面的程序来进行搜索,可是最近因为一些事情很受打击,决定先做一个基层模型。
我看过一些语料库,觉得他们的搜索功能从速度上还有质量上都很优秀,尤其是一些著名的语料库web客户端。可是同样的我也觉得这之中还是不能够很好的实现语料的价值,总是在搜索的过程中好像有一种很呆板的样子。
现在到我来做这个项目,我知道汉语语料库的发展还有很大的空间,可是我学识很有限,我现在恳求各位给我点指点,因为这个搜索引擎的设置我知道可能远远比不上专业的,但是我只希望尽自己做大的努力来做好它。我用的是PHP+MySQL来写的。
我现在想知道大家都希望语料库搜索能够实现什么搜索,比如很简单的说:实现这样一种搜索,能够制定一个词作为某种词性出现,同时在这个词作为这个词性后多少个词后又某种类型的词;或者说是某种固定的句法格式的搜索……
我知识有限,恳求各位赐教,估计在下个月底左右程序会出来,到时间再给大家做实验。
谢谢!
有什么好的建议和需要,直接回帖给我说也可以,如果可以尽量发送到我邮件:26116673@qq.com
 
回复: 求指点:你都想要语料库实现何种搜索功能

请各位前辈多指教了……算法要在八月上旬确定,我想能让这个小东西完善一点就完善一点……
 
回复: 求指点:你都想要语料库实现何种搜索功能

可以参考 Mark Davies 的论文。除了技术上的考虑,你也要琢磨你想设计的程序有何新意?能解决什么技术上,或者语言学上的比较重要的问题,往往后者是大家更关注的内容。
 
Back
顶部