我们是北京的句酷团队(http://www.jukuu.com ),计划开发一个“语料库在线平台”,基本想法是想为用户提供一个在线的语料库工作平台,在这个平台上用户可以完成:
(1)制作自己的语料库
(2)自定义语料库加工流程
(3)做语料库的分析、统计和搜索,包括token, chunk, collocation , ...
(4)做不同语料库之间的对比
关于对比不同语料库中的搭配,可以参见这个例子:http://www.jukuu.com/jukuu2010//triplepk/pk/pk.php
语料库的加工流水线演示可以参见:...