“语料库在线平台”设计方案征集需求、意见和反馈

我们是北京的句酷团队(http://www.jukuu.com ),计划开发一个“语料库在线平台”,基本想法是想为用户提供一个在线的语料库工作平台,在这个平台上用户可以完成:

(1)制作自己的语料库
(2)自定义语料库加工流程
(3)做语料库的分析、统计和搜索,包括token, chunk, collocation , ...
(4)做不同语料库之间的对比

关于对比不同语料库中的搭配,可以参见这个例子:http://www.jukuu.com/jukuu2010//triplepk/pk/pk.php

语料库的加工流水线演示可以参见: http://www.jukuu.com/jukuu2010//nldp/?type=nldp

目前我们正在设计方案,希望可以多多听到一些需求、建议和反馈,回帖或者直接邮件到info##cikuu.com 皆可。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

感谢句酷团队,你们的工作是开创性的。先谢一下,日后有想法一定会提出。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

恩,挺不错的。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

计算机领域有很多成型的在线系统让用户使用,比如博客,论坛,qq空间等,从而使“使用者”不需要懂太多的计算机知识就可以使用这些东西了。因为以上几个实例都是提供了成型的“模板”

开发一个可供“菜鸟”使用的在线语料库索引平台,真是一个不错的概念!以后我们都可以把自己开发的语料库直接挂成在线检索系统,就像开个博客一样方便。支持!

我可能会错了楼主的意思。但我的这个想法我觉得的确是在将来有可能实现的。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

正如7楼所言,我们希望通过一些技术封装,降低语料库的使用门槛,精于心、简于形,从而可以让更多的用户能够使用语料库服务。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

值得期待
预祝成功
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

"语段分析“ 是不是该叫 "短语分析" ?
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

英文是 chunking ,所以叫“语段”;
感觉短语比语段的范畴更广一些,除了语段,短语还包括搭配。
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

http://www.jukuu.com/jukuu2010//nldp/?type=nldp
测试以下文本报错:
It’s been a wee while since Kirsten Dunst has really gone for a specific designer look, in fact we getting quite used to her grungy uniform. So you can imagine the LOOK office's delight to see her out of skinny jeans and into a pretty frock. And not just any print, our favourite Miu Miu print of the summer. We love the demi wedge and the black across-the-body bag too – this look gets two thumbs up from us!
 
回复: “语料库在线平台”设计方案征集需求、意见和反馈

英文是 chunking ,所以叫“语段”;
感觉短语比语段的范畴更广一些,除了语段,短语还包括搭配。



“语段”在汉语语言学(篇章、话语分析)中有固定含义,指相关联的多个句子组成的”句群“单位。
百度一下 “语段分析”, “语段教学” 可知。

chunking或可称作“语块”, 印象中1980年代鲁川先生就这么翻译过。
 
Back
顶部