自然语言理解解决方案

lingjoin

封禁用户
一、 自然语言理解技术的背景

随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解、分析并回答自然语言(即人们日常使用的各种通俗语言)的结果。现在的计算机的智能还远远没有达到能够象人一样理解自然语言的水平,而且在可预见的将来也达不到这样的水平。因此,关于计算机对自然语言的理解一般是从实用的角度进行评判的。自然语言理解系统可以用作专家系统、知识工程、情报检索、办公室自动化的自然语言人机接口,有很大的实用价值。
然而,当前的自然语言理解技术往往面临着诸多的挑战。一方面,自然语言理解技术涉及的语言语义知识过浅,生成的结果往往差强人意,而且可扩展性很差;另外一方面,融入了过多语言专家知识的系统,需要分析的层次过深,则导致计算特别费时费力。
灵玖软件 依托国际领先的自然语言理解专家团队,基于十余年在中文、英文与日文的自然语言计算处理的研究成果,专注于提供自然语言理解的解决方案,已经取得了长足的进步。

二、 我们能为您解决什么 (白皮书下载、咨询及在线测试

灵玖软件通过几年的技术积累,结合当前的自然语言理解的需求,推出了LJParser自然语言理解中间件。经过近五年的应用和发展,灵玖LJParser产品已经可以在 不同操作系统、不同应用系统以及各种复杂的网络应用下高效运转。

如果您遇到以下问题,那么请联系我们,我们将为您提供一整套的解决方案。
1. 中日英等语言词语层面的分析
灵玖软件基于条件随机场(Conditional Random Field,简称CRF)模型,研制了中文分词系统,系统切分速度可以达到每分钟一千万汉字,切词准确率高达98%,词性标注准确率高达98%。日语切分准确率高达99.2%。英文的词法分析系统正确率几乎100%。
2. 不同领域专业词汇的自动抽取
LJParser拥有专业词汇自动抽取系统,客户只需要提供各种自然语言文本,LJParser将自动抽取出各类专业词汇,500MB文本不到10分钟即可生成近10万专业词条,并给出计算依据和语用环境特征。抽查前1万条数据,准确率可超过90%。
3. 文本关键语义分析
LJParser可以自动抽取一篇文章的关键语义,并采用5-10个关键词来表达文章的语义;同时计算出文章的摘要。
4. 海量文本集的自动分类聚类
灵玖软件可以针对TB级别的海量文本集,按照用户的需要,智能地分类聚类。
5. 网络多语言多编码多格式文档的正文标准化解析
当前网络文档编码格式多样化,主要包括:Unicode,UTF-8,GBK,BIG5等;语种包括:英语、西班牙语、法语等拉丁语系;日语、藏语、维吾尔语等汉藏多语种;文档格式包括:txt,html,pdf,doc,exce,ppt等,灵玖LJParser自然语言理解中间件提供标准化套件,实现编码转换,多语种处理,并解析各种文档格式,去除广告导航等噪音数据,提取正文文本,最终用于进一步的文本计算。

三、 LJParser的核心技术优势
1. 核心算法全部经过了GB级别的网络真实数据测试,吸收了国内外最新的研究成果,性能高效,健壮性强,适合于实际网络业务应用。
2. 支持Windows,Linux等操作系统,支持C/C++;Java; php等多种语言开发接口;
3. 支持多数据源多格式多编码处理;

四、 LJParser 典型案例

1. 跨国企业:NCR,IBA;
2. 政府行业客户:国家广电总局,北京市外事办
3. 事业单位客户:中国科学技术信息研究所
4. 互联网行业客户:口碑网,布谷网。
 
Back
顶部