搜寻结果

  1. L

    LJCorpus中文语料库分析软件推荐

    回复: LJCorpus中文语料库分析软件推荐 1000篇以内的完全免费,我们的一贯原则还是,做研究用、小规模的一律免费。规模比较大有经费支持的,适当收点费用,也能促进我们进一步的研发啊。最终促进咱们语料库语言学的发展,等我们发展壮大了,再反过来支持相关的基础研究啊,于人于己都是好事啊。 多谢咱们这个平台的支持!
  2. L

    LJCorpus中文语料库分析软件推荐

    LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术,目前,东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析,极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括: 1. 新词发现: 从给定的大规模文本文件集合中,挖掘出内涵的新词语列表,可以用于用户专业词典的编撰。识别出的新词结果还可以进一步编辑标注,编辑好的新词词典,可以作为专业知识库导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化情况。 2...
  3. L

    LJCorpus中文语料库分析软件推荐

    回复: LJCorpus中文语料库分析软件推荐 多谢关注!
  4. L

    LJCorpus时事新闻论坛博客语料库

    转自:http://www.lingjoin.com:8080/bbs/viewthread.php?tid=88&extra= 我们通过自有网络采集器,积累了大量的新闻论坛博客语料库,非常贴近时事,语料库的形式为文本文件(GBK编码);大约每天新增2GB左右。具体规格说明如下: 1、语料库来源:主流新闻、论坛、博客的真实文本语料; 2、时间分布:2009.11.1至今; 3、格式:文件名为文章标题,内容采用GBK编码,去除了大量的垃圾等干扰因素; 语料库清单: list.txt (400.07 KB) 下载次数: 0 3 分钟前 样本:...
  5. L

    LJCorpus中文语料库分析软件推荐

    语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。...
  6. L

    地理导航类信息提取系统示例

    原始文本内容为: 格力空调“中华第一店”落户泉城 (CLOB) 9月28日,济南三联商社家电卖场四楼,总面积近600平方米的格力空调店中店正式开门营业。这被认为是家电卖场业店中店之“中华第一店”,同时也开启了家电业营销的一种全新的经营模式。不仅如此,格力此举还被业内解读为倡导现代商业文明、还消费者明白的一次具有变革性意义的尝试。  格力“中华第一店”探营:  打破传统  打造家电零售全新模式  在传统意义上讲,家电零售业的经营模式不外乎大卖场专柜与商业繁华地段品牌专卖店两类。而格力“中华第一店”则打破了这一传统格局,将大卖场专柜模式升级为店中店模式。 自动抽取结果为:...
  7. L

    中文分词技术详解

    分词, 详解, 中文, 技术 信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度、中国搜索等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。...
  8. L

    自然语言理解发展历史与方向有影响力的综述文章推荐

    转自http://www.lingjoin.com:8080/bbs/viewthread.php?tid=52&extra=page%3D1 中国中文信息学会的文章:中文信息处理发展与展望 中文信息处理发展与展望.pdf (199.24 KB) 下载次数: 1 3 天前 14:09 杭州电子工业学院郭艳华老师的文章:自然语言理解研究综述 自然语言理解研究综述.pdf (96.13 KB) 下载次数: 1 3 天前 14:09 张华平博士的文章:中文信息处理发展简史 中文信息处理发展简史.pdf (46.92 KB) 下载次数: 1
  9. L

    Download:LJFeatureDet特征词发现技术中间件下载

    特征词发现技术能够识别出词典中没有出现过的词汇、短语、命名实体、流行用语,是语言文献分析方面的一把利器。特征词发现脱胎于语言自动分词技术,又是对分词技术的有效提升和补充。 灵玖Lingjoin(www.lingjoin.com)采用基于语义的统计语言模型,所处理的文档不受行业领域限制,能够有效地挖掘出新出现的特征词汇,所输出的词汇可以配以权重。 灵玖特征词发现组件的主要特色在于: 1、速度快:可以处理海量规模的网络文本数据,平均每小时处理至少60万篇文档; 2、处理精准:Top...
  10. L

    DBTSearch:面向数据库的全文搜索引擎

    数据库管理系统存储的一般都是结构化数据,长足于数值的计算、查询、统计与挖掘。随着计算机存储与计算能力的迅猛发展,越来越多的非结构化文本数据存储在数据库中,数据库中的文本搜索日益广泛。...
  11. L

    LJParser新词发现系统

    回复: LJParser新词发现系统 如果我们是闭门造车的话,早就死八百回了。中文信息处理产业技术开发和纯粹技术研究是完全不同的,如果不能为客户解决实际问题,是没有科技部或者任何基金支持的。我们所研制的技术都是从多年科研积淀基础上,综合了大量客户实际需求实现的。从目前的反馈来看,还是不错的。相比实验室纯粹研究来说,我们已经走得很远,尽管很辛苦! 科学技术不为民所用,纯粹是小圈子的吹捧,那么,我们的学识和研究的成就感何在? 感谢更多朋友的关注,我们一起做实用的中文信息处理技术吧。多谢!
  12. L

    LJParser新词发现系统

    回复: LJParser新词发现系统 这是我们自行研发的。主要是为了从多语言文本中自动发现一些固有的语言模式。可以帮助发现新的语言现象,速度很快,不过,效果方面,基本够用。但还需要增加更多的语言学知识,效果会更强。
  13. L

    LJParser新词发现系统

    转自http://www.lingjoin.com:8080/bbs/viewthread.php?tid=43&extra=page%3D1 《射雕英雄传》抽取的新特征语言结果:(Top 100的结果) 郭靖 黄蓉 欧阳锋 黄药师 杨康 穆念慈 靖哥哥 朱聪 瑛姑 拖雷 傻姑 桃花岛 程瑶迦 灵智上人 李萍 竹棒 简长老 桑昆...
  14. L

    LJCluster文档聚类分析结果示例

    详情请访问:http://www.lingjoin.com:8080/bbs/viewthread.php?tid=43&extra=page%3D1 聚类的文档集合:2009-11-10至2009-12-01,利用灵玖精准搜索引擎采集到的国内新闻,约24万篇文档; 聚类程序运行环境:WinXP,200MB内存,双核CPU; 计算时间:大约30分钟; 计算结果:聚类分析结果 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模的网络文本数据,平均每小时处理至少50万篇文档; 2、聚类精准:Top...
  15. L

    文档聚类技术中间件LJCluster工具

    文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 可访问 http://www.lingjoin.com:8080/bbs/viewthread.php?tid=46&extra=page%3D1 下载。
  16. L

    汉语分词技术综述(上)

    汉语分词, 技术, 综述 1 汉语分词的意义 汉语自动分词是任何中文自然语言处理系统都难以回避的第一道基本“工序”,其作用是怎么估计都不会过分。只有逾越这个障碍,中文处理系统才称得上初步打上了“智能”的印记,构建于词平面之上的各种后续语言分析手段才有展示身手的舞台。否则,系统便只能被束缚在字平面上。具体来说,自动分词在很多现实应用领域(中文文本的自动检索、过滤、分类及摘要,中文文本的自动校对,汉外机器翻译,汉字识别与汉语语音识别的后处理,汉语语音合成,以句子为单位的汉字键盘输入,汉字简繁体转换等)中都扮演着极为重要的角色。 2...
  17. L

    中文信息处理———“奇葩绽放”

    转自www.lingjoin.com 中文信息处理是我国计算机领域中的一朵奇葩,是计算机技术与语言学、心理学、数学、控制论、信息论、声学、自动化技术等相互交叉融合而形成的一个学科。 由于中文语言和文化上的壁垒,在我国计算技术普遍落后的20世纪80年代,中文信息处理就已经处于国际领先的水平。北大汉字激光照排、联想汉卡等一批重大科研成果,为中国催生了一批优秀的计算机企业。此后,五笔字型、金山WPS、中文之星等也都为中国人使用电脑做出了贡献。近些年来,汉王手写输入、科大讯飞语音合成、TRS中文检索等一连串带有中文特色的高水平、实用化的成果相继诞生。...
  18. L

    “汇聚语言理解智慧,创造信息内容价值”,灵玖中科软件(北京)有限公司专注于自然语言理解的创新与服务,拥有国际上领先的中文、日文与英文三国语言处理技术,提供语言计算与内容挖掘综合解决方案。

    “汇聚语言理解智慧,创造信息内容价值”,灵玖中科软件(北京)有限公司专注于自然语言理解的创新与服务,拥有国际上领先的中文、日文与英文三国语言处理技术,提供语言计算与内容挖掘综合解决方案。
Back
顶部