LJCorpus中文语料库分析软件推荐

lingjoin

封禁用户
LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术,目前,东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析,极大提高了研究的效率。
LJCorpus中文语料库分析软件的四大功能主要包括:
1. 新词发现:
从给定的大规模文本文件集合中,挖掘出内涵的新词语列表,可以用于用户专业词典的编撰。识别出的新词结果还可以进一步编辑标注,编辑好的新词词典,可以作为专业知识库导入分词词典中,从而提高分词系统的准确度,并适应新的语言变化情况。
2. 分词标注:
对生语料进行分词、自动识别人名地名机构名等未登录词、新词标注以及词性标注。并可在分析过程中,导入用户定义的词典。
3. 统计分析
针对切分标注结果,系统可以自动地进行统计分析,分析结果包括:一元词频统计(统计结果可以按照词频、词语两种方式排序;并给出具体的一元概率)、二元词语转移概率统计(统计两个词左右连接的频次即概率)。
4. 术语翻译
针对常用的术语,系统会自动给出相应的英文解释。
相关链接:LJCorpus中文语料库分析软件使用手册
软件下载:http://www.lingjoin.com/LJCorpus.html
 
回复: LJCorpus中文语料库分析软件推荐

是广告吧?以后这样的帖子请在标题中明示"广告",以免C友有"天上又掉馅饼"的误读.得罪得罪!
 
回复: LJCorpus中文语料库分析软件推荐

1000篇以内的完全免费,我们的一贯原则还是,做研究用、小规模的一律免费。规模比较大有经费支持的,适当收点费用,也能促进我们进一步的研发啊。最终促进咱们语料库语言学的发展,等我们发展壮大了,再反过来支持相关的基础研究啊,于人于己都是好事啊。
多谢咱们这个平台的支持!
 
回复: LJCorpus中文语料库分析软件推荐

1000篇以内的完全免费,我们的一贯原则还是,做研究用、小规模的一律免费。规模比较大有经费支持的,适当收点费用,也能促进我们进一步的研发啊。最终促进咱们语料库语言学的发展,等我们发展壮大了,再反过来支持相关的基础研究啊,于人于己都是好事啊。
多谢咱们这个平台的支持!
谢谢解释!如果您在发帖时有了这一段,岂不功德圆满了?
 
回复: LJCorpus中文语料库分析软件推荐

软件很不错,操作比较方便。这是基于现代汉语的分词系统,不知有没有对古汉语进行分词的系统,年前有任务对一部分古汉语进行分词,没办法自制了一个词库挂上去了,效果非常的不好。
 
Back
顶部