LJParser新词发现系统

lingjoin

封禁用户
转自http://www.lingjoin.com:8080/bbs/viewthread.php?tid=43&extra=page=1
《射雕英雄传》抽取的新特征语言结果:(Top 100的结果)
郭靖 黄蓉 欧阳锋 黄药师 杨康 穆念慈 靖哥哥 朱聪 瑛姑 拖雷 傻姑 桃花岛 程瑶迦 灵智上人 李萍 竹棒 简长老 桑昆 狗王 蒙古兵 王罕 兵刃 铁木 蓉二 群丐 铁杖 蛇奴 彭长老 铁枪 颜烈 父王 王重阳 铜缸 君臣 刘贵妃 程大小姐 命郭靖 武穆遗书 钢杖 轻功 札木 众师父 傻小子 咧嘴 铁掌峰 焦木 率兵 师叔 欧阳伯伯 简管家 姊姊 博尔忽 吉思汗 江南七侠 梅师姊 穆姊姊 拳脚兵刃 斡赤斤 旭烈兀 鲁长老 亡母 蒙哥 枯木 巨岩 巨钟 藏僧 江南武林 郝大通 公子爷 石洞 蛇杖 臭小子 羽箭 玉箫 御厨 贼汉子 枪尖 掌猛 掌虚 招掌法 赵王 赵王府 赵王爷 枝箭 众孩 铜尸 众丐 珠玉 柄匕首 醉仙 彭寨主 全身经脉 敌兵 洪恩师 黄裳 锦袍 竹杖 拳劲 皇爷 拳势

《红楼梦》抽取的新特征语言结果:(Top 100的结果)
贾母 黛玉 凤姐 宝钗 贾政 薛姨妈 凤姐儿 香菱 紫鹃 晴雯 林黛玉 袭人 尤氏 贾蓉 贾赦 刘姥姥 贾芸 妙玉 宝琴 赵姨娘 秦钟 宝蟾 宝二爷 林妹妹 贾兰 薛蝌 尤二姐 秋纹 司棋 秦氏 湘莲 史湘云 宝姐姐 荣府 巧姐儿 贾瑞 凤丫头 贾府 尤三姐 蒋玉菡 薛宝钗 甄宝玉 潇湘 倪二 鲍二 巧姐 衔玉 邢妹妹 李嬷嬷 贾妃 贾大人 贾芹 翠缕 秋桐 马道婆 柳湘莲 潇湘馆 七星 宁国府 三妹妹 攒珠 碗箸 二老爷 叔嫂 佩凤 大哥哥 邢大舅 累丝 翠墨 凤姐姐 珍大爷 李氏 折枝 李纹 众姊妹 郡王 苍苔 府贾 王太医 宫里头 娇杏 宝丫头 彩屏 梅翰林 藕香榭 潇湘妃子 珍大哥哥 玉钏姐姐 沁芳亭 紫鹃姐姐 王熙凤 赖嬷嬷 金钱蟒 林姐姐 林丫头 懒怠 馒头庵 岫烟 白狐皮 宝玉 姬妾
《中国大百科全书》历史卷抽取的新特征语言结果:(Top 100的结果)
御史 袁世凯 武帝 李鸿章 慈禧太后 王安石 中国史学界 中国史学 宇文泰 蒙哥 王莽 幽州 率兵 宗乾 武王 斡鲁朵 御史大夫 史迪威 伯颜 南京国民政府 玄奘 曹魏 袁绍 封建统治者 封建地主 永乐大典 窝阔 旗昌 魏徵 宣王 龟兹 地方军阀 明帝 领兵 宗诏 河流域 儒臣 帝永 卫尉 赞襄政务王大臣 旭烈兀 耶律濬 杂泛差役 章炳麟 孛罗丞相 黠戛斯 徐寿辉 喀什噶尔 冯玉祥 李宗仁 齐福霖 侍御史 魏忠贤 吴王濞 奉诏 牵星 蒙古贵族 明廷 景帝 翰林学士 商务印书馆 郡王 日本帝国主义 司寇 鲁特 帝国主义列强 夜郎 杨廷 滇铜 力役 卫青 士族 铁木 佃客 叛王 江西瑞金 顺帝 司马睿 统兵 刘氏 厢兵 盐政 乐毅 拓跋珪 交纳押租 拓跋焘 汉阳 吴王 吴晗 乾祐 长江中游 严嵩 课田 惠王 都督府 王司马 杨业 凉州 商鞅 阎锡山
 
回复: LJParser新词发现系统

赞一个!这就对了,好东西应该拿出来奥.
这个功能很实用.如keyness, 新词发现应该有个参照的词表.这个词表的提取是自行开发的工具或是中科院的那个呢?
 
回复: LJParser新词发现系统

这是我们自行研发的。主要是为了从多语言文本中自动发现一些固有的语言模式。可以帮助发现新的语言现象,速度很快,不过,效果方面,基本够用。但还需要增加更多的语言学知识,效果会更强。
 
回复: LJParser新词发现系统

这是我们自行研发的。主要是为了从多语言文本中自动发现一些固有的语言模式。可以帮助发现新的语言现象,速度很快,不过,效果方面,基本够用。但还需要增加更多的语言学知识,效果会更强。

是测试阶段 或"闭门造车"阶段? :p
 
回复: LJParser新词发现系统

如果我们是闭门造车的话,早就死八百回了。中文信息处理产业技术开发和纯粹技术研究是完全不同的,如果不能为客户解决实际问题,是没有科技部或者任何基金支持的。我们所研制的技术都是从多年科研积淀基础上,综合了大量客户实际需求实现的。从目前的反馈来看,还是不错的。相比实验室纯粹研究来说,我们已经走得很远,尽管很辛苦!
科学技术不为民所用,纯粹是小圈子的吹捧,那么,我们的学识和研究的成就感何在?
感谢更多朋友的关注,我们一起做实用的中文信息处理技术吧。多谢!
 
回复: LJParser新词发现系统

如果我们是闭门造车的话,早就死八百回了。中文信息处理产业技术开发和纯粹技术研究是完全不同的,如果不能为客户解决实际问题,是没有科技部或者任何基金支持的。我们所研制的技术都是从多年科研积淀基础上,综合了大量客户实际需求实现的。从目前的反馈来看,还是不错的。相比实验室纯粹研究来说,我们已经走得很远,尽管很辛苦!
科学技术不为民所用,纯粹是小圈子的吹捧,那么,我们的学识和研究的成就感何在?
感谢更多朋友的关注,我们一起做实用的中文信息处理技术吧。多谢!

很好!何时可作为产品推向市场?;)
 
Back
顶部