打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

在预处理过程中需要识别出语料库中所有的人名,地名,机构名,然后对这些建立索引,请问各位前辈,有现成的能用的工具吗?开源的最好:),谢谢!
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

你可能对自然语言处理中专名识别的难度估计不足。
目前是没有的。
等你来开发。
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

named entity recognition (NER)是自然语言处理信息抽取方面的一个热门课题,好多人在做这方面的研究,中英可用的工具基本都没有多少,人工标注的语料库倒是有好几个。
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

named entity recognition (NER)是自然语言处理信息抽取方面的一个热门课题,好多人在做这方面的研究,中英可用的工具基本都没有多少,人工标注的语料库倒是有好几个。
感觉国外实体关系抽取这一块挺火的,但是实体关系抽取应该是建立在已经抽取出实体的基础上,会不会是英文的这一块做的挺好的,但是中文的差一些呢?
“中英可用的工具基本都没有多少”那就是还有一些的啦:p,前辈介绍一些吧,多谢多谢!
“人工标注的语料库倒是有好几个”是专门针对命名实体的吗?中文的?好东西呀:D
还像请教一下,感觉现在国内对“命名实体”的定义就是“人名,地名,机构名”,但是个人感觉命名实体应该是一切能映射到现实物体的称谓,国外有做非“人名地名机构名的吗?”
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

感觉国外实体关系抽取这一块挺火的,但是实体关系抽取应该是建立在已经抽取出实体的基础上,会不会是英文的这一块做的挺好的,但是中文的差一些呢?
“中英可用的工具基本都没有多少”那就是还有一些的啦:p,前辈介绍一些吧,多谢多谢!
“人工标注的语料库倒是有好几个”是专门针对命名实体的吗?中文的?好东西呀:D
还像请教一下,感觉现在国内对“命名实体”的定义就是“人名,地名,机构名”,但是个人感觉命名实体应该是一切能映射到现实物体的称谓,国外有做非“人名地名机构名的吗?”

你的问题只要google一下就可以找到成千上万个页面,恕我没那么多时间在这里介绍,文献还得你自己读啊…
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

感觉国外实体关系抽取这一块挺火的,但是实体关系抽取应该是建立在已经抽取出实体的基础上,会不会是英文的这一块做的挺好的,但是中文的差一些呢?
“中英可用的工具基本都没有多少”那就是还有一些的啦:p,前辈介绍一些吧,多谢多谢!
“人工标注的语料库倒是有好几个”是专门针对命名实体的吗?中文的?好东西呀:D
还像请教一下,感觉现在国内对“命名实体”的定义就是“人名,地名,机构名”,但是个人感觉命名实体应该是一切能映射到现实物体的称谓,国外有做非“人名地名机构名的吗?”
老hong误会了,
第一个问题“感觉国外实体关系抽取这一块挺火的,但是实体关系抽取应该是建立在已经抽 取出实体的基础上,会不会是英文的这一块做的挺好的,但是中文的差一些呢?有没有其他的中文命名实体识别工具”
是因为英文有一些可以自由使用的工具,从Weps会议上可以看的出来。但是中文我所知道的只有清华的LTP和中科院的那个ICTCLAS,LTP要申请才能下,中科院的ICTCLAS从在线测试上看好像是没有加上对机构名的识别,所以才想问一下还有没有其他的命名实体识别的工具呢?
第二个问题“中文人工标注的命名实体识别语料库”只知道ACE2005,所以想问一下还有没有其他中文的?
第三个问题”国外有做非人名地名机构名的吗?“是因为最近的一个实验设计到命名实体,但是不只是”人名,地名,机构名“这几种,比如说 ”画板“在现实世界中有一个对应,那么”画板“也是个命名实体,但是关于这种”非人名地名机构名“的确实没找到,所以想请教一下:-)
罗罗嗦嗦说了一大堆,呵呵,请老洪指教:)谢谢!
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

我所知的是哈工大的LTP。
按照你“在现实世界有对应”的标准,所有的物质名词都是NE。
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

老hong误会了,
第一个问题“感觉国外实体关系抽取这一块挺火的,但是实体关系抽取应该是建立在已经抽 取出实体的基础上,会不会是英文的这一块做的挺好的,但是中文的差一些呢?有没有其他的中文命名实体识别工具”
是因为英文有一些可以自由使用的工具,从Weps会议上可以看的出来。但是中文我所知道的只有清华的LTP和中科院的那个ICTCLAS,LTP要申请才能下,中科院的ICTCLAS从在线测试上看好像是没有加上对机构名的识别,所以才想问一下还有没有其他的命名实体识别的工具呢?
第二个问题“中文人工标注的命名实体识别语料库”只知道ACE2005,所以想问一下还有没有其他中文的?
第三个问题”国外有做非人名地名机构名的吗?“是因为最近的一个实验设计到命名实体,但是不只是”人名,地名,机构名“这几种,比如说 ”画板“在现实世界中有一个对应,那么”画板“也是个命名实体,但是关于这种”非人名地名机构名“的确实没找到,所以想请教一下:-)
罗罗嗦嗦说了一大堆,呵呵,请老洪指教:)谢谢!

你这次讲的就清楚多了。如果问问题时站在读者的角度上思考一下就能知道怎样才能快速得到自己想要的答案。发问时要针对特定的问题作明确而重点式的发问,避免太过于空泛或宽广。比如说“人工标注的NER语料库有哪些?”就没有“我已经知道X、Y、Z等人工标注的语料库,请问还有别的吗?”更能体现提问者不是因为懒惰,也不只是简单地发问,而是经过自己检索和探查之后才发问的。若是自己都不愿意花时间去搜一搜,那么试问谁有闲功夫将时间与精力奉献给这样的人呢?

这里说这个不是针对你个人,请不要误会,而是作为这个论坛这些年来的管理员,几乎每天都可以见到各种各样提问的人。请抽空学习一下这个帖子:

【提问的智慧】---提问前必看!
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

我所知的是哈工大的LTP。
按照你“在现实世界有对应”的标准,所有的物质名词都是NE。
是的,我搞错了,是哈工大的LTP:p
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

你这次讲的就清楚多了。如果问问题时站在读者的角度上思考一下就能知道怎样才能快速得到自己想要的答案。发问时要针对特定的问题作明确而重点式的发问,避免太过于空泛或宽广。比如说“人工标注的NER语料库有哪些?”就没有“我已经知道X、Y、Z等人工标注的语料库,请问还有别的吗?”更能体现提问者不是因为懒惰,也不只是简单地发问,而是经过自己检索和探查之后才发问的。若是自己都不愿意花时间去搜一搜,那么试问谁有闲功夫将时间与精力奉献给这样的人呢?

这里说这个不是针对你个人,请不要误会,而是作为这个论坛这些年来的管理员,几乎每天都可以见到各种各样提问的人。请抽空学习一下这个帖子:

【提问的智慧】---提问前必看!
谢谢老洪的帖子“提问的智慧”,确实第一次说的不具体,不明确,自省一下:eek:
 
回复: 打算把中文文章的人名,地名 ,机构名都标注出来,请问各位前辈,有现成的工具吗?

不过还是想请大家谈谈对这三个问题的看法,谢谢!
 
Back
顶部