Haiyang Ai Administrator 2010-05-08 #2 回复: 语料库中如何检索地名? 除非你的语料已经标注该信息,否则不太好检索。其实,有些地名人都难以辨识,计算机,或程序该怎么写呢? 不过,在这一方面,你可以参考自然语言处理 (NLP) 的 Named entity recognition 的相关研究。 http://en.wikipedia.org/wiki/Named_entity_recognition
回复: 语料库中如何检索地名? 除非你的语料已经标注该信息,否则不太好检索。其实,有些地名人都难以辨识,计算机,或程序该怎么写呢? 不过,在这一方面,你可以参考自然语言处理 (NLP) 的 Named entity recognition 的相关研究。 http://en.wikipedia.org/wiki/Named_entity_recognition
Haiyang Ai Administrator 2010-05-08 #5 回复: 语料库中如何检索地名? 作者 seanxpq: 如果自己能弄个地名词表就可以了。http://www.placenames.com/ Click to expand... 这个方法看似不错,但也存在一些问题。比如,地名的变化(燕京到底是地名,还是啤酒名),新地名的添加,诸如此类,连 GPS 都年年更新,这个地名词表要维持其时效性,恐怕不太容易。再次,有些地名,人都难以做判断,比如两路,八路,九路,古城,山城,再智能的程序,也会出问题的。 当然,很大程度上取决于研究问题,你感兴趣的到底是语言学上面的高层次的问题,还是仅仅是地名的识别,如果是后者,那么可以看看我上面提到的研究方向。
回复: 语料库中如何检索地名? 作者 seanxpq: 如果自己能弄个地名词表就可以了。http://www.placenames.com/ Click to expand... 这个方法看似不错,但也存在一些问题。比如,地名的变化(燕京到底是地名,还是啤酒名),新地名的添加,诸如此类,连 GPS 都年年更新,这个地名词表要维持其时效性,恐怕不太容易。再次,有些地名,人都难以做判断,比如两路,八路,九路,古城,山城,再智能的程序,也会出问题的。 当然,很大程度上取决于研究问题,你感兴趣的到底是语言学上面的高层次的问题,还是仅仅是地名的识别,如果是后者,那么可以看看我上面提到的研究方向。
P peachyxy 2010-05-09 #8 回复: 语料库中如何检索地名? 比方说一个地名,在很多时候可以代指一个群体,如:Alabama said……,这里的Alama就不再是指这个城市了,而是用来指代该城市的官方人员,政府之类的 我的问题就是怎样在语料库中把这种类似的用法索引出来,并进行统计,分析
回复: 语料库中如何检索地名? 比方说一个地名,在很多时候可以代指一个群体,如:Alabama said……,这里的Alama就不再是指这个城市了,而是用来指代该城市的官方人员,政府之类的 我的问题就是怎样在语料库中把这种类似的用法索引出来,并进行统计,分析
大 大漠孤烟 2010-05-17 #11 回复: 语料库中如何检索地名? 看看这个这个 CCRL :http://202.112.195.6:800/ 在词检索下直接有 地名 和 处所 检索 附件 11111.jpg 81 KB · 浏览: 6