求助:如何用标注集去标注语料库

现在我在用CRF++去识别领域命名实体,需要一个电子商品语料库(如:笔记本,手机等),苦于自己整理,所以现在遇到的问题是如何用自己已经定义好的标注集去标注已经过分词和词性标注的普通语料库?除了手工,还有什么方面的方法?
如:标注集{B,I,O}
需要的结果是:
联想 nz B
THINKPAD x I
近期 t O
几乎 d O
全 a O
系列 q O
笔记本电脑 n B
降价 v 0
促销 v 0
 
回复: 求助:如何用标注集去标注语料库

可以使用批量替换的办法,但是需要预制一个替换词库。之后再手工校订,这是我们最常用的办法,可以节省很多力气。
 
回复: 求助:如何用标注集去标注语料库

可以使用批量替换的办法,但是需要预制一个替换词库。之后再手工校订,这是我们最常用的办法,可以节省很多力气。
麻烦能不能说的具体点,因为我不是搞这方面的,刚开始学,最好举个例子!呵呵,谢谢了哦
 
Back
顶部