各位大神:
运行ICTCLAS 分词 结果如下:
出生/v 证明/v 自/p 填/v 单/ag
上海/ns 卷/q 高/a 考题/n 型/k
上面是运行下来的结果,和期望的效果有些差别,怎样才能提高分词的准确度?
用户词典怎么批量导入词库
m_dictCore.AddItem("新浪",'t'*256,200);
m_dictCore.Optimum();
m_dictCore.Save("./data/11.dct");
这样可以单个加入一个词,并在下次分词时能够识别,问题:我想导入一个10万的词库,该怎么导入?
下面是我批量导入的代码,可是最后结果不行?
while ( fgets(in,100,frp) != NULL )
{
printf("%s",in);
m_dictCore.AddItem(in,'n'*256,-2000);
}
m_dictCore.Optimum();
m_dictCore.Save("./data/11.dct");
运行ICTCLAS 分词 结果如下:
出生/v 证明/v 自/p 填/v 单/ag
上海/ns 卷/q 高/a 考题/n 型/k
上面是运行下来的结果,和期望的效果有些差别,怎样才能提高分词的准确度?
用户词典怎么批量导入词库
m_dictCore.AddItem("新浪",'t'*256,200);
m_dictCore.Optimum();
m_dictCore.Save("./data/11.dct");
这样可以单个加入一个词,并在下次分词时能够识别,问题:我想导入一个10万的词库,该怎么导入?
下面是我批量导入的代码,可是最后结果不行?
while ( fgets(in,100,frp) != NULL )
{
printf("%s",in);
m_dictCore.AddItem(in,'n'*256,-2000);
}
m_dictCore.Optimum();
m_dictCore.Save("./data/11.dct");