另外,这个软件说可以支持用户词典,请问,哪位试过,如何加载用户词典呢?
ICTCLAS2008共享版用户词典使用说明
1、如何加载卸载用户词典
第一次加载用户词典或者需要变更用户词典的时候,直接调用 ImportUserDict(const char *sFilename)即可。下次使用同一部用户词典,不需要再调用该函数,如果在配置文件中设置<UserDict>On</UserDict>,系统会自动加载。在配置文件(Configure.xml)中设置<UserDict>Off</UserDict>,系统会自动将用户词典屏蔽。
2、用户词典格式
(词 词性)
用户词典词性的说明:
1) 所用到的词性标注集,与核心词典词性标注集(可以自行指定)一致
2) 如果没有给出词性或者给出的词性不正确,按照名词处理
3、如何在用户词典中注释
可以在任何地方添加注释内容,注释的方法有:
1)在当前行加上"//",则当前行//后面的内容无效
2)"/*" 至"*/"内容无效,/*必须是每行的开始位置,即:
/*注释内容
kakl
addddddddd*/
注释有效,而
啊 a/*注释内容
kakl
addddddddd*/
注释无效
注意第二种注释方式不支持嵌套
4、用户词典示例
待加载的用户词典应当是一个文本文件,每行不得超过1000个字节,示例如下
/********************************************************
/*1989年春夏之交的政治风波 //政治术语
1989年政治风波
24小时降雪量
24小时降雨量
863计划
ABC防护训练*///前面内容都被注释掉
APEC会议 nz //注释内容:词性为nz
BB机//注释内容:没有给出词性,按照"n"处理
BP机 nzert//词性无效,按照"n"处理
C2系统
C3I系统
C3系统
C4ISR系统
C4I系统
CCITT建议 t
********************************************************/
5、例子
//初始化 ICTCLAS
if(!ICTCLAS_Init())
{
printf("ICTCLAS INIT FAILED!\n");
return -1;
}
printf("ICTCLAS init success!\n");
//未加词典
char sString[1000] = "点击下载超女纪敏佳深受观众喜爱。禽流感爆发在非典之后。";
const char * sResult;
printf("Before User-defined dictionary used:\n");
sResult = ICTCLAS_ParagraphProcess(sString,0);
printf("%s\n",sResult);
//导入词典
int iWordCount = ICTCLAS_ImportUserDict("userdict.txt");
printf("import %d user words!\n",iWordCount);
//加词典后
printf("After User-defined dictionary used:\n");
sResult = ICTCLAS_ParagraphProcess(sString,0);
printf("%s\n",sResult);
//file paragraphprocess
ICTCLAS_FileProcess("test.txt","test_result.txt",0);
//loop
printf("input you string to paragraph!(input \"q\" to exit)\n");
scanf("%s",sString);
while(strcmp(sString,"q")!=0)
{
sResult = ICTCLAS_ParagraphProcess(sString,0);
printf("%s\n",sResult);
printf("input you string to paragraph!(input \"q\" to exit)\n");
scanf("%s",sString);
}
//释放资源
ICTCLAS_Exit();
Output
/**********************************************************************************
ICTCLAS init success!
Before User-defined dictionary used:
点 击 下载 超女 纪敏佳 深受 观众 喜爱 。 禽流感 爆发 在 非典 之后 。
import 3 user words!
After User-defined dictionary used:
点击 下载 超女 纪敏佳 深受 观众 喜爱 。 禽流感 爆发 在 非典 之后 。
**********************************************************************************/
userdict.txt词典内容
/**************************************
点击 v
**************************************/
以上资料来自
www.ictclas.org。
——Robert Young