ICTCLAS如果能再做两点改进,将更优秀,在处理少有规模的语料时更方便:
1)能同时处理多个文件夹和子目录下的文件。现在版本一次只能处理一个文件夹里的文件
2)分词后文本可由用户自行指定存放处。现在的只自动存于原文件夹。
如果上两项已经实现,是我没试出来,请指正帮助。
非常好的软件,再次感谢分享。
修改后的界面如附图。
请您多提宝贵意见。谢谢!
很感谢! “相当的”感谢!
打开: 可否提供“选择文件”和“选择目录(包括子目录)”两种方式。
存放:可否“原目录下”和“另存于(指定目录--浏览或标明)”两种。
“有无分词标记”:是不是指“加不加词性标记”?
不好意思,还有个奢望:因为自动分词总有不可避免的错误,可否让软件对“分词后文本”标注词性?
这样中间就可进行人工分词校对, 程序为: ICTCLAS分词(不加词性标记)--人工校对分词结果--ICTCLAS加词性标记。
“打开”没问题, “存放”把文件存到了指定文件夹的上一层目录。 不过已经够好了。
前面“奢望”那层意思没说明白, 是这样:
软件标词性利用了短语搭配规则提高标注准确性,不是简单的词表匹配,但目前版本只能对相连字串(字间未加空格)使用这些规则,先分词后做人工校对,词间加了空格,在用ICTCLAS标词性,那些规则就不管用了。 详情可用下面两个例子测试:
1)很弯的浏阳河弯了九个弯才到湘江。
2)骑马上二奎那儿的人马上就会回来。
求救:为啥无法运行?显示“没有找到ictclas30.dll,。。。?
我和rfh2054是同样的问题, 调整时间了还是一样. 不知道什么原因啊, 还请前辈们指点.