[Download] ICTCLAS2008

#61
回复: [Download] ICTCLAS2008

ICTCLAS如果能再做两点改进,将更优秀,在处理少有规模的语料时更方便:
1)能
同时处理多个文件夹和子目录下的文件。现在版本一次只能处理一个文件夹里的文件
2)分词后文本可由用户自行指定存放处。
现在的只自动存于原文件夹。

如果上两项已经实现,是我没试出来,请指正帮助。

非常好的软件,再次感谢分享。

 
#62
回复: [Download] ICTCLAS2008

ICTCLAS如果能再做两点改进,将更优秀,在处理少有规模的语料时更方便:
1)能
同时处理多个文件夹和子目录下的文件。现在版本一次只能处理一个文件夹里的文件
2)分词后文本可由用户自行指定存放处。
现在的只自动存于原文件夹。

如果上两项已经实现,是我没试出来,请指正帮助。

非常好的软件,再次感谢分享。

Thank you for pointing out the inconvenience in using this little tool.
 
#64
the interface looks compact and intuitive!
thanks a lot for your consisent effort for all.
could you upload it to corpus4u.gamil.com for sharing?
 
Last edited:
#66
回复: [Download] ICTCLAS2008

很感谢! “相当的”感谢!

打开: 可否提供“选择文件”和“选择目录(包括子目录)”两种方式。
存放:可否“原目录下”和“另存于(指定目录--浏览或标明)”两种。
“有无分词标记”:是不是指“加不加词性标记”?

不好意思,还有个奢望:因为自动分词总有不可避免的错误,可否让软件对“分词后文本”标注词性?
这样中间就可进行人工分词校对, 程序为: ICTCLAS分词(不加词性标记)--人工校对分词结果--ICTCLAS加词性标记。
 
#68
回复bdjim

很感谢! “相当的”感谢!

打开: 可否提供“选择文件”和“选择目录(包括子目录)”两种方式。
存放:可否“原目录下”和“另存于(指定目录--浏览或标明)”两种。
“有无分词标记”:是不是指“加不加词性标记”?

不好意思,还有个奢望:因为自动分词总有不可避免的错误,可否让软件对“分词后文本”标注词性?
这样中间就可进行人工分词校对, 程序为: ICTCLAS分词(不加词性标记)--人工校对分词结果--ICTCLAS加词性标记。
bdjim您好!
1 “打开”仅提供选择目录(包括子目录)一种方式。
2 “存放”仅能“另存为”。
3 “有无分词标记”是指“加不加词性标记”。
4 您可以通过手工方式实现您的“奢望”。
 
#71
回复: [Download] ICTCLAS2008

“打开”没问题, “存放”把文件存到了指定文件夹的上一层目录。 不过已经够好了。
 
#72
回复: [Download] ICTCLAS2008

前面“奢望”那层意思没说明白, 是这样:

软件标词性利用了短语搭配规则提高标注准确性,不是简单的词表匹配,但目前版本只能对相连字串(字间未加空格)使用这些规则,先分词后做人工校对,词间加了空格,在用ICTCLAS标词性,那些规则就不管用了。 详情可用下面两个例子测试:

1)很弯的浏阳河弯了九个弯才到湘江。
2)骑马上二奎那儿的人马上就会回来。
 
#74
回复: [Download] ICTCLAS2008

前面“奢望”那层意思没说明白, 是这样:

软件标词性利用了短语搭配规则提高标注准确性,不是简单的词表匹配,但目前版本只能对相连字串(字间未加空格)使用这些规则,先分词后做人工校对,词间加了空格,在用ICTCLAS标词性,那些规则就不管用了。 详情可用下面两个例子测试:

1)很弯的浏阳河弯了九个弯才到湘江。
2)骑马上二奎那儿的人马上就会回来。
您如果是研究急需,请您与我联系一下。我对您的需要还是有些不太明白。
 
#77
回复: [Download] ICTCLAS2008

我和rfh2054是同样的问题, 调整时间了还是一样. 不知道什么原因啊, 还请前辈们指点.
 
顶部