williamJia
开放语料库项目
目前,语料库分析和检索软件有很多,功能也各不相同,我想开发一个包含大多数常用功能的语料库检索和分析软件(自由软件),请各位老师和同学提供您所需要的需求。
以下是引用 williamJia 在 2006-7-31 18:45:39 的发言:
声明:
我的软件目前还没有处理中文的打算,因为中文的分词一直都没有突破性的进展。
我希望能够开发的是处理专门处理英语的语料库软件,因为目前的软件鱼龙混杂,各有短长,进行语料库分析往往要同时使用几个软件,我个人觉得很不方便,希望能开发一套囊括大部分常用功能的语料库软件。
我现在希望对需求进行整理,以便确定算法。
一个人的力量是有限的,但是大家的力量是无穷的。
Aha! You will be very much appreciated for your effort, but frankly I don't think it is a good idea to develop a tool to deal with English only. Your tool might be functionally almighty, hopefully, but less likely it could be developed as or more powerful or comprehensive than the existing tools like wst4 or antconc in the foreseeable future. Why should you bother to do it?以下是引用 williamJia 在 2006-7-31 18:45:39 的发言:
声明:
我的软件目前还没有处理中文的打算,因为中文的分词一直都没有突破性的进展。
我希望能够开发的是处理专门处理英语的语料库软件,因为目前的软件鱼龙混杂,各有短长,进行语料库分析往往要同时使用几个软件,我个人觉得很不方便,希望能开发一套囊括大部分常用功能的语料库软件。
以下是引用 xusun575 在 2006-8-2 15:56:03 的发言:
I can agree with you but still hope that your forthcoming tool will be unique in processing texts in Chinese, either simplified or traditional.