,它的哲学体系是开放的,而不是封闭的,有大量的第三方工具可以选用。
19楼说得对,适合自己的就是最好的。补充一句,熟悉的就是最好的。 我用perl好些年了,感觉对语言尤其是字符串处理非常方便。另外国外许多相关的软件程序是在Unix类平台上开发的,用perl更是自然而然的事,何况perl是跨平台的。这方面VB之类的语言恐怕有些限制
请问,如何一次处理将子目录里的文件进行处理?
以下是我认为语料库开发应该解决的几个基本问题:
1)快速统计词频和快速排序
2)检索(正则表达式)
3)统计collocate(包括各类统计算法的实现,如:MI,Z-Scores等)
我写的软件基本围绕这几个问题
http://www.corpus4u.org/showthread.php?t=4873
a friend of mine just sent me a ecopy of this book
Teaching yourself perl 5 in 21 days
i wanted to upload it here
unfortunately it is 1.6 mb even after zipping.
perhaps i'll try to sent it to our gmail.
大多数的编程教程举的例子都跟语言处理不太相干,对象更不是语言学家。不同于一般的教程,这两本书的作者本身就是搞语言的,对怎么用简单的程序处理语言问题感同身受,书里的实例都是语言处理方面的,因此文科出身的读者想了解编程可以照猫画虎实际操练,何乐不为? 当然,对于高级用户来说,就没有必要看了。