老早以前有一次摆弄SPSS的时候,突然觉得对搭配词作量化分析并不需要十分高端的工具,相对简单明了的Excel就可以完成任务。所以一时兴起,整出一套用Excel分析、统计词频数据的方法。后来发现颇有一些朋友对此感兴趣,并且一些朋友问我关于这种"工具"怎么使用的问题。今天又看了看当初发的一些帖子,觉得那时候说得还是不够清楚,想再解释一下。
当初做了比较详细的说明,并上传了一些EXCEL表格,但似乎我对两点概念强调得不够。首先,我有意无意地把这些表格搞成貌似"工具"的东东,其实这些表格仅仅是一些例子罢了。此外,当初初陈述这种方法的时候我用了"Excel用作语料库分析工具"这样的说法,也有些欠妥,所谓语料库分析工具,包含很多类型的软件等,比如检索工具等。所以EXCEL只是一个对词频等数据进行分析的环境,既可以在其中构建精密具体的解决方案,也可以用作演算纸、计算器,具体的方法灵活多样。
从关于该方法的一些问题可以看出来,有的朋友似乎对Excel并不十分熟悉,但对这些貌似“工具”的表格很感兴趣。对此我提一点建议:Excel其实相当容易,一旦摸熟Excel的基本应用,只要有语料库量化分析的基础,Excel立刻就变成一张可以信手写写划划的演算纸。当初我把Excel和语料库的量化分析联想在一起的时候,只是有why not Excel这样一个模糊的想法,很想验证一下,其实那个时候我还根本不会用Excel。搞了本书,在电脑前面琢磨了一天之后就有了两种感觉:Excel不过如此、用Excel做这个事情太方便了。那时很高兴、很有兴致,很快鼓捣出来那些表格和简单的说明。
刚才提到只要有语料库量化分析的基础,EXCEL就怎么怎么着。关于这个我想再谈谈想法。语料库分析方面的确有很多工具,但我认为我们应该争取达到一种手中无刀心中有刀的境界。也就是说,把基本理论、基本方法掌握扎实很重要,语言学不用多说,统计也是该认真学一下的,搞清楚量化分析的原理,工具的问题就很容易解决了。拿词语搭配说事,虽然分析的套路很多,但本质上都是几个简单的模式:以概率为基础,根据词语的分布作方差分析或打分,借鉴统计学中假设检验的方法。
此外,推荐两个学习统计学的网站
http://davidmlane.com/hyperstat/
http://onlinestatbook.com/
都是英文的,不过都是很好的东西。关于统计学的某些教材,甚至是经典,不知道朋友们是不是和我一个感觉:可以学到一些“怎么办、怎么用”,但很多基础概念还是搞不懂,尤其是对于自学者而言。如果想找些有助于“搞懂”的材料,这两个网站里着实有些好东西。
当初做了比较详细的说明,并上传了一些EXCEL表格,但似乎我对两点概念强调得不够。首先,我有意无意地把这些表格搞成貌似"工具"的东东,其实这些表格仅仅是一些例子罢了。此外,当初初陈述这种方法的时候我用了"Excel用作语料库分析工具"这样的说法,也有些欠妥,所谓语料库分析工具,包含很多类型的软件等,比如检索工具等。所以EXCEL只是一个对词频等数据进行分析的环境,既可以在其中构建精密具体的解决方案,也可以用作演算纸、计算器,具体的方法灵活多样。
从关于该方法的一些问题可以看出来,有的朋友似乎对Excel并不十分熟悉,但对这些貌似“工具”的表格很感兴趣。对此我提一点建议:Excel其实相当容易,一旦摸熟Excel的基本应用,只要有语料库量化分析的基础,Excel立刻就变成一张可以信手写写划划的演算纸。当初我把Excel和语料库的量化分析联想在一起的时候,只是有why not Excel这样一个模糊的想法,很想验证一下,其实那个时候我还根本不会用Excel。搞了本书,在电脑前面琢磨了一天之后就有了两种感觉:Excel不过如此、用Excel做这个事情太方便了。那时很高兴、很有兴致,很快鼓捣出来那些表格和简单的说明。
刚才提到只要有语料库量化分析的基础,EXCEL就怎么怎么着。关于这个我想再谈谈想法。语料库分析方面的确有很多工具,但我认为我们应该争取达到一种手中无刀心中有刀的境界。也就是说,把基本理论、基本方法掌握扎实很重要,语言学不用多说,统计也是该认真学一下的,搞清楚量化分析的原理,工具的问题就很容易解决了。拿词语搭配说事,虽然分析的套路很多,但本质上都是几个简单的模式:以概率为基础,根据词语的分布作方差分析或打分,借鉴统计学中假设检验的方法。
此外,推荐两个学习统计学的网站
http://davidmlane.com/hyperstat/
http://onlinestatbook.com/
都是英文的,不过都是很好的东西。关于统计学的某些教材,甚至是经典,不知道朋友们是不是和我一个感觉:可以学到一些“怎么办、怎么用”,但很多基础概念还是搞不懂,尤其是对于自学者而言。如果想找些有助于“搞懂”的材料,这两个网站里着实有些好东西。