关于搭配构式分析的一些疑问

最近在阅读《语料库研究方法》搭配构式分析Collosrucion analysisi这一章节。有一个思考:在比较两个类似结构的搭配区别DCA的时候,Gries的方法是分别找出两个结构在某个语料库里的“四个频数值”,然后用费舍精确检验计算出搭配强度。我的问题是:为什么不直接在BNCweb中找出两个结构后面的的搭配词强度表,直接比较一下不就行了么?比如我在BNCweb中先搜be going to后面any verb的搭配强度排序表,再搜will后面any verb的搭配强度排序表。把这两个表拎出来直接对比不就行了么?十年前我们比较两个词的搭配区别,不就是这么简单操作的么?Gries的DCA方法是不是弄复杂了?谢谢。或者说这两个方法原理是一样的?
 
搭配构式分析关注的是lexeme(词位)而不是具体的词形。be going to后面的动词是原形,没有形态变化,但大量构式可能与带有屈折变化的动词共现,这时就不能用传统方法了,而且搭配区式分析使用的统计方法相对于以前也有了重要改进,过去的搭配强度计算方法被Gries证明有很多缺陷。所以搭配构式方法与传统方法是有显著差异的
 
感谢chuepeng老师的问题和ArthurW老师的回复。
大家一起来讨论讨论搭配构式分析是很有意义的。
这方面房印杰老师有过较为细致的梳理:https://corpus.bfsu.edu.cn/info/1072/1371.htm
并有专文发表:房印杰. 搭配构式分析——应用与发展. 现代外语, 2018, (3): 425-435.

就这个案例来看,在实际效果上,其实搭配和搭配构式分析结果比较接近。
搭配构式分析,最核心的理论价值在于构式观念的引入,而不单是词和词的共现。
就算法而言,搭配构式分析里除了delta p,其他方法基本沿用了过往的搭配分析。起初版本里,Gries默认设置的算法为delta p,这是他的原创,考虑到此前搭配算法不考虑搭配方向的问题。后来版本里又默认过fisher's exact test。选择哪个搭配算法,都不算错。研究中可比较不同搭配算法的结果。

搭配构式分析目前没有解决好的一个问题仍然是cell D的问题,表明看这是个算法问题,实际这是个理论问题。
因为这个缺陷的存在,以及其他一些原因,使得如今国际范围内采用搭配构式分析的研究,已经不算太多了。
 
Last edited:
Back
顶部