关于搭配构式分析的一些疑问

chuepeng · 2024-07-05

最近在阅读《语料库研究方法》搭配构式分析Collosrucion analysisi这一章节。有一个思考：在比较两个类似结构的搭配区别DCA的时候，Gries的方法是分别找出两个结构在某个语料库里的“四个频数值”，然后用费舍精确检验计算出搭配强度。我的问题是：为什么不直接在BNCweb中找出两个结构后面的的搭配词强度表，直接比较一下不就行了么？比如我在BNCweb中先搜be going to后面any verb的搭配强度排序表，再搜will后面any verb的搭配强度排序表。把这两个表拎出来直接对比不就行了么？十年前我们比较两个词的搭配区别，不就是这么简单操作的么？Gries的DCA方法是不是弄复杂了？谢谢。或者说这两个方法原理是一样的？

ArthurW · 2025-02-15

搭配构式分析关注的是lexeme（词位）而不是具体的词形。be going to后面的动词是原形，没有形态变化，但大量构式可能与带有屈折变化的动词共现，这时就不能用传统方法了，而且搭配区式分析使用的统计方法相对于以前也有了重要改进，过去的搭配强度计算方法被Gries证明有很多缺陷。所以搭配构式方法与传统方法是有显著差异的

xujiajin · 2025-02-17

感谢chuepeng老师的问题和ArthurW老师的回复。
大家一起来讨论讨论搭配构式分析是很有意义的。
这方面房印杰老师有过较为细致的梳理：https://corpus.bfsu.edu.cn/info/1072/1371.htm
并有专文发表：房印杰. 搭配构式分析——应用与发展. 现代外语, 2018, (3): 425-435.

就这个案例来看，在实际效果上，其实搭配和搭配构式分析结果比较接近。
搭配构式分析，最核心的理论价值在于构式观念的引入，而不单是词和词的共现。
就算法而言，搭配构式分析里除了delta p，其他方法基本沿用了过往的搭配分析。起初版本里，Gries默认设置的算法为delta p，这是他的原创，考虑到此前搭配算法不考虑搭配方向的问题。后来版本里又默认过fisher's exact test。选择哪个搭配算法，都不算错。研究中可比较不同搭配算法的结果。

搭配构式分析目前没有解决好的一个问题仍然是cell D的问题，表明看这是个算法问题，实际这是个理论问题。
因为这个缺陷的存在，以及其他一些原因，使得如今国际范围内采用搭配构式分析的研究，已经不算太多了。

chuepeng · 2025-02-18

非常感谢两位老师的解答。我来看一看。

关于搭配构式分析的一些疑问

chuepeng

ArthurW

xujiajin

管理员

chuepeng