如何计算语法结构(非词语间搭配)的显著性

最近《外语教学与研究》发表了一篇文章,《英语get-被动句的生成句法研究》,我发现里面有些问题。例如:

(8)it got invented/built/made/created in 192.

作者认为依据生成语法这样的句子是不成立的,因为“get-被动句中也不接受例(8)中的“创造”类被动动词,因为该类动词的逻辑并与还没有成为存在物,自然不可能收到一个事件的作用”.
这一说法完全违背语言常识,而且我依据语料库找到了很多这样的结构,但如何来计算他的显著性呢?因为一般的显著性都是有关词语间的搭配的,而语法结构的显著性如何计算呢?
1. 统计语料库中这类创造类动词过去分词的频数,然后是get的频数以及两种结构的共现频数,然后计算有关数值吗?
2. 记得杨慧中教授主编的《语料库语言学导论》中提到,如果频数达到3就可以算有统计学上的意义了。
我估计要按第一种方法计算,可能会达不到统计学上的显著意义,而且创造类得动词也太多,根本无法统计。
但第二种方法就面临语料库大小的问题,语料库太大,3就没什么意义。语料库大小与频数之间的关系没有确定的说法
望大家提供解决语法结构,比如“get+创造类动词过去分词”,在语料库中是否具有统计意义上的显著性的方法。
也欢迎提供参相关参考文献。
谢谢!
 
回复: 如何计算语法结构(非词语间搭配)的显著性

:)没有仔细看,不太明白所提问题。

如果只是要验证语法形式间的显著,个人认为可以套用词汇搭配的方法,将词换为POS码即可。语料库检索方法依旧。

仅供参考。
 
Back
顶部