我在用SPSS作为分析工具时出现了疑问,无奈本人对统计方法的基础不是太熟悉,所以请各位多多指点。
我有105个作文样本,选出来30个作为高分组,30个作为低分组,我要看高低分组与错误频率的关系。我想出来如下两种方法:
1. 高分组错误个数为86个,把高分组的字数合并。
低分组错误个数为110个,把低分组的字数合并。
通过这四个数据可以采用卡方检验看这个两个组别之间的差别是否显著。
2。高分组的作文1号中有错误10个,用10除高分组1号作文的字数进行标准化,这样每个都进行计算,共30个。
低分组的作文1号中有错误12个,用12除低分组1号作文的字数进行标准化,这样每个都进行计算,共30次。
这样就可以得到高低分组各30个样本的标准错误值
用SPSS进行独立样本T检验差异
我似乎觉得两种方法都可行,但是数据是有很大的差异的,但是我考虑到第一种方法是把高分组看成是一个整体来看待的,是语料库中的一般方法,是不是应该选用前者呢?
我有105个作文样本,选出来30个作为高分组,30个作为低分组,我要看高低分组与错误频率的关系。我想出来如下两种方法:
1. 高分组错误个数为86个,把高分组的字数合并。
低分组错误个数为110个,把低分组的字数合并。
通过这四个数据可以采用卡方检验看这个两个组别之间的差别是否显著。
2。高分组的作文1号中有错误10个,用10除高分组1号作文的字数进行标准化,这样每个都进行计算,共30个。
低分组的作文1号中有错误12个,用12除低分组1号作文的字数进行标准化,这样每个都进行计算,共30次。
这样就可以得到高低分组各30个样本的标准错误值
用SPSS进行独立样本T检验差异
我似乎觉得两种方法都可行,但是数据是有很大的差异的,但是我考虑到第一种方法是把高分组看成是一个整体来看待的,是语料库中的一般方法,是不是应该选用前者呢?