按照前辈列的进行操作,出现Error in eval(expr, envir, enclos) : object 'Freq' not found,不知道数据格式哪里错了,能否请前辈操作截图?感谢!回复: 请教:如何进行多个子语料库(7个)在某10个观察维度上频数间的两两差异显著性检验?谢谢!
其实我觉得用原始频数对比就可以了,画个柱状图啥的。
如果非要用统计模型的话,可以试试 对数-线性模型(log-linear model)
把你的数据按下列格式排列,保存到文本文件 data.txt:
Corpus Feature Freq
corpus1 Feature1 freq_1_1
corpus1 Feature2 freq_1_2
......
corpus7 Feature10 freq_7_10
然后运行统计软件R,输入下列命令
rm(list=ls(all=T))
data <- read.table(file=choose.files(),header=T,sep="\t",quote="") # open data.txt
model <- glm(Freq ~ Corpus * Feature, family="poisson", data=data)
summary(model)
然后根据统计结果解读数据。
感谢前辈,我对intercept和estimate下面的数据不懂,前辈若有时间请稍作解释,感谢!你好,附件是一些测试数据的结果。Freq 那一列应该是频率数字。