关于频数标准化问题的疑问

菜鸟请问:
做论文时统计了because在ST3,ST4,ST5和ST6中出现的原始频率分别是357, 724,389和394,总计是1864. 根据标准化公式: raw frequency/running words of the corpus* 100,000 计算后得到的频数分别是170.78, 340.13, 181.34, 174.25那么总计部分的频数标准化是直接把各个标准化后的频数进行相加还是也根据公式求得?为什么呢?
谢谢赐教!
 
回复: 关于频数标准化问题的疑问

就是再把语料库里面的所有字符数统计出来而后用你所得到的原始频率一除就应该得到这个数据咯。
 
回复: 关于频数标准化问题的疑问

you need not compute the relative frequences for so many times--- just use the formula --- (n1+n2+n3+n4)/t1+t2+t3+t4
ni stands for the the absolute frequency of because.(i=1,2,3,4)
ti stands for the total number of sti (i=1,2,3,4)
 
Back
顶部