思 思琦tracy 2016-02-11 #1 大家好! 我近期用Andrea Nini (2014)开发的多维度分析软件处理文本(multidimensional analysis tagger),发现生成的基础数据z分数,出现以下状况,感觉不是很对劲。为什么数值很多都是一样的呢?不止这几组截图,还有很多组都出现这样的情况。想请大家帮忙看看是怎么回事? 还有,Nini这个软件中报告的标注码在每个文本中出现的频率是每千词么?为什么我在这个工具说明中看到的是per 100 tokens呢? 附件 p1.png 10 KB · 浏览: 9 p2.png 4.8 KB · 浏览: 9 p3.png 5.3 KB · 浏览: 8
大家好! 我近期用Andrea Nini (2014)开发的多维度分析软件处理文本(multidimensional analysis tagger),发现生成的基础数据z分数,出现以下状况,感觉不是很对劲。为什么数值很多都是一样的呢?不止这几组截图,还有很多组都出现这样的情况。想请大家帮忙看看是怎么回事? 还有,Nini这个软件中报告的标注码在每个文本中出现的频率是每千词么?为什么我在这个工具说明中看到的是per 100 tokens呢?
思 思琦tracy 2016-02-12 #3 作者 qhdjason: 如果特征原始频率一样,z 值也应一样。 猜测是否数据中有很多原始频率为 0 或 1 的特征。 p.s. 第三张不是 z 值吧? Click to expand... 谢谢你的解答!第三个的确是z值,,,不知道这是出了什么问题,结果显然不太对.......
作者 qhdjason: 如果特征原始频率一样,z 值也应一样。 猜测是否数据中有很多原始频率为 0 或 1 的特征。 p.s. 第三张不是 z 值吧? Click to expand... 谢谢你的解答!第三个的确是z值,,,不知道这是出了什么问题,结果显然不太对.......