求语料中错误标注的检索思路

flycap

论坛混混
本人最近在做一个历时语料库的检索分析系统,语料中包含了手工标注的错误分类,错误类型一共有61项,但在进行到错误信息统计分析时犯了难,目前只做出了错误数量的分类统计,感觉程序写出来不解渴,关于错误统计方面的资料很少,希望各位高手能够提供一些思路,感激不尽。截图如下:
 

附件

  • 11.jpg
    11.jpg
    102.8 KB · 浏览: 24
回复: 求语料中错误标注的检索思路

没人提出建议么?自己顶自己。
 
按类别统计错误就有意义。既然标出了60多类错误,看看是否能够
把因素分析 (factor analysis) 用起来。
 
回复: 求语料中错误标注的检索思路

不要限死在错误标注。应当允许不同的标注集。只要符合合适邀请的标注格式,应该都能以这种矩阵呈现。再增加一些descriptive statistics的数据报告会比较好。因子分析,倒是可以到SPSS里做。
 
回复: 求语料中错误标注的检索思路

谢谢两位管理员的宝贵意见,我考虑一下是否能添加一些让软件更具灵活性的功能,比如标准差,全距,中位数等。
 
Back
顶部