用UAM Corpus Tool如何标注和检索

本文由 xujiajin2011-02-11 发表於 "语料库标注" 讨论区

  1. xujiajin

    xujiajin 管理员 Staff Member

    代garythird发

    我在用UAM Corpus Tool统计评价资源在文本的使用情况,请问众多文本,我需要依据评价理论体系手工标注吗?

    另外我不会输入命名,请您指点! 我只是从评价体系的态度子系统分析的,其中的情感、判断和鉴赏在这软件的体系编辑器中我会设定,但是设定后我不会enter search query ,请指教!谢谢!
     
  2. volfer

    volfer Moderator

    回复: 用UAM Corpus Tool如何标注和检索



    是的,需要你手工标注。因为UAM只是为你提供了一个平台,方便不会使用XML等标注语言的人做标注,方便你标注完成后检索,但机器不能代替人脑,如何判断某个词是否属于情感,是正面还是负面,是关于happiness, security还是satisfaction,显性还是隐性评价,这些都需要你自己做出判断。

    具体的软件使用方法,包括输入命名等,推荐你再仔细读一下软件的英文使用手册,比中文的更详细一些,更新于2010年10月。
    http://www.wagsoft.com/CorpusTool/documentation.html
     
  3. volfer

    volfer Moderator

    回复: 用UAM Corpus Tool如何标注和检索

    为了提高标注的信度,可以再请一位熟悉评价理论的研究者独立标注一次,然后算一下你们各自标注的inter-rater reliability,用科恩系数(Cohen's kappa coefficient)。
    http://en.wikipedia.org/wiki/Cohen's_kappa
     
  4. 回复: 用UAM Corpus Tool可以分析系统功能语法吗?

    求知各位大师:
    我是个新手,刚接触UAM, 弱弱的问一句,UAM可以用来分析系统功能语法的三个元语言功能吗? 如果可以的话在运用的过程中和评价系统的分析对比,有什么需要注意的地方吗?
    这个问题好低级哦!:confused::D
     
  5. joe

    joe 初级会员

    回复: 用UAM Corpus Tool可以分析系统功能语法吗?

    下面个贴可以回答你的问题。
    http://www.corpus4u.org/forum/showthread.php?t=6039

    关于corpus tool,C坛还有好几个贴,可以搜来看看。
     
  6. 回复: 用UAM Corpus Tool如何标注和检索

    thx
     
  7. 回复: 用UAM Corpus Tool如何标注和检索

    您好!我正在做一篇评价理论的论文,刚好看到这篇帖子。
    我也很关注用UAM来标注的问题。有不少老师给我的建议是做INTER READER RELIABILITY,我的问题是:我本身分析的文本的量比较大,那如果我取其中一段出来做inter reader reliability,即使我和其他标注者的差异不大,那如何证明我在标注其他文本的时候就和标注该文本时是CONSISITANT的呢?因为评价理论是基于语篇语义的,所以对材料中可能出现的词的归类是没有明确的界限的,我觉得自己在标注的时候,一周前和一周后的标注都会有所差别。请前辈指点!
     
  8. 回复: 用UAM Corpus Tool如何标注和检索

    大家可以看看香港CityU的韩礼德研究中心开发的在线标注系统(The Halliday Centre Tagger (HC Tagger) ),很有意思。
    当然你上传或输入的语料以及标注后的语料,很自然地“被”纳入CityU的语料库当中了。
    网址为:http://vistxt.ctl.cityu.edu.hk:8000/html/register.html
     

    附件文件:

  9. 回复: 用UAM Corpus Tool如何标注和检索

    UAM Corpus Tool 统计评价资源在文本中的分布比例,可以编辑系统后,分布比例可以统计出来吗,还是需要人工把评价资源的词先标注好,系统才能统计出比例呢?
     
    Last edited: 2015-06-28
  10. 您好!我正在做一篇评价理论的论文。可是我刚接触UAM corpus tool ,请问标注好评价资源,系统会自动统计出各个评价资源的分布状况吗?
     
  11. 其实上述这些问题我最初也是非常困惑,经过不断实践摸索可以回答一二。首先UAM是基于系统功能语言学的思想来提供自建标注方案的一个灵活平台,涉及关于语义的标注是需要自己首先建立一个标注框架,然后自己的手动标注或自动标注,绝大多数情况是手动标注,只要标注好了就可以进行相关数据的检索。对于自动标注也不是不可能,针对具体的研究是可以进行相应的转换标注的,如词性标注(POS),系统功能语法的语义标注,对于检索也是可以进行一部分的自动化操作的,一句话得市具体的研究目的、研究设计进行相应灵活的标注或检索,它是一个非常灵活的语料标注平台,另外UAM对于自动标注或自动检索的数据准确性有待提高,还需要多次检查确保准确。