用UAM Corpus Tool如何标注和检索

xujiajin

管理员
Staff member
代garythird发

我在用UAM Corpus Tool统计评价资源在文本的使用情况,请问众多文本,我需要依据评价理论体系手工标注吗?

另外我不会输入命名,请您指点! 我只是从评价体系的态度子系统分析的,其中的情感、判断和鉴赏在这软件的体系编辑器中我会设定,但是设定后我不会enter search query ,请指教!谢谢!
 
回复: 用UAM Corpus Tool如何标注和检索

代garythird发

我在用UAM Corpus Tool统计评价资源在文本的使用情况,请问众多文本,我需要依据评价理论体系手工标注吗?

另外我不会输入命名,请您指点! 我只是从评价体系的态度子系统分析的,其中的情感、判断和鉴赏在这软件的体系编辑器中我会设定,但是设定后我不会enter search query ,请指教!谢谢!



是的,需要你手工标注。因为UAM只是为你提供了一个平台,方便不会使用XML等标注语言的人做标注,方便你标注完成后检索,但机器不能代替人脑,如何判断某个词是否属于情感,是正面还是负面,是关于happiness, security还是satisfaction,显性还是隐性评价,这些都需要你自己做出判断。

具体的软件使用方法,包括输入命名等,推荐你再仔细读一下软件的英文使用手册,比中文的更详细一些,更新于2010年10月。
http://www.wagsoft.com/CorpusTool/documentation.html
 
回复: 用UAM Corpus Tool如何标注和检索

为了提高标注的信度,可以再请一位熟悉评价理论的研究者独立标注一次,然后算一下你们各自标注的inter-rater reliability,用科恩系数(Cohen's kappa coefficient)。
http://en.wikipedia.org/wiki/Cohen's_kappa
 
回复: 用UAM Corpus Tool可以分析系统功能语法吗?

求知各位大师:
我是个新手,刚接触UAM, 弱弱的问一句,UAM可以用来分析系统功能语法的三个元语言功能吗? 如果可以的话在运用的过程中和评价系统的分析对比,有什么需要注意的地方吗?
这个问题好低级哦!:confused::D
 
回复: 用UAM Corpus Tool可以分析系统功能语法吗?

求知各位大师:
我是个新手,刚接触UAM, 弱弱的问一句,UAM可以用来分析系统功能语法的三个元语言功能吗? 如果可以的话在运用的过程中和评价系统的分析对比,有什么需要注意的地方吗?
这个问题好低级哦!:confused::D

下面个贴可以回答你的问题。
http://www.corpus4u.org/forum/showthread.php?t=6039

关于corpus tool,C坛还有好几个贴,可以搜来看看。
 
回复: 用UAM Corpus Tool如何标注和检索

您好!我正在做一篇评价理论的论文,刚好看到这篇帖子。
我也很关注用UAM来标注的问题。有不少老师给我的建议是做INTER READER RELIABILITY,我的问题是:我本身分析的文本的量比较大,那如果我取其中一段出来做inter reader reliability,即使我和其他标注者的差异不大,那如何证明我在标注其他文本的时候就和标注该文本时是CONSISITANT的呢?因为评价理论是基于语篇语义的,所以对材料中可能出现的词的归类是没有明确的界限的,我觉得自己在标注的时候,一周前和一周后的标注都会有所差别。请前辈指点!
 
回复: 用UAM Corpus Tool如何标注和检索

大家可以看看香港CityU的韩礼德研究中心开发的在线标注系统(The Halliday Centre Tagger (HC Tagger) ),很有意思。
当然你上传或输入的语料以及标注后的语料,很自然地“被”纳入CityU的语料库当中了。
网址为:http://vistxt.ctl.cityu.edu.hk:8000/html/register.html
 

附件

  • TaggerManual.pdf
    7.2 MB · 浏览: 116
回复: 用UAM Corpus Tool如何标注和检索

UAM Corpus Tool 统计评价资源在文本中的分布比例,可以编辑系统后,分布比例可以统计出来吗,还是需要人工把评价资源的词先标注好,系统才能统计出比例呢?
 
Last edited:
您好!我正在做一篇评价理论的论文。可是我刚接触UAM corpus tool ,请问标注好评价资源,系统会自动统计出各个评价资源的分布状况吗?
 
其实上述这些问题我最初也是非常困惑,经过不断实践摸索可以回答一二。首先UAM是基于系统功能语言学的思想来提供自建标注方案的一个灵活平台,涉及关于语义的标注是需要自己首先建立一个标注框架,然后自己的手动标注或自动标注,绝大多数情况是手动标注,只要标注好了就可以进行相关数据的检索。对于自动标注也不是不可能,针对具体的研究是可以进行相应的转换标注的,如词性标注(POS),系统功能语法的语义标注,对于检索也是可以进行一部分的自动化操作的,一句话得市具体的研究目的、研究设计进行相应灵活的标注或检索,它是一个非常灵活的语料标注平台,另外UAM对于自动标注或自动检索的数据准确性有待提高,还需要多次检查确保准确。
 
Back
顶部