自定义赋码的语料库标注工具?

本文由 Ches_HZ2016-04-11 发表於 "语料库标注" 讨论区

  1. 求助~
    硕士论文想运用语料库软件来研究语篇中的隐喻,语料库不大,打算采用手工赋码方式。
    已确定需要赋码的种类和赋码规则,但是一个字一个字打来赋码十分耗时,不知道有没有工具可以自定义tag,然后每个词对应选择tag就(半)自动赋码?

    比如这句:
    He defended his argument.

    我想要给defended赋码为「MRW」(metaphor-related word)。tag set里包括的其他码包括「码2」、「码3」、「码4」。希望找到一个软件让我可以在某个词的地方,点击tag set里的「码2」就自动在词汇后面生成赋码,如这个形式:
    He defended_MRW his argument.

    不知道有没有现成的软件,或者相似的软件供修改使用?

    小白在此谢谢啦!
     
  2. 同问。。。对这个问题也很感兴趣。
     
  3. 我现在正在用word的剪贴板/簿功能做标注,就是把tag分别复制,然后存储在剪贴板里。看到需要赋码的地方,就选择剪贴板里对应的tag复制到词的后面。不过还是挺慢的,继续等资深corpus analyst回复中。
     
  4. 用Word自制语料标注工具
    http://blog.sina.cn/dpool/blog/s/blog_651a9e980101h71t.html
    要做基于语料库的研究,免不了要进行标注处理工作。MS-word是大家非常熟悉的文字处理工具。稍加改造便可以制作自己的语料标注工具。在熟悉的环境下进行工作,是不是会少了些忐忑的感觉。下面就来介绍一下如何制作标注工具。
    一、设计自己的标注体系, 即赋码集, 比如/Ojg表示机构等等。
    二、在word的菜单栏上找到“插入”再往下找到“自动图文集”
    [​IMG]X

    三、 在“自动文图文集”对话框下编辑和“添加”自己的赋码,如下
    [​IMG]
    四、完成所有的赋码编辑之后,转到菜单栏“工具”下的“自定义”,并勾选“自动图文集”前的复选框,如下:
    [​IMG]
    五、单击“自定义”对话框下的功能选项卡“命令”,如下图:
    [​IMG]
    右边“命令”下的框内列车了自己的编辑的赋码集,用鼠标将框内的赋码一一拖到Word的菜单栏上,即可。如下图所示:
    [​IMG]
    用word打开需要标注的文本, 将光标移到要标注的位置,单击菜单栏上相应的赋码即可完成标注。
    [​IMG]
    [​IMG]
    注意,用手工标注是一步比较费时费力的工作。不过,据本人了解,目前基于语义的语料库研究都需要有人工标注的投入,对此要有思想准备。
    补充:如果标注任务完成了,不再需要这些标注符号,或者需要更新别的符号。完全可以将这些标注符号从word工具栏上拖走。步骤是先点击“工具”,再点击“自定义”,打开工具设定对话框。如下图:
    [​IMG]
    大家可能看到标注符号被拖动“+”号的表示了。
     
  5. 李亮1975重庆

    李亮1975重庆 语料库快乐军政委