本人很菜 想问用uam能统计出文本的六种及物性过程吗

回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

对uam刚开始研究 请高手指点下

Corpus Tool或它的前身Systemic Coder首先是一个帮助你标注用的软件。若果你想统计Process Types,须将Transitivity System用作标注系统,然后对每个小句进行标注。标注完了,该软件的Stastistic功能就可以给你提供统计结果了。
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

但问题是怎么标注啊,能否指导一下呢
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

对uam刚开始研究 请高手指点下

这里有中文版的图文并茂的在线教程的
http://www.wagsoft.com/CorpusTool/UAMCorpusToolManual-20-Chinese.pdf

一般来说,应该:(1)下载该工具;(2)阅读其帮助;(3)熟悉其菜单;(4)模仿其示例;(5)规划标签集;(6)新建一工程;(7)添加多文件;(8)新建标签集;(9)添加标签值;(10)阅读且标注;(11)观察与修正;(12)搜索与统计;(13)导出与整合;(14)思考与汇报;(15)发表与庆祝。

当代的语料库标注已经是XML的天下,所以,涉足标注的人士有必要了解一下“XML的基本规则”,可以花费20分钟左右来阅读下面的链接
http://www.w3school.com.cn/xml/xml_intro.asp


 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

看了UAM的使用,还是显得不够友好,对初次使用者来说,学习成本高了。

我们开发的BFSU Qualitative Coder用起来应该简单得多。
http://www.fltrp.com/sites/new.fltrp.com/files/news-attachemnt/bfsu_qualitative_coder_1.2.rar

内有一个Appraisal System的Code List,用户可自行修改Code List,以满足研究需要。
每个新设Code,只需写四行就可以了。要添加类别,照此修改即可。
比如:
[TYPE1]
abbr=新类
begin=<TYPE1>
end=</TYPE1>
 
提问:BSFU Quantitive Coder怎么标注啊

麻烦一下许博士,我想问一下使用北外团队开发的BSFU Quantitive Coder的软件标注并统计一个文本的及物性的心理过程,即mental verbs, 您能不能给讲讲呢
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

就是在CodeList里写入
[Mental]
abbr=心理
begin=<Mental>
end=</Mental>

就可以了啊。不能再简单了。

其他的依此类推。附件里是一个例子,我做了Mental和Material两个过程,其他的你依葫芦画瓢,再添加吧。

解压后放到Qualitative Coder文件夹里就可以。

软件操作,Open File-然后Code List,然后选中你认为是mental process的词汇。短语或句子,点击相应的彩笔button就可以了。

所有的标注都要人工判断。

楼上5楼李亮1975重庆对标注步骤的描述得非常清晰。
 

附件

  • codelist_for_processes.rar
    245 bytes · 浏览: 67
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

太感谢许老师了,您这么热心帮助好感动,无论如何也要把它弄明白!:cool:
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

许老师,还想麻烦您一下(领悟力太差了,汗颜:(),如您上面所指导方法做后的确很准确明晰,统计那一下子就出来了。但是要是短篇的文本还好,如果是比较长的几万字的文本,标注的话要很久。 autocode功能能不能先一下子标出所有的过程,然后我们再人工检查呢?
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

autocode的前提是,你知道哪些语言结构是mental,哪些是material。
然后把这些语言结构写到正则表达式里,放在每个Code后面就可以了。比如
以mental为例,我们认为think, suppose, believe, doubt等等为mental process
就可以写
regExpr=think|suppose|believe|doubt
regExprCase=True

完整的格式是这样的:
[Mental]
abbr=心理
begin=<Mental>
end=</Mental>
color=800000
ico=ico\2.ICO
description=心理过程
regExpr=think|suppose|believe|doubt
regExprCase=False

有正则表达式(regExpr)了,autocode就可以用了。

其实最重要的就是前四行,其他行可有可无。如果明白了其他的行的意思,显示效果会好一些。
最后两行是管正则表达式的,最后一行是管正则式是否区分大小写。

正则表达式那一行可以一直写下去,中间用竖杠就可以。

先AutoCode,校对很容易,直接在窗口中,看到哪里不对,直接删改就可以。

所有的文本都标注好后,可以用BFSU Qualitative Explorer来分析多个文本之中的分布统计情况。
http://ishare.iask.sina.com.cn/f/20299558.html
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

非常感谢许老师,其实平时也在读《语料库应用教程》,不知道您是不是那本书的编者许家金老师啊!总之,很感谢您的热心帮助,也感动于您热心传播知识的精神。
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

我还是个语料库盲,基本眼前漆黑一片呵呵。想问一下老师们,现在语料库工具能够智能到什么程度呢?比如过于及物性6过程统计的问题,我看过知网上一篇文章,一个作者用uam的autocode直接输入了类似于“select material if containing mental verbs"的指令,就统计出了所有mental verbs,当然还要自行检查。请问真有这么容易吗?可以的话统计结果准确性高吗?
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

这里有中文版的图文并茂的在线教程的
http://www.wagsoft.com/CorpusTool/UAMCorpusToolManual-20-Chinese.pdf

一般来说,应该:(1)下载该工具;(2)阅读其帮助;(3)熟悉其菜单;(4)模仿其示例;(5)规划标签集;(6)新建一工程;(7)添加多文件;(8)新建标签集;(9)添加标签值;(10)阅读且标注;(11)观察与修正;(12)搜索与统计;(13)导出与整合;(14)思考与汇报;(15)发表与庆祝。

当代的语料库标注已经是XML的天下,所以,涉足标注的人士有必要了解一下“XML的基本规则”,可以花费20分钟左右来阅读下面的链接
http://www.w3school.com.cn/xml/xml_intro.asp
李老师,第一个链接现在已经无效了~
 
回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗

第一个链接为什么无效了呢,好伤心啊
 
Back
顶部