对uam刚开始研究 请高手指点下
对uam刚开始研究 请高手指点下
但问题是怎么标注啊,能否指导一下呢
对uam刚开始研究 请高手指点下
李老师,第一个链接现在已经无效了~这里有中文版的图文并茂的在线教程的
http://www.wagsoft.com/CorpusTool/UAMCorpusToolManual-20-Chinese.pdf
一般来说,应该:(1)下载该工具;(2)阅读其帮助;(3)熟悉其菜单;(4)模仿其示例;(5)规划标签集;(6)新建一工程;(7)添加多文件;(8)新建标签集;(9)添加标签值;(10)阅读且标注;(11)观察与修正;(12)搜索与统计;(13)导出与整合;(14)思考与汇报;(15)发表与庆祝。
当代的语料库标注已经是XML的天下,所以,涉足标注的人士有必要了解一下“XML的基本规则”,可以花费20分钟左右来阅读下面的链接
http://www.w3school.com.cn/xml/xml_intro.asp
此链接已无法打开
许教授您好!请问像物质过程,关系过程,行为过程这些过程的正则表达式如何编写呢??还有心理过程这里也不能涵盖所有的心理动词怎么解决呢??(期待教授解疑答惑!谢谢)回复: 本人很菜 想问用uam能统计出文本的六种及物性过程吗
autocode的前提是,你知道哪些语言结构是mental,哪些是material。
然后把这些语言结构写到正则表达式里,放在每个Code后面就可以了。比如
以mental为例,我们认为think, suppose, believe, doubt等等为mental process
就可以写
regExpr=think|suppose|believe|doubt
regExprCase=True
完整的格式是这样的:
[Mental]
abbr=心理
begin=<Mental>
end=</Mental>
color=800000
ico=ico\2.ICO
description=心理过程
regExpr=think|suppose|believe|doubt
regExprCase=False
有正则表达式(regExpr)了,autocode就可以用了。
其实最重要的就是前四行,其他行可有可无。如果明白了其他的行的意思,显示效果会好一些。
最后两行是管正则表达式的,最后一行是管正则式是否区分大小写。
正则表达式那一行可以一直写下去,中间用竖杠就可以。
先AutoCode,校对很容易,直接在窗口中,看到哪里不对,直接删改就可以。
所有的文本都标注好后,可以用BFSU Qualitative Explorer来分析多个文本之中的分布统计情况。
http://ishare.iask.sina.com.cn/f/20299558.html