建议开一个xml标记的主题帖子~

:) xml 兼容html这个方面的专门针对corpus的书不多,论坛的一些内容我都搜索过,我想我们这里有很多高手,大家何不一起讨论下xml标记的心得。不求系统全面,只是各位朋友能分享自己的一点心得就可以。希望能顶起来
 
回复: 建议开一个xml标记的主题帖子~

好主意, 请楼主先下一贴如何?
 
弟子我在这个方面应该说懂的非常少,我在论坛搜索发现这个方面的帖子基本都是laohong发的,所以您才是这个方面的权威。我目前在自己学习xml语言,借了些书,但看的感觉有点。。。慢,和语言学也不相关的感觉。。。

后来在论坛转了几天想学习laohong推荐的mmax2 这个软件,不过用了一下不得要领!做的比较机械,也不知道做的对,还是不对,那里应该注意什么也不知道。

所以laohong 还是请您指教一下吧,真的感谢了。我知道您用这个软件有好几年了。能否写下几个重要的步骤,我一定好好学习。谢谢了!
 
回复: 建议开一个xml标记的主题帖子~

我也不是XML的权威,只是用的比较多,碰到的问题也自然多,所谓久病成医,积累了一些偏方而已。XML标注法基本上有两类,一是straightforward markup, 一类是standoff markup。 常见的都是第一种,如BNC-XML版本,xiaoz的LCMC corpus等。但是这样的标注有很多问题,尤其是在标注复杂的结构,如multilayered, overlapping, discontiguous, disordered, coextensive, hierarchical elements等方面,因此后一种标注法就越来越有用。MMAX就是基于standoff标注的。建议再进一步讨论MMAX前,先花点时间把XML的基础搞好,网上有很多免费的教程,这里介绍一个:

XML Tutorial
http://www.learn-xml-tutorial.com/
 
回复: 建议开一个xml标记的主题帖子~

感谢laohong的经验之谈!一个方向的指导会让后来人少走很多弯路。当然路要自己走下去,但指路人是很重要的。
 
Back
顶部