XML标注格式

xudekuan

Moderator
XML是标注为下列格式呢
<pos type="p">往</pos>
还是标注为
<pos type=p>往</pos>

也就是p的两边没有引号?

语料库工具箱提供的是第二种格式

中科院的ICTCLAS是第一种格式.


不知道XAIRA能够处理哪一种格式的.
 
Quotations are mandatory in XML, but they are optional in SGML.
 
如果有时间,不妨读一下这个帖子:

想学习如何XML标注语料库
http://www.corpus4u.com/forum_view.asp?forum_id=38&view_id=1427
 
Dr, Xiao, could you kindly provide me a perl-script programe to convert underscore-style POS- tagged text into plain text?

thank you in advance.
 
回复:XML标注格式

以下是引用 xudekuan2006-5-31 20:45:58 的发言:
XML是标注为下列格式呢
<pos type="p">往</pos>
还是标注为
<pos type=p>往</pos>

也就是p的两边没有引号?

语料库工具箱提供的是第二种格式

中科院的ICTCLAS是第一种格式.


不知道XAIRA能够处理哪一种格式的.

ACWT was not intended as an XML encoder, although it wouldn't be hard to
implement the XML syntax with ACWT. Maybe the next update will do something
along the line.
 
回复:XML标注格式

以下是引用 xudekuan2006-6-1 15:56:45 的发言:
似乎paraconc对这种标注检索起来更方便:
<pos type=p>往</pos>

Maybe it's because ParaConc was designed before XML became a popular standard.
 
http://www.corpus4u.com/forum_view.asp?view_id=1917&forum_id=74
Pls find perl script in the above thread.
 
Back
顶部