关于xml标记的问题!~

以colen corpus为例!一般书写介绍部分也是这样写的,如果用xml标记,需要有如下的部分

<html xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="D:\my_DIR\P_Colen_Corpus_Project\tagged\XSD\P_CORPUS.xsd">

但我发现colen的tagged版本 把又上面这个部分去掉了。

而且最要的是,上面这个部分,有 或 没有 在运行的时候没有根本的区别

那我很想知道,上面这个部分的东西 到底需要不需要?!

(理论上我知道上面这个部分说明的是什么意思)
 
回复: 关于xml标记的问题!~

以colen corpus为例!一般书写介绍部分也是这样写的,如果用xml标记,需要有如下的部分

<html xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="D:\my_DIR\P_Colen_Corpus_Project\tagged\XSD\P_CORPUS.xsd">

但我发现colen的tagged版本 把又上面这个部分去掉了。

而且最要的是,上面这个部分,有 或 没有 在运行的时候没有根本的区别

那我很想知道,上面这个部分的东西 到底需要不需要?!

(理论上我知道上面这个部分说明的是什么意思)

用于语料库标注的很多XML文件没有使用真正的XML格式,也许是这个原因吧,有些地方称作Pseudo-XML 。
 
回复: 关于xml标记的问题!~

如何标记和使用什么样的检索工具相关。有的要求严密些,有的要求松散些……
 
Back
顶部