maggieq58 语料人生 2009-09-26 #1 我自己标记了一个文本式样,用您的软件检索不了。不太明白问题出在哪里?请教下二位到底是什么问题。 样本放在附件中了。 我检索的时候就是根本没反应。我只是在词性标记的基础上,标记的了段落标记和标题标记。 附件 last.txt 14.7 KB · 浏览: 8
maggieq58 语料人生 2009-09-26 #2 回复: 请教许博士和williamJia关于collocator1.0的问题 其实,我以前都是用xml方式进行标记,后来就是感到以上2位开发的这个软件的确不错。因而我选择兼容本软件的方式去做的标记。但不知道哪里还是出了问题。颇为头疼。。。
回复: 请教许博士和williamJia关于collocator1.0的问题 其实,我以前都是用xml方式进行标记,后来就是感到以上2位开发的这个软件的确不错。因而我选择兼容本软件的方式去做的标记。但不知道哪里还是出了问题。颇为头疼。。。
williamJia 开放语料库项目 2009-09-26 #3 回复: 请教许博士和williamJia关于collocator1.0的问题 去掉段首的<t><p><s>等标签就可以检索 附件 复件 last[1].txt 14.1 KB · 浏览: 8
maggieq58 语料人生 2009-09-26 #4 回复: 请教许博士和williamJia关于collocator1.0的问题 作者 williamJia: 去掉段首的<t><p><s>等标签就可以检索 Click to expand... 首先,非常感谢您的回复。从我标记的样本来看,是否我标记有错误,还是说目前本软件对xml这种格式目前还是不支持的。 这一个格式的改变到是很容易做到,批量删除起始标记就可以了。我只是想知道我的文本标记是否有问题?
回复: 请教许博士和williamJia关于collocator1.0的问题 作者 williamJia: 去掉段首的<t><p><s>等标签就可以检索 Click to expand... 首先,非常感谢您的回复。从我标记的样本来看,是否我标记有错误,还是说目前本软件对xml这种格式目前还是不支持的。 这一个格式的改变到是很容易做到,批量删除起始标记就可以了。我只是想知道我的文本标记是否有问题?
maggieq58 语料人生 2009-09-26 #5 回复: 请教许博士和williamJia关于collocator1.0的问题 本软件,我觉得非常好,和其他软件相比,构成了一个“互补”而不是雷同,功能实用,方便,操作简单,一目了然,所以我非常支持二位开发的这一系列软件。希望将来有更好的软件出台。支持!
回复: 请教许博士和williamJia关于collocator1.0的问题 本软件,我觉得非常好,和其他软件相比,构成了一个“互补”而不是雷同,功能实用,方便,操作简单,一目了然,所以我非常支持二位开发的这一系列软件。希望将来有更好的软件出台。支持!
williamJia 开放语料库项目 2009-09-26 #6 回复: 请教许博士和williamJia关于collocator1.0的问题 作者 maggieq58: 首先,非常感谢您的回复。从我标记的样本来看,是否我标记有错误,还是说目前本软件对xml这种格式目前还是不支持的。 这一个格式的改变到是很容易做到,批量删除起始标记就可以了。我只是想知道我的文本标记是否有问题? Click to expand... 本软件目前只支持 Word+分隔符+POS形式的文本,如:word_POS, word/POS 等 还不支持XML格式 你的文本标记没问题只是软件设计时忽略了<s></s>所在行的内容 因为Claws软件的格式如下: <s> word_pos word_pos word_pos word_pos </s> 第一行和第三行会被忽略,你的数据都集中在<s>后面,所以就被忽略了,如果另起一行就不会有问题。
回复: 请教许博士和williamJia关于collocator1.0的问题 作者 maggieq58: 首先,非常感谢您的回复。从我标记的样本来看,是否我标记有错误,还是说目前本软件对xml这种格式目前还是不支持的。 这一个格式的改变到是很容易做到,批量删除起始标记就可以了。我只是想知道我的文本标记是否有问题? Click to expand... 本软件目前只支持 Word+分隔符+POS形式的文本,如:word_POS, word/POS 等 还不支持XML格式 你的文本标记没问题只是软件设计时忽略了<s></s>所在行的内容 因为Claws软件的格式如下: <s> word_pos word_pos word_pos word_pos </s> 第一行和第三行会被忽略,你的数据都集中在<s>后面,所以就被忽略了,如果另起一行就不会有问题。
maggieq58 语料人生 2009-09-26 #7 回复: 请教许博士和williamJia关于collocator1.0的问题 哦。回答的非常详细。真是太感谢了! 的确您的软件在检索claws标记的未经改动的文本是毫无问题的。