关于wordsmith的tag file的问题

我希望用wordsmith处理clec,tag file应该怎么写?有哪位老师有实际经验、试过?当然,能做clec的tag file,也能做其它标注语料库的,反之亦然。如果有人做其它标注语料库的tag file,也可以在这里分享一下(经验,实际tag file)。
 
回复: 关于wordsmith的tag file的问题

你的问题提得好迷离啊!读了两遍没看明白。
 
回复: 关于wordsmith的tag file的问题

抱歉了。我把这个问题再说得清楚些。在antconc里,可以设置显示或者隐藏标记(tag),这样就可以在file view里过滤、不显示某些标记。分词、词频统计时,也应该过滤掉标记。在wordsmith里,看它的帮助文件,类似功能需要通过编写tag file实现,而且设置里包括/排除标记文本的选项,比较复杂。不知哪位老师实际使用过相关功能?怎么才能wordsmith里把标记隐藏掉?甚至将首尾标记以及首尾标记之间的文本也隐藏掉?

WordSmith 对标记的使用似乎很强。我想,这么多专家在此,或许已经积累了一定经验吧。
 
回复: 关于wordsmith的tag file的问题

最好还是像antconc那样的处理方式,提供几种功能:1)隐藏标记;2)隐藏标记可检索;3)显示标记
 
回复: 关于wordsmith的tag file的问题

许老师,您提供的这个detagging tool我试了试只能适用于英文文档,汉语文本不使用。请教许老师,是否有去处汉语赋码文本的软件。谢谢您了。
 
Back
顶部