汉语语义标注语料库的开发,欢迎提供建议

为了便于讨论,先行提供一点讨论的方向。
(1)语义标注的基础在于语言学理论的支持,认知语义学的相关理论在此可以发挥巨大作用。我们目前的做法是以分词结果文件为基础,然后采用“实体词--关系词--虚词”三分的语义模式。
(2)标注采用XML格式,分为“自然语言词单位vs概念词单位”与“概念词单位vs层级系统”两个模块。
 
Back
顶部