通常说的 Corpus Annotation 指的是以下(但不限于)几个层次的标注:
Grammatical tagging: part-of-speech tagging
Syntactic annotation: syntactic parsing
Semantic annotation
Discourse annotation: ( e.g. anaphoric relations in corpora)
当然因研究的目的不同,还有其它层次的标注,如:
Prosodic Annotation
Pragmatic Annotation
Stylistic Annotation
etc.
虽然所谓的其它层次的标注不是 mainstream 的 Annotations, 但各有其研究价值。欲了解更多关于语料标注方面的知识,下面这本书可作参考:
Garside, R., Leech, G., & McEnery, T. 1997. Corpus Annotation: Linguistic Information from Computer Text Corpora. London & New York: Longman.