• 发垃圾贴的禁不掉,只能关闭论坛注册。想要注册账户的C友,请每月初发邮件到 aihaiyang at gmail dot com,我手动帮你创建。

[求助]colsec的赋码原则?

xiaoz

永远的超级管理员
Staff member
#2
Some descriptions here:
http://www.corpus4u.com/upload/forum/2005072921580052.rar
 

ineedgerf

普通会员
#3
There are two sets of codes: one is the coding of learners' errors and the other is the POS. The POS part is based on TOSCA/LOB tagset and tagged by this tagger. For the tagset, please visit http://english.htu.edu.cn/lingualsoft/index.htm and there is the COLEN corpus I did about three years ago.

[本贴已被 作者 于 2005年11月07日 13时00分22秒 编辑过]
 

ineedgerf

普通会员
#6
这些码只有一个格式,没有“码集”,因为错误类型很多,在处理原来的标注格式时,我也一并将原来的标注格式转换为了和其它码句法相同的XML格式。
 
顶部