关于claw trial service 的一个问题

请问老师们一个问题

我用claw trial service 做标注, 把clec 等分成每份约五万字的20份, 分别加码, 出来以后的语料 as far as 这个词条没有了, 其他各项词频在数目上也有减少, 我做了两遍, 结果都是一样, 问题出在哪里呢 谢谢大家了:confused:
 
回复: 关于claw trial service 的一个问题

不知道你说的是怎么回事,按CLAWS的机制,as far as这种词应当会被识别成所谓的idiom tag或ditto tag,被赋上as_RR31 far_RR32 as_RR33这样的码,以示是一个整体。
 
回复: 关于claw trial service 的一个问题

您说会不会是 切分后 赋码的缘故呢, 有没有 跟 claw 差不多的软件呢, 能区分 介词 副词, 连词就可以了,
 
回复: 关于claw trial service 的一个问题

我知道你说的是,区分as介词副词用法的工具。目前除CLAWS外,其他available的赋码工具好像还没注意到。或许有网友知道的。
 
Back
顶部