[求助]如何去掉LCMC语料中的POS_tag?

yinghuang

高级会员
我现在要比较1949-1966,1967-1978,1979-2006三个时间段的汉语语料用词特点。我想找出每个时期的Key words。由于没有ws4,我想使用antconc。Dr.Xiao建议我使用LCMC语料库作为reference。发现antconc不能使用wordlist作为reference,但又无法去掉LCMC语料中的postag。郁闷了好长时间了,仍无法解决。请求高人指点迷津。


[本贴已被 作者 于 2006年07月04日 15时53分34秒 编辑过]
 
看来应该先把比较大的txt拆分成小的,然后再使用william的detagging工具就可以了。
 
Back
顶部