yinghuang 高级会员 2006-07-04 #1 我现在要比较1949-1966,1967-1978,1979-2006三个时间段的汉语语料用词特点。我想找出每个时期的Key words。由于没有ws4,我想使用antconc。Dr.Xiao建议我使用LCMC语料库作为reference。发现antconc不能使用wordlist作为reference,但又无法去掉LCMC语料中的postag。郁闷了好长时间了,仍无法解决。请求高人指点迷津。 [本贴已被 作者 于 2006年07月04日 15时53分34秒 编辑过]
我现在要比较1949-1966,1967-1978,1979-2006三个时间段的汉语语料用词特点。我想找出每个时期的Key words。由于没有ws4,我想使用antconc。Dr.Xiao建议我使用LCMC语料库作为reference。发现antconc不能使用wordlist作为reference,但又无法去掉LCMC语料中的postag。郁闷了好长时间了,仍无法解决。请求高人指点迷津。 [本贴已被 作者 于 2006年07月04日 15时53分34秒 编辑过]
刘 刘语料 封禁用户 2006-07-04 #2 试一下下面网址提供的detag软件。 http://www.corpus4u.org/showthread.php?p=2059 或者search“tag removal”。