蓓 蓓蕾薄荷 2014-05-10 #1 我用CLAWS7对布朗家族语料库中的FROWN语料库进行标注 然后用Antconc进行检索总词数 为什么检索出来的是字母的频数呢? 而不是像Brown语料库一样是单词的词频呢(这个是别人标注的)标注的方法都一样 标注的文本都没什么差别 问题出在哪呢
我用CLAWS7对布朗家族语料库中的FROWN语料库进行标注 然后用Antconc进行检索总词数 为什么检索出来的是字母的频数呢? 而不是像Brown语料库一样是单词的词频呢(这个是别人标注的)标注的方法都一样 标注的文本都没什么差别 问题出在哪呢
X xiaoz 永远的超级管理员 Staff member 2014-05-11 #2 回复: 用CLAWS7标注的 用Antconc检测词频 检测出的是字母的而不是单词的呢 Check the character encoding.