毕业论文写基于语料库的中英报刊标题的语言特征差异。
自建了两个小语料库。收集完语料并输入txt里。约为各300条关于G20的英文标题。
请问。如果要得到缩略词的使用频率。完整句和省略句的使用频率。以及词长。类符。标题词长。区间范围内的高频词要怎么操作呢。
已下载了Go tagger, antconc, readability analyzer.
根据antconc的说明操作出来的数据是乱码的。这样的现象是txt里面的内容没处理好吗。
如果要得出以上数据。是否需要全部标注呢。
晚上看了一些文章还是没有明白。能麻烦知道的前辈赐教下吗。感激不尽!
自建了两个小语料库。收集完语料并输入txt里。约为各300条关于G20的英文标题。
请问。如果要得到缩略词的使用频率。完整句和省略句的使用频率。以及词长。类符。标题词长。区间范围内的高频词要怎么操作呢。
已下载了Go tagger, antconc, readability analyzer.
根据antconc的说明操作出来的数据是乱码的。这样的现象是txt里面的内容没处理好吗。
如果要得出以上数据。是否需要全部标注呢。
晚上看了一些文章还是没有明白。能麻烦知道的前辈赐教下吗。感激不尽!