小规模用Word 2003吧,大规模再加上AntConc了!
我们可以有这样的一个另类的非主流的计算公式哈:
平均词长=(字节总量-单词总量)/单词总量
平均词长=(字符总量-单词总量)/单词总量
理论基础是:高度普遍的规律为,每个单词后面都有一个空格或者这个空格是一个标点(例如:逗号或问号或感叹号或圆括号或单引号或双引号),所以,字节总量或字符总量不等于所有单词的累积长度,而需要扣除1。示例如下,假设我们有1个txt文件中仅仅包含了下面的内容而需要计算平均词长:
"I love you."
以上,平均词长为2.66(8个字母除以3,等于2.66),扣除3是因为两个空格和一个句号。这里,字节总量为11个,单词数量为3个,所以,(11-3)/3=2.66
小规模操作的情况下,可以在Office Word中操作,点菜单的“字数统计”而弹出的对话框来知道“单词总量”和“字节总量”,这里的“字节总量”就是“字数统计”对话框上的“字符数(包括空格)”。
拿到两个值而计算第三个值的时候,可以点“开始”菜单的“程序”的“附件”的“计算器”,这个小东东,是Windows XP和后续的Windows版本都自带的内置的。
大规模操作(很多txt文件甚至处于不同的很多文件夹之内)的情况下,用AntConc进行一系列txt文件的加载(用AntConc的菜单“File”的“Open File(s)”和“Open Dir”来一口气选中以及多次选中而加载了多个文件和不同文件夹中的多个txt文件),然后点“Word List”窗体页面的下面偏左“Start”按钮,少顷,就能实现单词总量的一口气计算与呈现,然后自己亲手在文件夹中一次性选中整个文件夹或所有txt文件,点右键,看“属性”而得知“字节总量(字符总量)”,这也是包括空格的。这样,就“妙手空空”地计算了“小规模的单个文件的平均词长”了,也冒了一小点麻烦而借助AntConc计算了它原本不能计算的“大规模的N个文件的平均词长”了。