附件里是我的一个项目里的一点结果样本,请看是不是你想要的东西。
不过,在套用英语句长在文本分析中的应用,由于两种语言的差别,建议最好先把下面几个问题搞清楚:
....所示的具体分析,也要如我图所示的汇总在Excel里,把第三第四栏分别做个Subtotal不就得到了结果吗? 导入到SPSS也可以啊。
洪博士所言极是,不同的定义往往会影响不同的句子数量。那么词匠4里面是怎么定义汉语句子的呢?找了一下没有结果,有人找到了么?谢谢告知!
在Excel里,把第三第四栏分别做个Subtotal不就得到了结果吗? 导入到SPSS也可以啊。
定义句子确实是一个麻烦的问题,在做句法分析器的时候这个问题尤其令人头疼.在中文信息处理界.可能是以标号来作为一个句子的,如".?!"等.
请教肖博士,您是怎么得到这个结果的?我也是用Wordsmith 5 处理lcmc 做出来的数据是41.59 是不是wordsmith 的设置出了什么问题?lcmc 也用wordsmith 转成了unicode 前面的帖子里提到不能用wordsmith 转 但是不转的话出来的词频表都是乱码 句长是36 我是用<s>和</s> 来定义句子的 谢谢!The average (overall) sentence length in LCMC is 17 words per sentence, according to WordSmith 4.