回复: 请教关于汉语文本中小句划分与统计
谢谢许老师的答复。
如果以动词作为计算小句的标准是否比较合理?以下例子分为1-9个小句是否可以:“第二年春天,小鸟飞回来的时候(1),看见(2)大树没有了(3),大熊坐在树墩上(4)哭鼻子(5)。......别难过(6),只要树根还在(7),大树就会发芽(8)。”小鸟说(9)。
我的印象是国内的许多以汉语为语料的论文经常直接汇报数据,较少介绍其coding scheme(有些语料库方面的论文也经常未介绍其具体的标注或提取方法),所以只能假定作者是权威人士而去相信他的数据提取方法没问题。
看到一篇外语权威期刊的一篇关于英汉评价语言方面的对比文章,直接汇报汉语文章的affect 和judgement resources的总数。可是我们知道汉语与英语的评价划分应该是有区别的,如martin等所说的是culture dependent.所以这类文章是否应该以一sample来具体介绍其coding scheme,以使读者相信其数据的可信度?