请教关于汉语文本中小句划分与统计

请问按照功能语言学的观点,汉语的小句应该怎样划分?有看到这样一篇论文这样划分汉语的小句:第二年春天,小鸟飞回来的时候(1),看见大树没有了,大熊坐在树墩上哭鼻子(2)。......别难过,只要树根还在,大树就会发芽(3)。”小鸟说(4)。按照作者的划分,该段落有1-4小句。我的问题是,为什么“看见大树没有了”以及“别难过”还有“只要树根还在”不算小句?汉语的小句究竟根据什么来划分?另外请问可否自动统计汉语文本中的小句总数?谢谢大家的指教。
 
回复: 请教关于汉语文本中小句划分与统计

用逗号划分汉语小句是不靠谱的。我个人认为自动统计汉语小句总数不太现实。
 
回复: 请教关于汉语文本中小句划分与统计

谢谢许老师的答复。
如果以动词作为计算小句的标准是否比较合理?以下例子分为1-9个小句是否可以:“第二年春天,小鸟飞回来的时候(1),看见(2)大树没有了(3),大熊坐在树墩上(4)哭鼻子(5)。......别难过(6),只要树根还在(7),大树就会发芽(8)。”小鸟说(9)。
我的印象是国内的许多以汉语为语料的论文经常直接汇报数据,较少介绍其coding scheme(有些语料库方面的论文也经常未介绍其具体的标注或提取方法),所以只能假定作者是权威人士而去相信他的数据提取方法没问题。
看到一篇外语权威期刊的一篇关于英汉评价语言方面的对比文章,直接汇报汉语文章的affect 和judgement resources的总数。可是我们知道汉语与英语的评价划分应该是有区别的,如martin等所说的是culture dependent.所以这类文章是否应该以一sample来具体介绍其coding scheme,以使读者相信其数据的可信度?
 
Back
顶部