请教关于汉语文本中小句划分与统计

jade0620 · 2011-10-20

请问按照功能语言学的观点，汉语的小句应该怎样划分？有看到这样一篇论文这样划分汉语的小句：第二年春天，小鸟飞回来的时候（1），看见大树没有了，大熊坐在树墩上哭鼻子（2）。......别难过，只要树根还在，大树就会发芽（3）。”小鸟说（4）。按照作者的划分，该段落有1-4小句。我的问题是，为什么“看见大树没有了”以及“别难过”还有“只要树根还在”不算小句？汉语的小句究竟根据什么来划分？另外请问可否自动统计汉语文本中的小句总数？谢谢大家的指教。

xujiajin · 2011-10-22

回复: 请教关于汉语文本中小句划分与统计

用逗号划分汉语小句是不靠谱的。我个人认为自动统计汉语小句总数不太现实。

jade0620 · 2011-10-22

回复: 请教关于汉语文本中小句划分与统计

谢谢许老师的答复。
如果以动词作为计算小句的标准是否比较合理？以下例子分为1-9个小句是否可以：“第二年春天，小鸟飞回来的时候（1），看见（2）大树没有了（3），大熊坐在树墩上（4）哭鼻子（5）。......别难过（6），只要树根还在（7），大树就会发芽（8）。”小鸟说（9）。
我的印象是国内的许多以汉语为语料的论文经常直接汇报数据，较少介绍其coding scheme（有些语料库方面的论文也经常未介绍其具体的标注或提取方法），所以只能假定作者是权威人士而去相信他的数据提取方法没问题。
看到一篇外语权威期刊的一篇关于英汉评价语言方面的对比文章，直接汇报汉语文章的affect 和judgement resources的总数。可是我们知道汉语与英语的评价划分应该是有区别的，如martin等所说的是culture dependent.所以这类文章是否应该以一sample来具体介绍其coding scheme，以使读者相信其数据的可信度？

请教关于汉语文本中小句划分与统计

jade0620

xujiajin

管理员

jade0620