呵呵,很形象,容易理解。相当于蛋炒饭中的蛋的角色,如果蛋很多就是corpus-driven(简直就是滔滔江水,让人身不由己);如果蛋较少就是corpus-based,如果蛋很少或难以描述蛋与饭的比例关系就是corpus-assisted咯。
这跟比例没有关系吧,参考:
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press.
6.6 Corpus-as-theory versus corpus-as-method
corpus-driven 和corpus-based 我的理解和你的差不多,corpus-assisted抱歉没有看过你说的文章不清楚,不过从字面上来理解我觉得只要用到了corpus都能叫assisted呢= =
在真正做的过程中,其实没有太区分driven还是based,通常都叫based,以及严格意义上的driven已经不多见了吧应该。
……嘛,搞这么复杂。。晚上又翻了几页Partington,一觉醒来好像突然想明白了,虽然Partington本人没有主张这样的区分,但我觉得能不能这样看:
如果我有一个语料库做观察对象,我没有特定的语料要观察,我任由语料库工具生成的concordance、frequency等数据来引导我的描述——corpus driven
如果我有特定的语料要观察(比如,一篇社论),一般来说我还有一个语料库作参考,我任由语料库工具针对特定语料生成的concordance、frequency等数据来引导我的描述,并不时consult参考语料库——corpus based
如果我有特定的语料要观察(比如,一篇社论),我主动选取我认为可能有分析价值的元素(比如,某个词),然后consult参考语料库,利用语料库工具得到concordance、frequency等结果,分析得到semantic prosody,回过去再看这个词如何影响对特定语料的理解——corpus assisted
这样如何?感觉实际操作中based和assisted的方法都会用到,所以似乎真没必要把这两者截然分开。
……嘛,搞这么复杂。。
可是如果有明确的research question,一定是奔着主题去的,不会存在没有特定语料要观察,还有生成检索行一定是首先要知道检索哪个或者哪类词。如果有不确定的地方,那一定是research question还没确定,question没确定下来就不用急着检索了。
所以说,还是要看research question是什么,怎么用语料可以解决问题就怎么用,管他based还是driven还是assisted~
McEnery, T., Hardie, A., & Baker, P. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.
p.49 corpus-based Tognini-Bonelli (2001) makes a useful distinction
between corpus-based and corpus-driven investigations.
The former uses a corpus as a source of
examples to check researcher intuition or to examine the
frequency and/or plausibility of the language contained
within a smaller data set. The researcher does not
question pre-existing traditional descriptive units and
categories. A corpus-driven analysis is a more inductive
process: the corpus itself is the data and the patterns in
it are noted as a way of expressing regularities (and
exceptions) in language. A corpus-driven analysis tends
to only use minimal theoretical presuppositions about
grammatical structure.