corpus driven/based/assisted

guxinyuan · 2014-06-24

看到好多关于corpus-driven 和corpus-based 的讨论，
弱问corpus-based 和 corpus-assisted 有什么区别？谢谢~

李亮1975重庆 · 2014-06-26

都是描述语料库手段在一份研究中的地位的

相当于蛋炒饭中的蛋的角色，如果蛋很多就是corpus-driven（简直就是滔滔江水，让人身不由己）；如果蛋较少就是corpus-based，如果蛋很少或难以描述蛋与饭的比例关系就是corpus-assisted咯。

李亮1975重庆 · 2014-06-26

在www.bing.com中搜索下的3个频率的横向对比是……

在www.bing.com中搜索下的3个频率的横向对比是……

corpus-driven有19,200条
corpus-based有147,000条
corpus-assisted有4,420条
所以，corpus在86%的情况下是based，11%的情况下是driven，近3%的情况下是assisted

corpus-driven: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad

corpus-based: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad

corpus-assisted: (查询结果的总量在页面底部)
http://cn.bing.com/search?q="corpus...=-1&sk=&cvid=06a6daacc4314f4d91ded7afe8aa23ad

ChristinaTang · 2014-06-26

回复: corpus driven/based/assisted

这跟比例没有关系吧，参考：
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press.
6.6 Corpus-as-theory versus corpus-as-method

oscar3 · 2014-06-26

回复: 都是描述语料库手段在一份研究中的地位的

作者李亮1975重庆:
相当于蛋炒饭中的蛋的角色，如果蛋很多就是corpus-driven（简直就是滔滔江水，让人身不由己）；如果蛋较少就是corpus-based，如果蛋很少或难以描述蛋与饭的比例关系就是corpus-assisted咯。

呵呵，很形象，容易理解。
梁茂成的区别是“在Sinclair的影响下，Tognini-Bonelli（2001：99）首次对“基于语料库”和“语料库驱动”的研究范式进行了区分。在她看来，“基于语料库”的研究范式利用语料库对已有的理论或假设进行探索，目的在于验证或修正已有理论，而“语料库驱动”的研究范式则以语料库作为出发点和唯一观察对象，对语言中的各类现象进行全新的界定和描述。” （http://www.cssn.cn/yyx/yyx_hyzcq/201310/t20131026_612763.shtml）

guxinyuan · 2014-06-26

回复: corpus driven/based/assisted

谢谢楼上各位的回复~~

我感觉corpus-driven 和corpus-based还是能理解的，前者主张从且仅从语料库能得出对语言的描述（代表实践：在Firth影响下的Sinclair, M.Stubbs等的研究)；后者是把语料库和其他各种语言学理论及方法相结合，实现对特定问题的描述(代表实践：P.Baker等和CDA结合的做法）——这样总结可以吗？

corpus-assisted的说法我是在A.Partington的文章里瞄到的，我不太确定我是否把握了Partington的这个术语和corpus-based之间的关系@@ 是不是能说，corpus-based和corpus-assisted在本质上并没有太多不同？

guxinyuan · 2014-06-26

回复: corpus driven/based/assisted

在google books能读到这一节，看这个表述，是不是可以说，

使用corpus-based这个术语的研究者，更偏向CDA等把discourse看成社会实践的分析；
使用corpus-assisted这个术语的研究者，更偏向把discourse看成比句子大的语言单位，也就是说，沿袭text analysis的视点？

可是，除了看待discourse的视点不同，除了对context的理解略不同，除了前者更强调社会意义和政治意义外，其实based和assisted，在方法意义上没啥大区别，能这么说吗？

作者 ChristinaTang:
这跟比例没有关系吧，参考：
McEnery, T., & Hardie, A. (2011). Corpus linguistics: Method, theory and practice. Cambridge University Press.
6.6 Corpus-as-theory versus corpus-as-method

ChristinaTang · 2014-06-26

回复: corpus driven/based/assisted

corpus-driven 和corpus-based 我的理解和你的差不多，corpus-assisted抱歉没有看过你说的文章不清楚，不过从字面上来理解我觉得只要用到了corpus都能叫assisted呢= =

在真正做的过程中，其实没有太区分driven还是based，通常都叫based，以及严格意义上的driven已经不多见了吧应该。

guxinyuan · 2014-06-27

回复: corpus driven/based/assisted

作者 ChristinaTang:
corpus-driven 和corpus-based 我的理解和你的差不多，corpus-assisted抱歉没有看过你说的文章不清楚，不过从字面上来理解我觉得只要用到了corpus都能叫assisted呢= =

在真正做的过程中，其实没有太区分driven还是based，通常都叫based，以及严格意义上的driven已经不多见了吧应该。

晚上又翻了几页Partington，一觉醒来好像突然想明白了，虽然Partington本人没有主张这样的区分，但我觉得能不能这样看：

如果我有一个语料库做观察对象，我没有特定的语料要观察，我任由语料库工具生成的concordance、frequency等数据来引导我的描述——corpus driven

如果我有特定的语料要观察（比如，一篇社论），一般来说我还有一个语料库作参考，我任由语料库工具针对特定语料生成的concordance、frequency等数据来引导我的描述，并不时consult参考语料库——corpus based

如果我有特定的语料要观察（比如，一篇社论），我主动选取我认为可能有分析价值的元素（比如，某个词），然后consult参考语料库，利用语料库工具得到concordance、frequency等结果，分析得到semantic prosody，回过去再看这个词如何影响对特定语料的理解——corpus assisted

这样如何？感觉实际操作中based和assisted的方法都会用到，所以似乎真没必要把这两者截然分开。

ChristinaTang · 2014-06-27

回复: corpus driven/based/assisted

作者 guxinyuan:
晚上又翻了几页Partington，一觉醒来好像突然想明白了，虽然Partington本人没有主张这样的区分，但我觉得能不能这样看：

如果我有一个语料库做观察对象，我没有特定的语料要观察，我任由语料库工具生成的concordance、frequency等数据来引导我的描述——corpus driven

如果我有特定的语料要观察（比如，一篇社论），一般来说我还有一个语料库作参考，我任由语料库工具针对特定语料生成的concordance、frequency等数据来引导我的描述，并不时consult参考语料库——corpus based

如果我有特定的语料要观察（比如，一篇社论），我主动选取我认为可能有分析价值的元素（比如，某个词），然后consult参考语料库，利用语料库工具得到concordance、frequency等结果，分析得到semantic prosody，回过去再看这个词如何影响对特定语料的理解——corpus assisted

这样如何？感觉实际操作中based和assisted的方法都会用到，所以似乎真没必要把这两者截然分开。

……嘛，搞这么复杂。。

可是如果有明确的research question，一定是奔着主题去的，不会存在没有特定语料要观察，还有生成检索行一定是首先要知道检索哪个或者哪类词。如果有不确定的地方，那一定是research question还没确定，question没确定下来就不用急着检索了。

所以说，还是要看research question是什么，怎么用语料可以解决问题就怎么用，管他based还是driven还是assisted~

guxinyuan · 2014-06-27

回复: corpus driven/based/assisted

作者 ChristinaTang:
……嘛，搞这么复杂。。

可是如果有明确的research question，一定是奔着主题去的，不会存在没有特定语料要观察，还有生成检索行一定是首先要知道检索哪个或者哪类词。如果有不确定的地方，那一定是research question还没确定，question没确定下来就不用急着检索了。

所以说，还是要看research question是什么，怎么用语料可以解决问题就怎么用，管他based还是driven还是assisted~

生成concordance的确一定有检索词，但是列出frequency最高的那些词是不需要预先设置检索词的。。。。。。

driven和based很多时候都是先列frequency最高的词，剔掉functional只留content，然后从后者中选择检索词去生成concordance的。。。。。这两步是有先后顺序的，主观选择是否先于检索行的生成，其实是很关键的。。。。。。。

我也不是那么在意一定要分清based和assisted，我只是希望自己的论文选择了最合适的关键词而已

清风出袖 · 2014-07-11

回复: corpus driven/based/assisted

McEnery, T., Hardie, A., & Baker, P. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.

p.49 corpus-based Tognini-Bonelli (2001) makes a useful distinction
between corpus-based and corpus-driven investigations.
The former uses a corpus as a source of
examples to check researcher intuition or to examine the
frequency and/or plausibility of the language contained
within a smaller data set. The researcher does not
question pre-existing traditional descriptive units and
categories. A corpus-driven analysis is a more inductive
process: the corpus itself is the data and the patterns in
it are noted as a way of expressing regularities (and
exceptions) in language. A corpus-driven analysis tends
to only use minimal theoretical presuppositions about
grammatical structure.

guxinyuan · 2014-07-15

回复: corpus driven/based/assisted

作者清风出袖:
McEnery, T., Hardie, A., & Baker, P. (2006). A glossary of corpus linguistics. Edinburgh: Edinburgh University Press.

p.49 corpus-based Tognini-Bonelli (2001) makes a useful distinction
between corpus-based and corpus-driven investigations.
The former uses a corpus as a source of
examples to check researcher intuition or to examine the
frequency and/or plausibility of the language contained
within a smaller data set. The researcher does not
question pre-existing traditional descriptive units and
categories. A corpus-driven analysis is a more inductive
process: the corpus itself is the data and the patterns in
it are noted as a way of expressing regularities (and
exceptions) in language. A corpus-driven analysis tends
to only use minimal theoretical presuppositions about
grammatical structure.

这样定义区分based和driven感觉是比较清楚的~

我回头又去看了Baker的著作，发现其实所谓的based也是有主动选词的，所以是否主动选词确实不是based和assisted的区别所在。

corpus driven/based/assisted

guxinyuan

李亮1975重庆

语料库快乐军政委

李亮1975重庆

语料库快乐军政委

ChristinaTang

oscar3

高级会员

guxinyuan

guxinyuan

ChristinaTang

guxinyuan

ChristinaTang

guxinyuan

清风出袖

高级会员

guxinyuan