我们迷失的信息在哪里

我们迷失的信息在哪里

在互联网时代
我们的信息在哪里
我们迷失的信息在哪里
都在浩如烟海的互联网里
这些迷失信息的获得靠什么
处理、判断和利用海量信息的能力

在前语料库时代,语言学的信息在哪里
在词典里,在语法书中
在汗牛充栋的语言学著作里
我们迷失的语言学信息在哪里
在扶椅语言学家的苦思冥想中
在室内语言学家的恍然大悟中(注)

在语料库时代,语言学的信息在哪里
在真实文本的索引行里,在词语行为的频率里
在实地语言学家的脚印里
我们迷失的语言学信息在哪里
在挂万漏一的统计中
在杂音信息的舍弃中

注:○1. 理性主义语言学家喜欢用拍脑袋、拍桌子等内省的方法研究语言,被经验主义语言学家戏称为Armchair Linguists,Indoor Linguists。
2010年11月2日作
 
回复: 我们迷失的信息在哪里

That's an interesting way of expressing how (corpus) linguists find their data.
 
回复: 我们迷失的信息在哪里

“我们迷失的信息”这句话有意思,一般说我们迷失在浩如烟海的信息里。LZ的意思是说语言学的真理就如同迷失了的信息,有意思。其实信息一直在那里,从未迷失,在静静等待我们去发现。
 
回复: 我们迷失的信息在哪里

“我们迷失的信息”这句话有意思,一般说我们迷失在浩如烟海的信息里。LZ的意思是说语言学的真理就如同迷失了的信息,有意思。其实信息一直在那里,从未迷失,在静静等待我们去发现。
呵呵,在互联网时代,我们不缺信息,我们缺乏甄别、判断信息的能力,在搜索引擎的帮助下,如果我们拿来就用,不加思考,我们的大脑犹如“抽水马桶”,信息来也匆匆,去也匆匆。我们每天面对海量的信息,缺少批判性思考,它们来去匆匆,不留痕迹,这就是所谓我们迷失的信息。
在语言学里,尤其如此。几十年来的传统语法可谓根深蒂固,影响深远,但在大量语言事实下仍有许多偏离规则和无法解释的现象。如词汇语法里的发现:collocation, colligation, semantic preference,semantic prosody. 当然传统语法在外语教学和研究中功不可没,但是语料库驱动的语言研究越来越成为传统语法的挑战。在传统语法信息铺天盖地的时候,我们有没有批判性地思考、继承和抛弃某些东西,如果没有,我们可以说掌握了语言学的信息,同时,我们也失去了某些语言学信息。
这里迷失的信息,不是我们失而复得的信息,而是指我们没有批判、没有思考的信息。我们受益于现代科技中,我们也迷失在现代科技中,信息亦然,语言学理论也是如此。
 
回复: 我们迷失的信息在哪里

"The patterns of aboutness ... created by the Guardian reflect not so much the world as it is, but rather the way the Guardian chooses to display it because of considerations such as newsworthiness."(P.46 from Teaching and Learning by Doing Corpus Analysis by Bernhard Kettemann & Georg Marko)
Similarly, theories of some linguists refelct not so much the language it is, but rather the way s/he chooses to display because of considerations such as conformity to invented facts.
 
回复: 我们迷失的信息在哪里

呵呵,在互联网时代,我们不缺信息,我们缺乏甄别、判断信息的能力,在搜索引擎的帮助下,如果我们拿来就用,不加思考,我们的大脑犹如“抽水马桶”,信息来也匆匆,去也匆匆。我们每天面对海量的信息,缺少批判性思考,它们来去匆匆,不留痕迹,这就是所谓我们迷失的信息。
在语言学里,尤其如此。几十年来的传统语法可谓根深蒂固,影响深远,但在大量语言事实下仍有许多偏离规则和无法解释的现象。如词汇语法里的发现:collocation, colligation, semantic preference,semantic prosody. 当然传统语法在外语教学和研究中功不可没,但是语料库驱动的语言研究越来越成为传统语法的挑战。在传统语法信息铺天盖地的时候,我们有没有批判性地思考、继承和抛弃某些东西,如果没有,我们可以说掌握了语言学的信息,同时,我们也失去了某些语言学信息。
这里迷失的信息,不是我们失而复得的信息,而是指我们没有批判、没有思考的信息。我们受益于现代科技中,我们也迷失在现代科技中,信息亦然,语言学理论也是如此。
不太明白你这里的“信息”,到底指什么?是指表层的语言事实呢,还是语言深层某些规律性的东西呢?我们生活在语言事实的海洋中,也许迷失于其中。语料库驱动的研究,可以帮助我们发现事实背后深层的,某些规律性的东西。我的理解,是把这些规律性的东西称为“信息”了,也许我理解有误吧。
 
回复: 我们迷失的信息在哪里

回复楼上:
迷失的信息不是失而复得的,而是对于很熟悉的东西,我们忽略了深层次的思考、批判性的思维。语言学里规律性的东西,理性主义者发现了很多,但还不够。实证主义(抑或经验主义)者的语言研究可以补充,甚至部分或全部(呵呵,是否太绝对,太乐观?)推翻以前的传统语法。尽管时间很漫长,道路很艰辛,但语料库驱动的研究方法已经表现出这样的势头,如词汇语法的提出。
室内语言学家根据内省和诱导数据推导出的有限的语言学规则已经无法解释实际发生的语言现象,如动词和形容词的去词汇化,多词单位的意义、功能和形式的同一体,以及语义韵等现象。这些现象从10年前的或许现在仍有大量的语法书和词典里我们找不到解释的方法。我们这一代从中学到大学的英语学习不正是传统语法的规则吗,以前没有意识到,只是在机读语料库时代,我们才意识到传统语法的不足。这就是我们在语言学理论里所迷失的信息,所遗漏的信息。
 
回复: 我们迷失的信息在哪里

在语料库时代,我们采用基于语料库的和语料库驱动的方法(主要这两种,还有语料库支持的方法)来语言语言。Elna Tognini Bonelli等已经区分了两种方法的不同。
前者在语料库研究中带有预设的语言理论,如传统语法,在研究中检验:语言事实是否支持、否定或补充预设的语言理论。如果支持,说明基于语料库的经验主义方法证实了传统语法,也说明传统语法不是想象中的那么糟;如果否定或补充,则说明该方法对语言学理论的变革。
后者在研究中没有语言理论预设,凭借足够多未标注的生语料,结合经验主义和理性主义的研究长处,从语料中归纳出语言学理论,亦称语料库语言学理论。
这两种方法(如前者对理论预设的否定或补充)都能帮助语料库语言学理论的提出和完善。但它们能保证我们在研究过程中不遗漏,抑或不迷失某些信息吗?显然在语料的人为痕迹上(附码软件CLAWS的准确率在95%以上,那剩下的4-5%的人工附码校对的准确率如何保证?尤其对于千万或上亿词次的语料库),在归纳过程中研究者的偏好上,在挂万漏一的统计中(语言是基于概率的。大概率的词语行为当然是关注的焦点,但小概率的、抑或偶然发生的语言事实很容易被忽略;在某些语言学研究中,小概率的语言事实不符合语言规则而被忽略,或者他们根本就不发明这样的小概率语言事实以佐证他们的语言规则),在某些噪音信息的舍弃中(噪音信息可能包含元信息和语境,忽略语境的语言研究人为地割裂了词汇和语法的联系,也破坏了词汇意义、形式和功能的有机整体),我们很容易迷失一些信息。这些迷失或遗漏的信息难道我们还指望一个后语料库时代去发现和补充吗?
上世纪的语言研究(也包括语料库研究)给我们留下的教训和经验,值得我们警醒和汲取。
呵呵,似乎扯得远了点。
 
Back
顶部