这个话题在我们这里依然讨论不多。国外一批学者在这个不大不小的领域已经小有成果。虽然还是有不少批评,至少是已经为WEB AS CORPUS建立了一个身份,相应的理论也通过一系列的文献渐渐建立起来了。我一直是WAC的粉丝,希望国内对这个领域的关注多一点。
尽管从根本上否认“WEB AS CORPUS”这个概念的声音很强大。但是不得不承认的是,WAC的实用价值很强大,不管是对于搞研究的还是搞文字工作的,尤其是后者,可能更能切身认识到WAC的价值。我本人也是个翻译,主要干英翻汉的活,曾经也是一时顿悟才想到了GOOGLE,发现就大喜。
为什么我这样的人喜欢GOOGLE,因为母语不是英语,语言知识有限,工作需要大量写英语,几本字典根本解决不了问题,需要大量可检索的本族语者文本和中英对照文本来做两件事,我自己用这样两个词来表示:知识挖掘和假设检验。从本族语文本和中英对照文本中都能挖掘出词语和表达方面的知识,假设检验主要是通过本族语者语料。
中英对照文本能派不小的用场,不过,对于外文写译工作中大量的择词表达问题,可检索的本族语者文本也同样有用,甚至可以说更有用。所谓大量文本,究竟大到什么程度?如果经常用外语写作或者往外文里译东西就知道了,BNC、ANC等几个大部头的攒一块也不够(信不信由您)。
为什么用GOOGLE,一方面是因为它索引过的文本数量大些,更重要的是GOOGLE有一个通配符(*),目前就GOOGLE一家有,这个星花十分有用,决定了GOOGLE能成为当前WAC“首席”工具中的一种,虽然GOOGLE对于语料查询而言已经“简陋”到了极致,举个简单的例子"a * consumption culture",你能用这个星花钓出许多供参考的形容词。对于相对不很常见的词语组合,用正统语料库解决不了几个,常常检索不到什么有用的资料,可是GOOGLE,常常可以“得手”。
这就是十分小众的“Google 语言学”,没几个人用这个词。不过不得不承认是个不错的字眼,跟“语料库语言学”一个骨架。当然了,Google语言学必定成不了气候,正如国外某个WAC学者说的那样:Google技巧玩得溜,不如赶快搞个和Google一样大的语言学检索引擎。这就是那些人正在努力的方向,虽然还比较遥远。
尽管从根本上否认“WEB AS CORPUS”这个概念的声音很强大。但是不得不承认的是,WAC的实用价值很强大,不管是对于搞研究的还是搞文字工作的,尤其是后者,可能更能切身认识到WAC的价值。我本人也是个翻译,主要干英翻汉的活,曾经也是一时顿悟才想到了GOOGLE,发现就大喜。
为什么我这样的人喜欢GOOGLE,因为母语不是英语,语言知识有限,工作需要大量写英语,几本字典根本解决不了问题,需要大量可检索的本族语者文本和中英对照文本来做两件事,我自己用这样两个词来表示:知识挖掘和假设检验。从本族语文本和中英对照文本中都能挖掘出词语和表达方面的知识,假设检验主要是通过本族语者语料。
中英对照文本能派不小的用场,不过,对于外文写译工作中大量的择词表达问题,可检索的本族语者文本也同样有用,甚至可以说更有用。所谓大量文本,究竟大到什么程度?如果经常用外语写作或者往外文里译东西就知道了,BNC、ANC等几个大部头的攒一块也不够(信不信由您)。
为什么用GOOGLE,一方面是因为它索引过的文本数量大些,更重要的是GOOGLE有一个通配符(*),目前就GOOGLE一家有,这个星花十分有用,决定了GOOGLE能成为当前WAC“首席”工具中的一种,虽然GOOGLE对于语料查询而言已经“简陋”到了极致,举个简单的例子"a * consumption culture",你能用这个星花钓出许多供参考的形容词。对于相对不很常见的词语组合,用正统语料库解决不了几个,常常检索不到什么有用的资料,可是GOOGLE,常常可以“得手”。
这就是十分小众的“Google 语言学”,没几个人用这个词。不过不得不承认是个不错的字眼,跟“语料库语言学”一个骨架。当然了,Google语言学必定成不了气候,正如国外某个WAC学者说的那样:Google技巧玩得溜,不如赶快搞个和Google一样大的语言学检索引擎。这就是那些人正在努力的方向,虽然还比较遥远。