语料库语言学与计算语言学的区别

本人目前正考虑考研选专业的事。本来是想报考计算语言学,但后来发现有的学校开设有语料库语言学这个专业而没有计算语言学。本人只对计算语言学有初步的了解,知道计算语言学跟语料库语言学关系还是挺紧密的。因此我想问一下,这两个专业的区别和联系到底在哪里?这两个专业分别要学哪些知识或科目呢?

先行谢过了哈~~
 
语料库语言学,是计算语言学的子集,但也是一种渗透到多学科的研究手段

[FONT=幼圆]语料库语言学是对汇集起来而变成一个库的相当于[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]一大堆的语言表达[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]进行研究,所以是 [/FONT][FONT=&quot]“[/FONT][FONT=幼圆]抽样[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]。计算语言学是对语言的形式化与算法化与推理化与自动化与逻辑化甚至工程化(较多人认为[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]工程化的计算语言学可以视为自然语言处理这个范畴[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]), 并不限定于或瞄准于[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]一大堆的语言表达[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]进行研究,所以是[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语言材料的一切数学化或计算机化[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]。

当代的计算语言学教程教材通常会有专门的章节来谈论[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]或[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库语言学[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]或[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库手段[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]。例如下面的这些书籍购买的目录预览的链接:

http://book.360buy.com/10284888.html 俞士汶的《计算语言学概论》的第三章为[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]第三章 语料库:语言知识的另一种表示形式[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]

http://www.egou.com/product/01_3819348.html [/FONT][FONT=幼圆]苗天顺的《计算语言学与机器翻译导论》的第四章为[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库语言学[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]

http://auction1.paipai.com/D6FA1C420000000000563955061E4919#nolink [/FONT][FONT=幼圆]外语教学与研究出版社引进的《牛津计算语言学手册》的第24章为[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]Corpus Linguistics[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]

http://book.kongfz.com/5987/118476441/ [/FONT][FONT=幼圆]易绵竹和南振兴的《计算语言学[/FONT][FONT=&quot]——[/FONT][FONT=幼圆]迈向21世纪的语言学》也有专门的章节是[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库语言学的目的,方法,发展与现状[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]。

http://www.google.cn/books?id=wra4OgAACAAJ 宗成庆的《统计自然语言处理》也有章节是[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库技术[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]

http://auction1.paipai.com/A84FF6320000000000283B06078E2A03 [/FONT][FONT=幼圆]俞士汶和黄居仁主编的《计算语言学前瞻》从目录上却看不到[/FONT][FONT=&quot]“[/FONT][FONT=幼圆]语料库语言学[/FONT][FONT=&quot]”[/FONT][FONT=幼圆]的踪影
[/FONT]
[FONT=幼圆]通常,国内外的语料库语言学这个方向都是结合其他语言学的领域课题来进行的,例如:二语习得,话语分析,法律语言学,社会语言学。你瞧下面的Lancaster University的博士学位的“选题介绍”……[/FONT]


What areas can I research at Lancaster?

We welcome applications from anyone who wishes to pursue an interest within the broad fields of English language and linguistics, human communication, applied linguistics, and related areas of study. We are a large department with interests in a wide variety of topics:

  • Argumentation theory
  • Bilingualism and language contact
  • Cognitive Linguistics
  • Computer-mediated communication
  • Conversation analysis
  • Critical Discourse Analysis
  • Digital literacies
  • Discourse studies
  • Early childhood literacy
  • Language and education
  • Language and literacy in their social contexts
  • Language change and history of English
  • Language, communication and technology
  • Language, gender and sexuality
  • Linguistic theory and language description
  • Linguistic typology
  • Literacy studies
  • Media, Advertising and Brand communication
  • Metaphor studies
  • Morphology
  • Multimodality
  • Multimodality and semiotics
  • Phonetics
  • Phonology
  • Pragmatics
  • Social dialectology
  • Sociolinguistics of orthography
  • Stylistics
  • Syntax
  • Varieties of English in the UK and globally
Second language teaching, learning and assessment


  • Classroom language research
  • English for Academic Purposes
  • Expertise in learning and teaching
  • Inter-language pragmatics
  • Language attrition and loss
  • Language testing and assessment
  • Managing innovation in language teaching
  • Second language development
  • Tasks in language pedagogy
Methods of language research


  • Corpus Linguistics
  • Linguistic ethnography
  • Quantitative linguistics
可见,Corpus Linguistics被视为一种手段,这也是一种主流的看法;虽然,也有较少的人认为Corpus Linguistics有独立性或很大独立性。
 
回复: 语料库语言学与计算语言学的区别

谢谢您的回复!回答很详细,让我对两者的区别有了更深的认识。还有一个小问题,您认为作为一个对计算语言学很有兴趣的人,语料库语言学是不是一个合适的专业选择?
--本人是语言专业的学生,同时对计算机也非常感兴趣,因此想将两者的知识结合起来。不知道这个情况适不适合语料库语言学呢?
 
兴趣,能力,圈子与事业:需要自定义的4个Checkbox

谢谢您的回复!回答很详细,让我对两者的区别有了更深的认识。还有一个小问题,您认为作为一个对计算语言学很有兴趣的人,语料库语言学是不是一个合适的专业选择?
--本人是语言专业的学生,同时对计算机也非常感兴趣,因此想将两者的知识结合起来。不知道这个情况适不适合语料库语言学呢?

踏入计算语言学做语料库语言学,或者踏入语料库语言学做计算语言学,或者踏入其他语言学领域做语料库语言学为主的套路,或者踏入其他语言学领域或翻译学领域做语料库语言学与计算语言学密切结合的套路,到底如何侧重或结合,到底跨入三界中的那一界(外语界中文界计算机界)来搞计算语言学或语料库语言学,这一切,都牵涉到“兴趣,能力,圈子与事业这4个需要自定义的Checkbox”的单选或多选。考硕之前对读硕的兴趣定位和能力定位和事业定位,很可能受到读硕的圈子的重大影响与重大制约。圈子,就是你所在的大学的导师群的集体的研究套路及其对“异质(人才或兴趣)”的兼容性,也包括你导师的研究套路及其对“异质(人才或兴趣)”的兼容性,广义上,圈子也包括你所读的系列正式课程的授课教师的学术兴趣擅长对你的重要影响。读硕或读博期间,导师或其他导师对你所喜欢的研究套路或套路组合拳有可能并不欣赏而导致你前行的重重困难。硕士毕业忙于生活,往往对读硕期间的所学也几乎忘却而可以随风飘荡。读博之前和博士毕业之后,也有很类似的“忘却”与“飘荡”。真正有兴趣的东西,往往“越挫越坚”。随着时代的演进,学科的细化和学科间的融化,是两大主流,语言学也不例外,研究者最好打破自己的领域界限的“思维方式上的条条框框”。

计算机科学,属于更大范畴上的“信息科学”,信息科学有软分支与硬分支,现实中的个人都精力有限,很难面面顾及。计算语言学与计算机科学有更多的亲密关系,而语料库语言学则与语言学有更多的密切关系。个人的兴趣到底能不能成为能力,能不能成为事业,能不能适应具体的圈子,要在实践中才知道自己的“个性品质”。在追求成功的道路上,急躁的人往往在寻找捷径,耐心的人却在享受每一个细小的进展所带来的喜悦,读硕读博之前如果能多多积累,虽然耽误了一两年的“直升”,但却对个人有深远的影响,因为10大日益明显的趋势 ——(1)现在的读硕者几乎都是应届的,现在的读博者的应届生比例也越来越大了,(2)外语硕士的女生比例越来越高,(3)随着国家对外语博士授权点的越来越松的审批而导致了每年的博士点和博士生导师的猛增,(4)高校外语教师的科研考核往往与理工科的发表标准进行混同,(5)越来越多的高校开始规定外语教师必须读博才能评上副教授,(6)越来越多的高校开始规定外语教师必须读博才能保住现有饭碗,(7)越来越多的高校实行了以末位淘汰的形式进行硕士学历的教师的转岗或下岗,(8)越来越多的高校实施了更加遥不可及的职称评定标准,越来越多的高校对于引进“没有发表核心论文的普通的外语专业博士”并不感兴趣,(9)越来越多的外语博士只能蹲在“非英语专业的大学英语教学”的岗位上对自己的学术专长进行荒废,(10)某些高校的外语博士越来越“本校化,本导化,本市化,本省化,本职化,年轻化,快速化”……(说这些,只是提醒正在做人生决策的人:“读硕读博,越来越像购买一张注定要迅速贬值的股票,买的时候对自己说,总比不买要好,三五年后才发现手中的股票的贬值速度和贬值程度都远远超越了自己的心理承受能力”)
 
Last edited:
回复: 兴趣,能力,圈子与事业:需要自定义的4个Checkbox

踏入计算语言学做语料库语言学,或者踏入语料库语言学做计算语言学,或者踏入其他语言学领域做语料库语言学为主的套路,或者踏入其他语言学领域或翻译学领域做语料库语言学与计算语言学密切结合的套路,到底如何侧重或结合,到底跨入三界中的那一界(外语界中文界计算机界)来搞计算语言学或语料库语言学,这一切,都牵涉到“兴趣,能力,圈子与事业这4个需要自定义的Checkbox”的单选或多选。考硕之前对读硕的兴趣定位和能力定位和事业定位,很可能受到读硕的圈子的重大影响与重大制约。圈子,就是你所在的大学的导师群的集体的研究套路及其对“异质(人才或兴趣)”的兼容性,也包括你导师的研究套路及其对“异质(人才或兴趣)”的兼容性,广义上,圈子也包括你所读的系列正式课程的授课教师的学术兴趣擅长对你的重要影响。读硕或读博期间,导师或其他导师对你所喜欢的研究套路或套路组合拳有可能并不欣赏而导致你前行的重重困难。硕士毕业忙于生活,往往对读硕期间的所学也几乎忘却而可以随风飘荡。读博之前和博士毕业之后,也有很类似的“忘却”与“飘荡”。真正有兴趣的东西,往往“越挫越坚”。随着时代的演进,学科的细化和学科间的融化,是两大主流,语言学也不例外,研究者最好打破自己的领域界限的“思维方式上的条条框框”。

计算机科学,属于更大范畴上的“信息科学”,信息科学有软分支与硬分支,现实中的个人都精力有限,很难面面顾及。计算语言学与计算机科学有更多的亲密关系,而语料库语言学则与语言学有更多的密切关系。个人的兴趣到底能不能成为能力,能不能成为事业,能不能适应具体的圈子,要在实践中才知道自己的“个性品质”。在追求成功的道路上,急躁的人往往在寻找捷径,耐心的人却在享受每一个细小的进展所带来的喜悦,读硕读博之前如果能多多积累,虽然耽误了一两年的“直升”,但却对个人有深远的影响,因为10大日益明显的趋势 ——(1)现在的读硕者几乎都是应届的,现在的读博者的应届生比例也越来越大了,(2)外语硕士的女生比例越来越高,(3)随着国家对外语博士授权点的越来越松的审批而导致了每年的博士点和博士生导师的猛增,(4)高校外语教师的科研考核往往与理工科的发表标准进行混同,(5)越来越多的高校开始规定外语教师必须读博才能评上副教授,(6)越来越多的高校开始规定外语教师必须读博才能保住现有饭碗,(7)越来越多的高校实行了以末位淘汰的形式进行硕士学历的教师的转岗或下岗,(8)越来越多的高校实施了更加遥不可及的职称评定标准,越来越多的高校对于引进“没有发表核心论文的普通的外语专业博士”并不感兴趣,(9)越来越多的外语博士只能蹲在“非英语专业的大学英语教学”的岗位上对自己的学术专长进行荒废,(10)某些高校的外语博士越来越“本校化,本导化,本市化,本省化,本职化,年轻化,快速化”……(说这些,只是提醒正在做人生决策的人:“读硕读博,越来越像购买一张注定要迅速贬值的股票,买的时候对自己说,总比不买要好,三五年后才发现手中的股票的贬值速度和贬值程度都远远超越了自己的心理承受能力”)
 
We are in a sinking boat.

中国正在推行自主性学习,外语的自主性学习(尤其是基于互联网与多媒体甚至人工智能技术的自主性学习,虽然目前的外语自主性学习网站都很死板,比单纯建立一个FTP站点好不了多少),一方面是减轻外语教师的工作负担,另一方面也是为大批量的外语教师下岗转岗分流而奠定基础的。英语专业对中国高校的广泛渗透程度是其他专业无法比拟的,全民学外语嘛。英语专业也是最难就业的本科专业排行榜的“前三强”呢!

http://news.xinhuanet.com/edu/2010-06/03/c_12174260.htm

……,有8个专业是连续三届(2007届~2009届)失业人数最多的专业:法学、计算机科学与技术、英语、国际经济与贸易、工商管理、汉语言文学、电子信息工程、会计学。……


中国高校又普遍的负债累累,不禁令人忧虑心中生……


 
回复: 语料库语言学与计算语言学的区别

语料库语言学与计算语言学是两个不同却又有着千丝万缕的联系的学科。

计算语言学的应用方向相当广泛,当前比较主要的应用领域包括搜索引擎建设、自然语言处理、机器翻译、文本分类聚类、基于语义研究的文本立场判定,文本类型识别,舆情分析等。计算语言学是一个偏理科的专业,研究和开发能力是这个专业的主要目标。选择这个专业,一个必须具备的素质就是熟练掌握一门编程语言,并且掌握数据库和基本的网络技术,否则很难在这个专业上有所建树。如果想进一步发展,还要在统计数学,人工智能等领域进行深入学习。计算语言学专业的主要就业方向是IT企业的研究机构。

语料库语言学研究的主要应用方向有两个:一是基于单语语料库的语言学习研究,主要包括语言习得过程量化,特征分析,對比分析,写作质量评价,错误现象分析以及语言测试研究;二是基于双语语料库的翻译研究。语料库语言学主要培养学生使用各种已有软件进行分析的应用能力,其范围偏向文科,就业范围相对计算语言学专业狭窄,基本局限于高校和文科研究机构。

从楼主提供的背景信息看,建议你选择语料库方向。
 
回复: 兴趣,能力,圈子与事业:需要自定义的4个Checkbox

踏入计算语言学做语料库语言学,或者踏入语料库语言学做计算语言学,或者踏入其他语言学领域做语料库语言学为主的套路,或者踏入其他语言学领域或翻译学领域做语料库语言学与计算语言学密切结合的套路,到底如何侧重或结合,到底跨入三界中的那一界(外语界中文界计算机界)来搞计算语言学或语料库语言学,这一切,都牵涉到“兴趣,能力,圈子与事业这4个需要自定义的Checkbox”的单选或多选。

诚哉斯言!
 
回复: 语料库语言学与计算语言学的区别

我是新手,在论坛里浏览的收获真的很大!谢谢各位大师们!
 
回复: 语料库语言学与计算语言学的区别

我认为计算语言学要比语料库的范围广一些,语料库语言学只能算是计算语言学的一个子集!
 
回复: 语料库语言学与计算语言学的区别

Computational linguistics is more technically oriented toward Natural Language Processing (NLP) and language engineering whereas corpus linguistics is more theoretically oriented toward to linguistic investigations.

Both create and use corpora, but the corpora created and used in computational linguistics are typically specialised (i.e. domain or genre specific, e.g. most of the corpora released by the LDC) while corpus linguistics prefers so-called balanced representative corpora (e.g. the BNC and corpora of the Brown family).

Computational linguists tend to use the linguistic knowledge derived by corpus linguists on the basis of representative corpora to develop language models (and hence corpus processing tools and more) while corpus linguists tend to use the tools developed by computational linguists to create better corpora more easily (and hence better linguistic theory and empirical basis for language modeling).

The two can be said to have different focuses of research but complement and support each other.
 
Back
顶部