[推荐]统计自然语言处理基础――国外计算机科学教材系列

清风出袖

高级会员
近年来,自然语言处理中的统计学方法已经逐渐成为主流。本书是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。本书涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析,适合不同水平的读者群的需求。同时,本书将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。在本书的配套网站上提供了许多相关资源和工具,便于读者结合书中习题,在实践中获得提高。
本书不仅适合作为自然语言处理方向的研究生的教材,也非常适合作为自然语言处理相关领域的研究人员和技术人员的参考资料。


第一部分 基础知识
第1章 绪论
1.1 理性主义者和经验主义者的方法
1.2 科学内容
1.3 语言中的歧义问题是自然语言难以处理的原因
1.4 第一手资料
1.5 深入阅读
1.6 习题
第2章 数学基础
2.1 概率论基础
2.2 信息论基础
2.3 深入阅读
2.4 习题
第3章 语言学基础
3.1 词性和词法
3.2 短语结构
3.3 语义和语用
3.4 其他研究领域
3.5 深入阅读
3.6 习题
第4章 基于语料库的工作
4.1 基础知识
4.2 文本
4.3 数据标注
4.4 深入阅读
4.5 习题
第二部分 词法
第5章 搭配
5.1 频率
5.2 均值和方差
5.3 假设检验
5.4 互信息
5.5 搭配的概念
5.6 深入阅读
5.7 习题
第6章 统计推理:稀疏数据集上的n元语法模型
6.1 Bins:构造等价类
6.2 统计估计
6.3 组合估计法
6.4 结论
6.5 深入阅读
6.6 习题
第7章 语义消歧
7.1 预备知识
7.2 有监督消歧
7.3 基于词典的消歧
7.4 无监督消歧
7.5 什么是语义
7.6 深入阅读
7.7 习题
第8章 词汇获取
8.1 评价方法
8.2 动词子范畴
8.3 附着歧义
8.4 选择倾向
8.5 语义相似性
8.6 统计自然语言处理中词汇获取的作用
8.7 深入阅读
8.8 习题
第三部分 语法
第9章 马尔可夫模型
9.1 以尔可夫模型
9.2 隐马尔可夫模型
9.3 隐马尔可夫模型的三个基本问题
9.4 隐马尔可夫模型:实现、性质和变形
9.5 深入阅读
9.6 习题
第10章 词性标注
10.1 标注中的信息源
10.2 马尔可夫模型标注器
10.3 隐马尔可夫标注器
10.4 基于转换的标注学习
10.5 其他模型和语言
10.6 标注准确率和标注器的应用
10.7 深入阅读
10.8 习题
第11章 概率上下文无关文法
11.1 概率上下文无关文法的一些特征
11.2 概率上下文无关文法的问题
11.3 词串概率的计算
11.4 内部-外部算法的问题
11.5 深入阅读
11.6 习题
第12章 概率句法分析
12.1 一些概念
12.2 一些方法
12.3 深入阅读
12.4 习题
第四部分 应用于技术
第13章 统计对齐和机器翻译
13.1 文本对齐
13.2 词对齐
13.3 统计机器翻译
13.4 深入阅读
13.5 习题
第14章 聚类
14.1 层级聚类
14.2 非层级聚类
14.3 深入阅读
14.4 习题
第15章 信息检索
15.1 个息检索的背景
15.2 向量空间模型
15.3 词条分布模型
15.4 潜在语义索引
15.5 篇章分割
15.6 深入阅读
15.7 习题
第16章 文本分类
16.1 决策树
16.2 最大熵建模
16.3 感知器
16.4 k最近邻分类
16.5 深入阅读
16.6 习题
附录A 统计表
参考文献
符号表
 
作者:christopher d. manning
hinrich schutze
出版社:电子工业出版社
译者:苑春法,李庆中,王昀,李伟,曹德芳
2005-1 出版
 
自然语言处理综论    
(美)朱夫斯凯 译者: 冯志伟

内容提要

本书是一本全面系统地讲述计算机自然语言处理的优秀教材。本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的"黄金标准"。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论述单词的自动形态分析,接着论述自动句法分析,然后论述各种语言单位的自动语义分析,最后论述连贯文本的自动分析、对话与会话的智能代理以及自然语言生成。从技术的角度看,本书介绍了正则表达式、有限状态自动机、文本-语音转换、发音与拼写的概率模型、词类自动标注、N元语法、隐马尔可夫模型、上下文无关语法、特征与合一、词汇化剖析与概率剖析、一阶谓词演算、词义排歧、修辞结构理论、机器翻译等非常广泛的内容。本书具有"覆盖全面、注重实用、强调评测、语料为本"四大特色。在本书的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。
本书不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,而且也是从事自然语言处理相关领域的研究人员和技术人员的必备参考。
Daniel Jurafsky
在美国加利福尼亚大学获计算机科学博士学位, 现于美国科罗拉多大学语言学系和计算机科学系任教, 并在认知科学研究所工作, 主要研究方向为语言的概率模型和语音信息处理. 由于他在语音和语言处理方面的成就, 于1997年获美国NSF职业奖.
James H.Martin
在美国加利福尼亚大学获计算机科学博士学位, 现任职于美国科罗拉多大学计算机科学系和认知科学研究所, 主要研究方向为计算语义学. 机器学习和信息检索.
冯志伟国家教育部语言文字应用研究所研究员. 博士生导师. 先后在北京大学和中国科学技术大学获双硕士位, 在语音和语言的计算机处理领域具有多年的研究经验, 曾在多个国家参与研究和教学工作, 主要研究方向为自然语言处理. 计算语言学和机器翻译, 主要著作有《自然语言的计算机处理》和《数理语言学》等18部.
书 名 自然语言处理综论 页数 588
作 者 (美)朱夫斯凯 译者: 冯志伟 开本 16
责任编辑 字数 千字
出 版 社 电子工业出版社 印张 0
出版时间 2005年6月第1版 页数 588
再版时间 2005年6月第1次 书号 121-00776-2
装 帧 平装 定价 78元
册 每 包 0 特价 无
带盘 否
第1章 导论
1.1 语音与语言处理中的知识
1.2 歧义
1.3 模型和算法
1.4 语言. 思维和理解
1.5 学科现状与近期发展
1.6 语音和语言处理简史
1.6.1 基础研究:20世纪40年代和20世纪50年代
1.6.2 两个阵营:1957年至1970年
1.6.3 四个范型:1970年至1983年
1.6.4 经验主义和有限状态模型的复苏:1983年至1993年
1.6.5 不同领域的合流:1994年至1999年
1.6.6 多重发现
1.6.7 心理学的简要注记
1.7 小结
1.8 文献和历史说明
第一部分 词汇的计算机处理
第2章 正则表达式与自动机
2.1 正则表达式
2.1.1 基本正则表达式模式
2.1.2 析取. 组合与优先关系
2.1.3 一个简单的例子
2.1.4 一个比较复杂的例子
2.1.5 高级算符
2.1.6 正则表达式中的替换. 存储器与ELIZA
2.2 有限状态自动机
2.2.1 用FSA来识别羊的语言
2.2.2 形式语言
2.2.3 另外的例子
2.2.4 非确定FSA
2.2.5 使用NFSA接收符号串
2.2.6 识别就是搜索
2.2.7 确定自动机与非确定自动机的关系
2.3 正则语言与FSA
2.4 小结
2.5 文献和历史说明
第3章 形态学与有限状态转录机
3.1 英语形态学概观
3.1.1 屈折形态学
3.1.2 派生形态学
3.2 有限状态形态剖析
3.2.1 词表和形态顺序规则
3.2.2 用有限状态转录机进行形态剖析
3.2.3 正词法规则和有限状态转录机
3.3 把FST词表与规则相结合
3.4 与词表无关的FST:PORTER词干处理器
3.5 人是怎样进行形态处理的
3.6 小结
3.7 文献和历史说明
第4章 计算音系学与文本-语音转换
4.1 言语语音与语音标音法
4.1.1 发音器官
4.1.2 辅音:发音部位
4.1.3 辅音:发音方法
4.1.4 元音
4.1.5 音节
4.2 音位和音位规则
4.3 音位规则和转录机
4.4 计算音系学中的一些高级问题
4.4.1 元音和谐
4.4.2 模板式形态学
4.4.3 优选理论
4.5 音位规则的机器学习
4.6 TTS中从文本映射到语音
4.6.1 发音词典
4.6.2 词典之外的查找:文本分析
4.6.3 基于有限状态转录机(FST)的发音词典
4.7 文本-语音转换中的韵律
4.7.1 韵律的音系学性质
4.7.2 韵律的语音和声学性质
4.7.3 语音合成中的韵律
4.8 人处理音位和形态的过程
4.9 小结
4.10 文献和历史说明
第5章 发音与拼写的概率模型
5.1 关于拼写错误
5.2 拼写错误模式
5.3 非词错误的检查
5.4 概率模型
5.5 把贝叶斯方法应用于拼写
5.6 最小编辑距离
5.7 英语的发音变异
5.8 发音问题研究中的贝叶斯方法
5.8.1 发音变异的决策树模型
5.9 加权自动机
5.9.1 从加权自动机计算似然度:向前算法
5.9.2 解码:Viterbi算法
5.9.3 加权自动机和切分
5.9.4 用切分来进行词表的自动归纳
5.10 人类发音研究
5.11 小结
5.12 文献和历史说明
第6章 N元语法
6.1 语料库中单词数目的计算
6.2 简单的(非平滑的)N元语法
6.2.1 N元语法及其对训练语料库的敏感性
6.3 平滑
6.3.1 加1平滑
6.3.2 Witten-Bell打折法
6.3.3 Good-Turing打折法
6.4 回退
6.4.1 回退与打折相结合
6.5 删除插值法
6.6 拼写和发音的N元语法
6.6.1 上下文有关的错拼更正
6.6.2 发音模型的N元语法
6.7 熵
6.7.1 用于比较模型的交叉熵
6.7.2 英语的熵
6.8 小结
6.9 文献和历史说明
第7章 HMM与语音识别
7.1 语音识别的总体结构
7.2 隐马尔可夫模型概述
7.3 再谈Viterbi算法
7.4 先进的解码方法
7.4.1 A*解码算法
7.5 语音的声学处理
7.5.1 声波
7.5.2 怎样解释波形
7.5.3 声谱
7.5.4 特征抽取
7.6 声学概率的计算
7.7 语音识别系统的训练
7.8 用于语音合成的波形生成
7.8.1 音高和音延的修正
7.8.2 单元选择
7.9 人的语音识别
7.10 小结
7.11 文献和历史说明
第二部分 句法的计算机处理
第8章 词的分类与词类标注
8.1 大多数英语词的分类
8.2 英语的标记集
8.3 词类标注
8.4 基于规则的词类标注
8.5 随机词类标注
8.5.1 说明问题的一个例子
8.5.2 实际的HMM标注算法
8.6 基于转换的标注
8.6.1 怎样应用TBL规则
8.6.2 怎样学习TBL规则
8.7 其他问题
8.7.1 多重标记和多项词
8.7.2 未知词
8.7.3 基于类的N元语法
8.8 小结
8.9 文献和历史说明
第9章 英语的上下文无关语法
9.1 组成性
9.2 上下文无关规则和树
9.3 句子级的结构
9.4 名词短语
9.4.1 在中心名词前的成分
9.4.2 名词后的成分
9.5 并列关系
9.6 一致关系
9.7 动词短语和次范畴化
9.8 助动词
9.9 口语的句法
9.9.1 不流畅现象
9.10 语法等价与范式
9.11 有限状态语法和上下文无关语法
9.12 语法和人的语言处理
9.13 小结
9.14 文献和历史说明
第10章 基于上下文无关语法的剖析
10.1 剖析就是搜索
10.1.1 自顶向下剖析
10.1.2 自底向上剖析
10.1.3 自顶向下剖析与自底向上剖析的对比
10.2 基本的自顶向下剖析
10.2.1 增加自底向上过滤
10.3 基本的自顶向下剖析的问题
10.3.1 左递归
10.3.2 歧义
10.3.3 子树的重复剖析
10.4 Earley算法
10.4.1 预测
10.4.2 扫描
10.4.3 完成
10.4.4 示例
10.4.5 从线图中检索剖析树
10.5 有限状态剖析方法
10.6 小结
10.7 文献和历史说明
第11章 特征与合一
11.1 特征结构
11.2 特征结构的合一
11.3 语法中的特征结构
11.3.1 一致关系
11.3.2 中心语特征
11.3.3 次范畴化
11.3.4 其他词类的次范畴化
11.3.5 长距离依存关系
11.4 合一的实现
11.4.1 合一的数据结构
11.4.2 合一算法
11.5 带有合一约束的剖析
11.5.1 把合一结合到Earley剖析器中
11.5.2 复制的必要性
11.5.3 合一剖析
11.6 类型与继承
11.6.1 类型的扩充
11.6.2 合一的其他扩充
11.7 小结
11.8 文献和历史说明
第12章 词汇化剖析与概率剖析
12.1 概率上下文无关语法
12.1.1 PCFG的概率CYK剖析
12.1.2 PCFG概率的学习
12.2 PCFG的问题
12.3 概率词汇化的CFG
12.4 依存语法
12.4.1 范畴语法
12.5 人的剖析
12.6 小结
12.7 文献和历史说明
第13章 语言的复杂性
13.1 Chomsky层级
13.2 怎么判断一种语言不是正则的
13.2.1 抽吸引理
13.2.2 英语和其他自然语言是正则语言吗
13.3 自然语言是上下文无关的吗
13.4 计算复杂性和人的语言处理
13.5 小结
13.6 文献和历史说明
第三部分 语义的计算机处理
第14章 意义的表示法
14.1 意义表示的计算要求
14.1.1 可能性验证
14.1.2 无歧义表示
14.1.3 规范形式
14.1.4 推论与变元
14.1.5 表达能力
14.2 语言的意义结构
14.2.1 谓词论元结构
14.3 一阶谓词演算
14.3.1 FOPC基础
14.3.2 FOPC的语义
14.3.3 变量和逻辑量词
14.3.4 推论
14.4 某些与语言学相关的概念
14.4.1 范畴
14.4.2 事件
14.4.3 时间表示
14.4.4 体
14.4.5 信念表示
14.4.6 缺陷
14.5 有关的表示方法
14.6 意义的其他表示方法
14.6.1 作为行动的意义
14.6.2 作为真值的意义
14.7 小结
14.8 文献和历史说明
第15章 语义分析
15.1 句法驱动的语义分析
15.1.1 给上下文无关语法规则扩充语义
15.1.2 量词辖域和复杂项的转译
15.2 给英语片断附加语义分析
15.2.1 句子
15.2.2 名词短语
15.2.3 动词短语
15.2.4 介词短语
15.3 把语义分析结合到Earley剖析中
15.4 惯用语和组成性
15.5 鲁棒的语义分析
15.5.1 语义语法
15.5.2 信息抽取
15.6 小结
15.7 文献和历史说明
第16章 词汇语义学
16.1 词位及其涵义之间的关系
16.1.1 同形关系
16.1.2 多义关系
16.1.3 同义关系
16.1.4 上下位关系
16.2 WORDNET:词汇关系信息库
16.3 词的内在结构
16.3.1 题元角色
16.3.2 选择限制
16.3.3 基元分解
16.3.4 语义场
16.4 语言的创造性与词典
16.4.1 隐喻
16.4.2 换喻
16.4.3 隐喻和换喻的计算方法
16.5 小结
16.6 文献和历史说明
第17章 词义排歧与信息检索
17.1 基于选择限制的排歧
17.1.1 选择限制的局限性
17.2 鲁棒的词义排歧
17.2.1 机器学习方法
17.2.2 基于词典的方法
17.3 信息检索
17.3.1 向量空间模型
17.3.2 检索词加权
17.3.3 检索词的选择和创造
17.3.4 同形关系. 多义关系和同义关系
17.3.5 改进用户的查询条件
17.4 信息检索的其他任务
17.5 小结
17.6 文献和历史说明
第四部分 语用的计算机处理
第18章 话语
18.1 所指判定
18.1.1 所指现象
18.1.2 同指的句法和语义约束
18.1.3 代词解释中的优先关系
18.1.4 代词判定算法
18.2 文本的连贯
18.2.1 现象
18.2.2 基于推理的判定算法
18.3 话语结构
18.4 所指和连贯的心理语言学研究
18.5 小结
18.6 文献和历史说明
第19章 对话与会话智能代理
19.1 什么使对话出现差别
19.1.1 话轮和话段
19.1.2 对话的共同基础
19.1.3 会话隐涵
19.2 对话行为
19.3 对话行为的自动解释
19.3.1 对话行为的计划推理解释
19.3.2 对话行为的基于提示的解释
19.3.3 要点
19.4 对话结构与连贯性
19.5 会话智能代理中的对话管理
19.6 小结
19.7 文献和历史说明
第20章 自然语言生成
20.1 语言生成导引
20.2 生成的体系结构
20.3 表层实现
20.3.1 系统语法
20.3.2 功能合一语法
20.3.3 要点
20.4 话语规划
20.4.1 文本说明图
20.4.2 修辞关系
20.4.3 小结
20.5 其他问题
20.5.1 微规划
20.5.2 词汇选择
20.5.3 生成系统评价
20.5.4 语音生成
20.6 小结
20.7 文献和历史说明
第21章 机器翻译
21.1 语言的相似性和差异性
21.2 转换模型
21.2.1 句法转换
21.2.2 词汇转换
21.3 中间语的思想:使用意义
21.4 直接转换
21.5 使用统计技术
21.5.1 流畅性的量化
21.5.2 忠实性的量化
21.5.3 输出的搜索
21.6 可用性与系统开发
21.7 小结
21.8 文献和历史说明
附录A 正则表达式的算符
附录B PORTER STEMMING算法
附录C 标记集C5和C7
附录D HMM模型的训练:向前-向后算法
参考文献
术语表
</font>
















译者序














采用计算机技术来研究和处理自然语言是20世纪 40 年代末期和20世纪50年代才开始的, 50多年来, 这项研究取得了长足的进展, 成为了计算机科学中一门重要的新兴学科--自然语言处理(Natural Language Processing, 简称NLP).
我们认为, 计算机对自然语言的研究和处理, 一般应经过以下4方面的过程:
1. 把需要研究的问题在语言学上加以形式化, 使之能以一定的数学形式, 严密而规整地表示出来,
2. 把这种严密而规整的数学形式表示为算法, 使之在计算上形式化,
3. 根据算法编写计算机程序, 使之在计算机上加以实现,
4. 对于所建立的自然语言处理系统进行评测, 使之不断地改进质量和性能, 以满足用户的要求.
美国计算机科学家Bill Manaris在Advanced in Computers(《计算机进展》)第47卷的Natural language processing: A human-computer interaction perspective(《从人机交互的角度看自然语言处理》)一文中曾经给自然语言处理提出了如下的定义:
自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科. 自然语言处理要研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型, 建立计算框架来实现这样的语言模型, 提出相应的方法来不断地完善这样的语言模型, 根据这样的语言模型设计各种实用系统, 并探讨这些实用系统的评测技术.
Bill Manaris关于自然语言处理的这个定义, 比较全面地表达了计算机对自然语言的研究和处理的上述四个方面的过程. 我们认同这样的定义.
根据这样的定义, 我们认为, 建立自然语言处理模型需要如下不同平面的知识:
1. 声学和韵律学的知识:描述语言的节奏. 语调和声调的规律, 说明语音怎样形成音位.
2. 音位学的知识:描述音位的结合规律, 说明音位怎样形成语素.
3. 形态学的知识:描述语素的结合规律, 说明语素怎样形成单词.
4. 词汇学的知识:描述词汇系统的规律, 说明单词本身固有的语义特性和语法特性.
5. 句法学的知识:描述单词(或词组)之间的结构规则, 说明单词(或词组)怎样形成句子.
6. 语义学的知识:描述句子中各个成分之间的语义关系, 这样的语义关系是与情景无关的, 说明怎样从构成句子的各个成分推导出整个句子的语义.
7. 话语分析的知识:描述句子与句子之间的结构规律, 说明怎样由句子形成话语或对话.
8. 语用学的知识:描述与情景有关的情景语义, 说明怎样推导出句子具有的与周围话语有关的各种涵义.
9. 外界世界的常识性知识:描述关于语言使用者和语言使用环境的一般性常识, 例如, 语言使用者的信念和目的, 说明怎样推导出这样的信念和目的内在的结构.
当然, 关于自然语言处理所涉及的知识平面还有不同的看法, 不过, 一般而言, 大多数的自然语言处理研究人员都认为, 这些语言学知识至少可以分为词汇学知识. 句法学知识. 语义学知识和语用学知识等平面. 每一个平面传达信息的方式各不相同. 例如, 词汇学平面可能涉及具体的单词的构成成分(例如, 语素)以及它们的屈折变化形式的知识, 句法学平面可能涉及在具体的语言中单词或词组怎样结合成句子的知识, 语义学平面可能涉及怎样给具体的单词或句子指派意义的知识, 语用学平面可能涉及在对话中话语焦点的转移以及在给定的上下文中怎样解释句子的涵义的知识.
下面我们具体说明在自然语言处理中这些知识平面的一般情况. 如果对计算机发一个口头的指令:Delete file x(删除文件X), 为了通过自然语言处理系统让计算机理解这个指令的涵义, 并且执行这个指令, 一般来说需要经过如图0.1所示的处理过程.
图0.1 自然语言处理系统中的知识平面
从图中可以看出, 自然语言处理系统首先把指令Delete file x在音位学平面转化成音位系列dilet'#fail#eks, 然后在形态学平面把这个音位系列转化为语素系列delete, file和x, 接着在词汇学平面把这个语素系列转化为单词系列并标注相应的词性:("delete"VERB) ("file"NOUN) ("x"ID), 在句法学平面进行句法分析, 得到这个单词系列的句法结构, 用树形图表示, 在语义学平面得到这个句法结构的语义解释delete-file ("x"), 在语用学平面得到这个指令的语用解释rm -i x, 最后让计算机执行这个指令.
这个例子来自美国自然语言处理学者Wilensky为UNIX设计的一个语音理解界面, 叫做UNIX Consultant. 这个语音理解界面使用了上述的第1个至第6个平面的知识, 得到口头指令Delete file x的语义解释:delete-file ("x"). 然后, 使用第8个平面的语用学知识把这个语义解释转化为计算机的指令语言 rm -i x, 让计算机执行这个指令, 这样便可以使用口头指令来指挥计算机的运行了.
不同的自然语言处理系统需要的知识平面可能与UNIX Consultant不一样, 根据实际应用的不同要求, 很多自然语言处理系统只需要使用上述9个平面中的部分平面的知识就行了. 例如, 书面语言的机器翻译系统只需要第3个至第7个平面的知识, 个别的机器翻译系统还需要第8个方面的知识, 语音识别系统只需要第1个至第5个平面的知识.
上述9个平面的知识主要涉及的是语言学知识, 由于自然语言处理是一个多边缘的交叉学科, 除了语言学之外, 它还涉及如下的知识领域:
● 计算机科学:给自然语言处理提供模型表示. 算法设计和计算机实现的技术.
● 数学:给自然语言处理提供形式化的数学模型和形式化的数学方法.
● 心理学:给自然语言处理提供人类言语行为的心理模型和理论.
● 哲学:给自然语言处理提供关于人类的思维和语言的更深层次的理论.
● 统计学:给自然语言处理提供基于样本数据来预测统计事件的技术.
● 电子工程:给自然语言处理提供信息论的理论基础和语言信号处理技术.
● 生物学:给自然语言处理提供大脑中人类语言行为机制的理论.
自然语言处理需要的知识如此之丰富, 涉及的领域如此之广泛, 而我们翻译的美国科罗拉多大学Daniel Jurafsky 和James Martin的这本著作正好满足了这样的要求.
几年前我从韩国到新加坡参加国际会议时, 在书店发现此书, 马上就被它丰富的内容和流畅的表达吸引住了. 会议结束回到韩国之后, 我就开始认真阅读此书, 我发现此书覆盖面非常广泛, 理论分析十分深入, 而且强调实用性和注重评测技术, 几乎所有的例子都来自真实的语料库, 此书的内容不仅覆盖了我们在上面所述的9个平面的语言学知识和外在世界的常识性知识, 而且还涉及到计算机科学. 数学. 心理学. 哲学. 统计学. 电子工程和生物学等领域的知识, 我怀着极大的兴趣前后通读了两遍. 当时我在韩国科学技术院电子工程与计算机科学系担任访问教授, 在我给该系博士研究生开的"自然语言处理-II"(NLP-II)的课程中, 使用了该书的部分内容, 效果良好. 我觉得这确实是一本很优秀的自然语言处理的教材. 我常常想, 如果我们能够把这本优秀的教材翻译成中文, 让国内的年轻学子们也能学习本书, 那该是多么好的事情!
后来, 在一次机器翻译研讨会上, 电子工业出版社的编辑找到我, 告诉我说他们打算翻译出版此书. 当时电子工业出版社已经进行过调查, 目前国外绝大多数大学的计算机科学系都采用此书作为"自然语言处理"课程的研究生教材, 他们希望我来翻译这本书, 与电子工业出版社配合, 推出高质量的中文译本. 我们双方的想法不谋而合, 于是, 我欣然接受了本书的翻译任务, 开始进行本书的翻译.
我虽然已经通读过本书两遍, 对于本书应该说是有一定的理解了, 但是, 亲自动手翻译起来, 却不像原来想像的那样容易, 要把英文的意思表达为确切的中文, 下起笔来, 总有汲深绠短之感, 大量的新术语如何用中文来表达, 也是颇费周折令人踌躇的难题. 我利用了全部的业余时间来进行翻译, 连续工作了11个月, 当翻译完14章(全书的三分之二)的时候, 我患了眼病, 视力出现障碍, 难于继续翻译工作, 还剩下7章(全书的三分之一)没有翻译, "行百里者半九十", 这7章的翻译工作究竟如何来完成呢?正当我束手无策一筹莫展的时候, 中国科学院软件研究所副研究员孙乐博士表示愿意继续我的工作, 与我协作共同完成本书的翻译. 孙乐博士有很好的自然语言处理的基础, 我们又是忘年之交的好朋友, 由他来继续我的翻译工作是最理想不过的了, 电子工业出版社也同意孙乐参与本书的翻译. 孙乐博士的翻译工作十分认真, 他每翻译一章, 就交给我审校, 遇到疑难问题时我们共同切磋, 反复推敲, 他顺利地完成了第15章到第21章的翻译, 现在, 在我们两人的通力合作下, 全书的翻译总算大功告成了. 原书每章都有习题, 由于这些习题涉及的语言背景不适合中国读者, 因此在中文版中未将习题包括在内.
正如本书作者指出的, 本书具有"覆盖全面, 强调实用, 注重评测, 语料为本"的特点, 我们希望, 这个中文译本能够在我国的自然语言处理的教学和科学研究中, 产生积极的作用, 我们还希望, 读者能够喜欢这个译本, 并给我们提出批评和指正.
本书译者的部分工作得到国家自然科学基金(编号:60203007)和北京市科技新星计划(编号:H020820790130)的资助, 特此致谢.
冯志伟

自然语言理解(第二版)    
(美)艾伦著 刘群等译  
书 名 自然语言理解(第二版) 页数 508
作 者 (美)艾伦著 刘群等译 开本 16
责任编辑 字数 824千字
出 版 社 电子工业出版社 印张 0
出版时间 2005年1月第1版 页数 508
再版时间 2005年1月第1次 书号 121-00755-X
装 帧 平装 定价 59元
册 每 包 0 特价 无
带盘 否
第1章 自然语言理解引论
1.1 语言的研究
1.2 自然语言理解的应用
1.3 语言理解系统的评价
1.4 语言分析的不同层面
1.5 表示与理解
1.5.1 句法:句子结构的表示
1.5.2 逻辑形式
1.5.3 最终的意义表示
1.6 自然语言理解系统的组织
1.7 小结
1.8 相关工作与深入阅读材料
1.9 习题
第一部分 句 法 处 理
第2章 语言学背景知识:英语句法概要
2.1 词语
2.2 简单名词短语的组成元素
2.3 动词短语与简单句
2.3.1 及物性与被动语态
2.3.2 语助词
2.3.3 从句补语
2.3.4 介词短语补语
2.4 再论名词短语
2.5 形容词短语
2.6 副词短语
2.7 小结
2.8 相关工作与深入阅读材料
2.9 习题
第3章 语法及其分析
3.1 语法与句子结构
3.2 优秀语法的特征
3.3 自顶向下的句法分析器
3.3.1 简单的自顶向下句法分析算法
3.3.2 句法分析与搜索过程
3.4 自底向上的chart句法分析器
3.4.1 效率方面的考虑
3.5 转移网络语法
3.5.1 基于递归转移网络的自顶向下句法分析方法
○3.6 自顶向下的chart句法分析

○3.7 有限状态模型与词语形态处理

○3.8 语法与逻辑程序设计
3.9 小结
3.10相关工作与深入阅读材料
3.11习题
第4章 特征与扩充语法
4.1 特征体系与扩充语法
4.2 英语的一些基本特征体系
4.2.1 人称和数的特征
4.2.2 动词形式特征和动词次范畴
4.2.3 二元特征
4.2.4 特征的默认值
4.3 词语形态分析和词典
4.4 采用特征的简单语法
4.5 基于特征的句法分析
○4.6 扩充转移网络
4.6.1 简单陈述句的ATN语法
4.6.2 寄存器的预设置
○4.7 确定子句语法
○4.8 广义特征体系与合一文法
4.8.1 形式化拓展:特征的有向无环图结构
4.9 小结
4.10相关工作与深入阅读材料
4.11习题
第5章 自然语言的语法
5.1 助动词和动词短语
○5.1.1 被动句式
5.2 语言中的移位现象
5.3 上下文无关文法中的疑问句处理
5.3.1 带缺位的句法分析
○5.4 关系从句
5.5 ATN中的保留机制
5.5.1 方法比较
5.6 缺位索引方法
5.7 小结
5.8 相关工作与深入阅读材料
5.9 习题
第6章 通向高效的句法分析
6.1 句法分析中人的优选策略
6.1.1 最小附着原则
6.1.2 右关联原则
6.1.3 词汇优先原则
6.2 对不确定性进行编码:移进归约句法分析器
6.2.1 确定句法分析器的状态
6.2.2 移进归约句法分析器
6.2.3 移进归约句法分析器与歧义性
6.2.4 词汇的歧义性
6.2.5 有歧义的句法分析状态
6.3 确定型句法分析器
6.3.1 心理学上的有效性说明
6.4 高效的歧义表示技术
6.5 浅层句法分析
6.6 小结
6.7 相关工作与深入阅读材料
6.8 习题
第7章 歧义消解的统计方法
7.1 概率论基础
7.2 概率估计
7.2.1 评测
7.3 词性标注
○7.3.1 Viterbi算法
7.4 词汇概率的获取
7.5 概率上下文无关文法
7.6 最佳优先句法分析
7.7 简单的上下文相关最佳优先句法分析器
7.8 小结
7.9 相关工作与深入阅读材料
7.10习题
第二部分 语 义 解 释
第8章 语义和逻辑形式
8.1 语义和逻辑形式简介
8.2 词义与歧义
8.3 基本逻辑形式语言
8.4 逻辑形式中的歧义表示
8.5 动词与逻辑形式中的状态
8.6 论旨角色
8.7 言语行为与内嵌句
○8.8 定义语义结构:模型论
8.8.1 句子间的语义关系
8.8.2 情态运算符与可能的世界语义
8.9 小结
8.10相关工作与深入阅读材料
8.11习题
第9章 句法和语义的衔接
9.1 语义解释与组合理论
9.2 带语义解释的简单语法和词典
9.3 介词短语与动词短语
9.4 词汇化语义解释与语义角色
○9.4.1 层次词典
9.5 简单疑问句的处理
○9.5.1 介词
短语的特殊疑问句
9.6 特征合一的语义解释
○9.7 用逻辑形式生成句子
9.8 小结
9.9 相关工作与深入阅读材料
9.10习题
第10章 歧义消解
10.1 选择限制
10.2 用选择限制进行语义筛选
10.3 语义网络
10.4 统计词义消歧
○10.4.1 搭配与互信息
10.5 统计语义优选
10.6 组合消歧方法
10.7 小结
10.8 相关工作与深入阅读材料
10.9 习题
第11章 语义解释的其他策略
11.1 语法关系
11.2 语义语法
11.3 模板匹配
11.4 语义驱动的分析技术
11.5 小结
11.6 相关工作与深入阅读材料
11.7 习题
第12章 辖域指定与名词短语的解释
12.1 辖域指定现象
12.1.1 对量词进行分类
12.1.2 进行辖域判定
12.1.3 横向辖域判定
12.1.4 横向辖域歧义解析
12.1.5 纵向辖域关系
12.2 定指描述与辖域指定
12.3 句法分析过程中进行辖域指定的方法
12.3.1 一个例子
12.4 互指与绑定约束
12.4.1 和全称量词的相互影响
12.4.2 计算互指约束
12.5 形容词短语
12.5.1 形容词比较级
12.6 关系名词与名词化
12.7 其他语义问题
12.7.1 不可数名词
12.7.2 泛指
12.7.3 意愿运算符与辖域解析
12.7.4 名词-名词修饰语
12.8 小结
12.9 相关工作与深入阅读材料
12.10习题
第三部分 上下文和世界知识
第13章 知识表示和推理
13.1 知识表示
13.1.1 推理的类型
13.1.2 推理技术
13.2 基于一阶谓词演算的知识表示
13.3 框架:表示固定模式的信息
13.3.1 带约束的槽
13.4 处理自然语言中的量词

○13.5 时间和动词的体态类
13.5.1 时态的表示

○13.6 基于逻辑的表示方法中的自动演绎
○13.7 程序语义学与问答系统
○13.8 综合的知识表示方法
13.9 小结
13.10相关工作与深入阅读材料
13.11习题
第14章 局部篇章上下文和指代
14.1 定义局部篇章上下文和篇章实体
14.1.1 生成篇章实体
14.1.2 全称量词辖域内的不定指性名词短语
14.2 一个基于历史记录列表的简单回指模型
14.3 代词和中心
14.3.1 寻找可能的先行词
14.4 定指性描述
14.4.1 存在性解读和间接指代
○14.5 定指性指代和集合
14.5.1 集合元素的指代
14.5.2 全称量词和集合
14.6 省略
14.6.1 关于省略的句法约束
14.6.2 基于语法的算法
14.6.3 语义的倾向性
14.7 表层回指
14.8 小结
14.9 相关工作与深入阅读材料
14.10习题
第15章 使用世界知识
15.1 使用世界知识:保持前后连贯性
15.2 与期望进行匹配
15.2.1 尝试1:从期望中证明解释
15.2.2 尝试2:从解释中证明期望
15.2.3 基于等价性的技术
15.2.4 基于溯因推理的技术
15.3 指代和匹配期望
15.4 使用关于行为和因果关系的知识
15.5 脚本:理解固定模式的情境
15.5.1 脚本和角色的实例化
15.6 使用层次化的规划
○15.7 基于行为-结果的推理
15.7.1 规划推理算法
15.7.2 算法的一些局限
○15.8 使用关于理性行为的知识
15.8.1 规划更新
15.8.2 基于执行的更新
15.8.3 目标更新
15.9 小结
15.10相关工作与深入阅读材料
15.11习题
第16章 篇章结构
16.1 篇章结构的必要性
16.2 切分和提示语
16.3 篇章结构和指代
16.4 篇章结构和推理的关联
16.5 篇章结构、时态和体态
16.6 管理关注栈
16.6.1 处理篇章状态
16.6.2 确定栈的更新
16.6.3 结构化的提示语
16.7 例子
16.8 小结
16.9 相关工作与深入阅读材料
16.10习题
第17章 会话agent
17.1 会话agent的必要组成部分
17.2 作为多agent活动的语言
17.3 认知状态:信念的表示
17.3.1 关于其他agent所持信念的知识
17.4 认知状态:期望、意图和规划的表示
17.5 言语行为和交流行为
17.6 规划交流行为
17.7 交流行为和意图判别
17.8 对话中意图的来源
17.9 识别语内表现行为
17.10篇章层次的规划
17.11小结
17.12相关工作与深入阅读材料
17.13习题
附录A 逻辑和模型论语义学介绍
附录B 符号计算
附录C 语音识别与口语
参考文献
索引
正文中使用的符号
 
冯老师做人堂堂正正,翻译的就是翻译的,不像有些人翻译别人的还脸皮厚厚地说是自己著的
 
回复:[推荐]统计自然语言处理基础――国外计算机科学教材系列

以下是引用 laohong2005-11-16 20:29:32 的发言:
冯老师做人堂堂正正,翻译的就是翻译的,不像有些人翻译别人的还脸皮厚厚地说是自己著的

 
电子工业出版社从国外引进一批关于自然语言处理的书,包括清风出袖给大家推荐的两本。
 
回复: [推荐]统计自然语言处理基础――国外计算机科学教材系列

i feel more than grateful because of the contribution of the generous people. Thanks for sharing.
 
回复: [推荐]统计自然语言处理基础――国外计算机科学教材系列

这种书籍对外语专业的人来说,恐怕有些太专业了,门槛高啊。除非有极大热情,我觉得不太建议外语专业语料库初学者阅读,很容易挫伤积极性的。
 
Back
顶部