序一
序二
前言
第1章 绪论 (1)
1.1
基本概念 (1)
语言学与语音学 (1)
1.1.1
自然语言处理 (2)
1.1.2
1.1.3
关于“理解”的标准 (4)
自然语言处理研究的内容和面临的困难 (4)
1.2
自然语言处理研究的内容 (4)
1.2.1
1.2.2
自然语言处理涉及的几个层次 (5)
自然语言处理面临的困难 (6)
1.2.3
自然语言处理的基本方法及其发展 (8)
1.3
1.3.1 自然语言处理的基本方法 (8)
1.3.2 自然语言处理的发展 (9)
自然语言处理研究现状 (12)
1.4
第2章 预备知识 (14)
2.1 概率论基本概念 (14)
概率 (14)
2.1.1
最大似然估计 (14)
2.1.2
条件概率 (15)
2.1.3
贝叶斯法则 (15)
2.1.4
随机变量 (16)
2.1.5
2.1.7
联合概率分布和条件概率分布 (17)
贝叶斯决策理论 (17)
2.1.8
期望和方差 (18)
2.1.9
2.2 信息论基本概念 (19)
2.2.1 熵 (19)
联合熵和条件熵 (19)
2.2.2
互信息 (21)
2.2.3
2.2.4相对熵 (22)
交叉熵 (22)
2.2.5
2.2.6困惑度 (23)
噪声信道模型 (25)
2.2.7
2.3 支持向量机 (25)
2.3.1 线性分类 (25)
2.3.2线性不可分 (26)
2.3.3 构造核函数 (26)
第3章 形式语言与自动机 (28)
3.1 基本概念 (28)
图 (28)
3.1.1
树 (28)
3.1.2
字符串 (29)
3.1.3
3.2 形式语言 (30)
概述 (30)
3.2.1
形式语法的定义 (30)
3.2.2
形式语法的类型 (31)
3.2.3
识别句子的派生树表示 (33)
CFG
3.2.4
3.3 自动机理论 (34)
有限自动机 (34)
3.3.1
正则文法与自动机的关系 (36)
3.3.2
上下文无关文法与下推自动机 (37)
3.3.3
图灵机 (38)
3.3.4
3.3.5 线性界限自动机 (39)
3.4 自动机在自然语言处理中的应用 (40)
3.4.1单词拼写检查 (40)
单词形态分析 (43)
3.4.2
3.4.3词性消岐 (44)
第4章 语料库与词汇知识库 (48)
4.1 语料库技术 (48)
4.1.1
概述 (48)
语料库语言学的发展 (49)
4.1.2
4.1.4
典型语料库介绍 (54)
汉语语料库建设中的问题 (60)
4.1.5
4.2 词汇知识库 (62)
(62)
WordNet
4.2.1
FrameNet
(64)
4.2.2
4.2.3 EDR (64)
知网 (66)
4.2.4
概念层次网络 (70)
4.2.5
4.3 语言知识库建设中的本体论 (71)
第5章 语言模型 (74)
5.1  n元语法 (74)
5.2 语言模型性能评价 (77)
5.3 数据平滑 (77)
5.3.1 问题的提出 (77)
二项式分布的正则化
5.3.2 加法平滑方法 (78)
5.3.3古德-图灵(Good-Turing)估计法 (79)
5.3.4 Katz平滑方法 (79)
5.3.5 Jelinek-Mercer 平滑方法 (81)
5.3.6 Witten-Bell 平滑方法 (82)
5.3.7 绝对减值法 (83)
5.3.8 Kneser-Ney平滑方法 (84)
5.3.9 算法总结 (86)
5.4 其它平滑方法 (87)
5.4.1 Church-Gale平滑方法 (87)
5.4.2 贝叶斯平滑方法 (88)
5.4.3 修正的Kneser-Ney平滑方法 (88)
5.5 平滑方法的比较 (90)
5.6 语言模型自适应方法 (90)
5.6.1 基于缓存记忆的语言模型 (91)
5.6.2 基于混合方法的语言模型 (92)
5.6.3 基于最大熵的语言模型 (92)
第6章 隐马尔柯夫模型 (94)
6.1 马尔柯夫模型 (94)
6.2 隐马尔柯夫模型的构成 (96)
6.3 前后向算法及参数估计 (97)
6.3.1 求解观察序列的概率 (97)
6.3.2 维特比算法 (101)
第7章 汉语自动分词与词性标注 (105)
7.1 汉语自动分词中的基本问题 (105)
7.1.1 汉语分词规范问题 (105)
7.1.2 歧义切分问题 (106)
7.1.3 未登录词问题 (108)
7.2 基本分词方法 (109)
7.2.1 基于统计语言模型的分词方法 (109)
7.2.2 N-最短路径方法 (111)
7.2.3 基于HMM的分词方法 (114)
7.2.4 基于三元统计模型的分词与词性标注一体化方法 (115)
7.2.5 由字构词的汉语分词方法 (117)
7.2.6 方法比较 (118)
7.3 未登录词处理方法概述 (120)
7.4 基于多特征的命名实体识别模型 (122)
7.4.1 模型描述 (122)
7.4.2 词形和词性上下文模型 (123)
7.4.3 实体模型 (124)
7.4.4 专家知识 (128)
7.4.5 模型训练 (128)
7.4.6 测试结果 (129)
7.5 词性标注 (130)
7.5.1 概述 (130)
7.5.2基于统计模型的词性标注方法 (131)
7.5.3 基于规则的词性标注方法 (134)
7.5.4 统计方法与规则方法相结合的词性标注方法 (136)
7.5.5 词性标注中的生词处理方法 (138)
7.6 词性标注的一致性检查与自动校对 (139)
7.6.1 词性标注一致性检查方法 (139)
7.6.2 词性标注自动校对方法 (141)
7.7 汉语分词与词性标注系统评测 (143)
第8章 句法分析 (147)
8.1 概述 (147)
8.1.1基本概念 (147)
8.1.2语法形式化 (147)
8.1.3. 基本方法 (148)
8.2统计句法分析 (150)
8.2.1语法驱动的分析方法 (151)
8.2.2数据驱动的分析方法 (158)
8.3句法分析器评测 (160)
8.4汉语句法结构特点 (163)
8.5层次化汉语长句结构分析 (165)
8.5.1 标点符号在句法分析中的作用 (165)
8.5.2 层次化汉语长句结构分析的思路 (166)
8.5.3 汉语标点符号的分类 (167)
8.5.4 句法规则提取方法 (168)
8.5.5 HP分析方法 (169)
8.5.6 实验 (171)
8.6 浅层句法分析 (173)
8.6.1 概述 (173)
8.6.2 Base NP识别问题 (174)
8.6.3 基于支持向量机的Base NP识别方法 (175)
8.6.4 基于WINNOW的Base NP识别方法 (177)
8.6.5 基于条件随机场的Base NP识别方法 (179)
8.7 依存语法理论与依存句法分析 (181)
8.7.1 依存语法理论 (181)
8.7.2 依存句法分析 (183)
第9章 语义消歧 (190)
9.1 概述 (190)
9.2 有监督的词义消歧方法 (191)
9.2.1 基于互信息的消歧方法 (191)
9.2.2 基于贝叶斯分类器的消歧方法 (193)
9.3 基于词典的词义消歧方法 (194)
9.3.1基于语义定义的消歧方法 (194)
9.3.2基于义类辞典的消歧方法 (195)
9.3.3基于双语词典的消歧方法 (195)
9.3.4 Yarowsky算法及其相关研究 (196)
9.4 无监督的词义消歧方法 (197)
9.5词义消歧系统评测 (199)
第10章 统计机器翻译 (201)
10.1 机器翻译概述 (202)
机器翻译的发展 (202)
10.1.1
机器翻译方法 (202)
10.1.2
10.1.3
机器翻译研究现状 (204)
10.2基于噪声信道模型的统计机器翻译原理 (205)
10.3 IBM的五个翻译模型 (208)
10.3.1 模型1 (209)
模型2 (212)
10.3.2
模型过度 (214)
10.3.3
10.3.4
模型3 (216)
模型4 (220)
10.3.5
模型5 (223)
10.3.6
10.4 基于HMM的词对位模型 (225)
10.5基于结构的对位模型 (226)
10.6基于反向转换文法的翻译模型 (229)
10.7基于有限状态转换机的翻译模型 (235)
10.7.1加权的有限状态中心转换机 (235)
10.7.2依存转换模型 (236)
10.7.3转换算法 (238)
训练方法 (239)
10.7.4
基于句法的翻译模型 (242)
10.8
基于短语的翻译模型 (246)
10.9
10.9.1 层次化短语对位方法 (246)
10.9.2 基于短语的联合概率翻译模型 (247)
10.9.3 基于短语的翻译模型 (248)
10.9.4 一体化短语分割与对位算法(ISA) (252)
10.9.5 改进的基于HMM的短语对获取方法 (254)
10.10基于层次短语的统计翻译模型 (257)
10.10.1概述 (257)
10.10.2模型描述 (258)
10.10.3参数训练 (260)
解码方法 (261)
10.10.4
10.11 基于语块的翻译模型 (262)
10.11.1基于语块的翻译模型结构 (263)
10.11.2参数估计 (265)
10.11.3解码 (266)
方法讨论 (266)
10.11.4
10.12 基于最大熵的翻译模型 (267)
10.12.1 模型介绍 (267)
10.12.2 对位模型与最大近似 (269)
10.12.3 对位模板 (270)
10.12.4 特征函数 (270)
10.12.5 参数训练 (271)
10.13 树到树的翻译模型 (272)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。