暂无评论
图文详情
- ISBN:9787302573388
- 装帧:精装
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:304
- 出版时间:2023-12-01
- 条形码:9787302573388 ; 978-7-302-57338-8
本书特色
清华大学出版社此前无此类图书。该书出版助于该学科和领域的学习者和兴趣者尤其是大学生和研究生作为学习和研究的参考。可以更有效地积聚全国外国语言文学的研究力量和资源,融合语言文学的研究力量和资源,调动各相关学术团体的学术研究与合作交流的积极性和创造性,为外国语言文学一流学科建设添砖加瓦。
内容简介
计算语言学与自然语言处理的界限越来越模糊,学科融合的特点越来越明显,但作为技术应用的理论基础,计算语言学的研究对自然语言处理技术的发展尤为重要,该著市场需求旺盛。本著在介绍计算语言学基本方法、主要内容和应用领域的基础上,重点介绍计算语言学近年来的新发展和新趋势,适用于语言学、数学和计算机学科所有对自然语言处理感兴趣的读者。
目录
第1章 词汇形态分析1
1.1 词与词汇形态学2
1.1.1 词型与词例2
1.1.2 词汇形态学3
1.2 词法分析4
1.3 词法分析技术研究综述及进展5
1.3.1 词法分析器6
1.3.2 词法分析研究进展9
1.4词法分析应用11 第2章 汉语自动分词13
2.1 传统的汉语自动分词方法14
2.1.1 *大匹配法15
2.1.2 *大概率法17
2.2 未登录词识别20
2.2.1 姓名识别21
2.2.2 地名识别22
2.2.3 机构名识别24
2.2.4 新词识别24
2.2.5 指代消解25
2.3 切分歧义26
2.3.1 术语的辨析27
2.3.2 交集型歧义切分的处理29
2.3.3 组合型歧义切分的处理31
2.4 汉语自动分词研究进展31
2.5 古汉语和中古汉语自动分词35 第3章 自动词性标注41
3.1 词性标记集及词性标注示例42
3.2 兼类词消歧45
3.2.1 基于规则的方法48
3.2.2 基于统计的方法50
3.2.3 基于转换的方法52
3.3 未登录词词性预测53
3.3.1 使用单一特征的未登录词词性预测54
3.3.2 使用组合特征的未登录词词性预测 55
3.4 文本序列标注研究进展57
3.4.1 基于宾州树库的词性标注研究58
3.4.2 基于社交媒体文本的词性标注研究60
3.4.3 基于依存树库的词性标注研究61 第4章 局部句法分析63
4.1 短语结构语法与浅层分析63
4.2 浅层分析研究进展70
4.3 骨架分析72
4.4 骨架分析研究进展76
4.5 局部句法分析应用78
4.5.1 树库建设7
4.5.2 机器翻译调序79 第5章 完全句法分析83
5.1 语法理论84
5.1.1 表层结构与深层结构85
5.1.2 依存语法及研究进展86
5.1.3 词汇-功能语法90
5.2 句法分析93
5.2.1 自顶向下的分析93
5.2.2 自底向上的分析96
5.2.3 左角分析法98
5.2.4 CYK算法102
5.2.5 Earley 算法105
5.3 汉语小句复合体110
5.4 依存关系与语言网络113
5.4.1 依存关系与依存距离113
5.4.2 复杂系统与语言网络116 第6章 语义标注与分析119
6.1 动词中心论及其发展120
6.1.1“格语法”中的“动词中心论”120
6.1.2 题元理论中的“动词中心论”121
6.1.3 配价语法中的“动词中心论”123
6.2 语义知识库126
6.3 语义角色标注134
6.3.1 基于语块的语义角色标注134
6.3.2 端对端语义角色标注系统135
6.4 中心词驱动的短语结构语法137
6.5 语言资源建设中的语义分析140 第7章 形式语言理论与自然语言生成143
7.1 形式语法与自动机144
7.1.1 形式语法145
7.1.2 自动机理论150
7.2 自然语言生成153
7.2.1 传统的模块化生成框架155
7.2.2 端到端的自然语言生成框架158
7.3 自然语言生成任务159
7.4 自然语言生成质量评价162
7.5 自然语言生成现状分析与展望163
7.6 ChatGPT及其性能评测167 第8章 多语言机器翻译研究进展169
8.1 多路翻译170
8.1.1 参数共享170
8.1.2 训练方法172
8.1.3 语言多样性174
8.2 低资源翻译175
8.2.1增强现有双语平行语料176
8.2.2 融合单语语言模型177
8.2.3 低资源翻译方法178
8.3 多源翻译182
8.3.1 多源翻译的发展契机182
8.3.2 可获得多源数据182
8.3.3 多源数据的缺失183
8.3.4 多源翻译的使用场景184
8.4 领域适配问题184
8.5 机器翻译的难点185
8.6 机器翻译评测188 第9章 文本智能挖掘研究进展193
9.1 文本分类193
9.2 文本聚类195
9.3 主题模型198
9.3.1 LSA和 PLSA199
9.3.2 LDA201
9.4 情感分析与观点挖掘202
9.4.1 文档和句子级情感分析方法203
9.4.2 属性级情感分析205
9.4.3 情感分析中的特殊问题207
9.5 话题检测与跟踪211
9.6 文本自动摘要215 参考文献217 附 录243
附录1 词性标记集243
附录2 数学基础 255 术语表263
1.1 词与词汇形态学2
1.1.1 词型与词例2
1.1.2 词汇形态学3
1.2 词法分析4
1.3 词法分析技术研究综述及进展5
1.3.1 词法分析器6
1.3.2 词法分析研究进展9
1.4词法分析应用11 第2章 汉语自动分词13
2.1 传统的汉语自动分词方法14
2.1.1 *大匹配法15
2.1.2 *大概率法17
2.2 未登录词识别20
2.2.1 姓名识别21
2.2.2 地名识别22
2.2.3 机构名识别24
2.2.4 新词识别24
2.2.5 指代消解25
2.3 切分歧义26
2.3.1 术语的辨析27
2.3.2 交集型歧义切分的处理29
2.3.3 组合型歧义切分的处理31
2.4 汉语自动分词研究进展31
2.5 古汉语和中古汉语自动分词35 第3章 自动词性标注41
3.1 词性标记集及词性标注示例42
3.2 兼类词消歧45
3.2.1 基于规则的方法48
3.2.2 基于统计的方法50
3.2.3 基于转换的方法52
3.3 未登录词词性预测53
3.3.1 使用单一特征的未登录词词性预测54
3.3.2 使用组合特征的未登录词词性预测 55
3.4 文本序列标注研究进展57
3.4.1 基于宾州树库的词性标注研究58
3.4.2 基于社交媒体文本的词性标注研究60
3.4.3 基于依存树库的词性标注研究61 第4章 局部句法分析63
4.1 短语结构语法与浅层分析63
4.2 浅层分析研究进展70
4.3 骨架分析72
4.4 骨架分析研究进展76
4.5 局部句法分析应用78
4.5.1 树库建设7
4.5.2 机器翻译调序79 第5章 完全句法分析83
5.1 语法理论84
5.1.1 表层结构与深层结构85
5.1.2 依存语法及研究进展86
5.1.3 词汇-功能语法90
5.2 句法分析93
5.2.1 自顶向下的分析93
5.2.2 自底向上的分析96
5.2.3 左角分析法98
5.2.4 CYK算法102
5.2.5 Earley 算法105
5.3 汉语小句复合体110
5.4 依存关系与语言网络113
5.4.1 依存关系与依存距离113
5.4.2 复杂系统与语言网络116 第6章 语义标注与分析119
6.1 动词中心论及其发展120
6.1.1“格语法”中的“动词中心论”120
6.1.2 题元理论中的“动词中心论”121
6.1.3 配价语法中的“动词中心论”123
6.2 语义知识库126
6.3 语义角色标注134
6.3.1 基于语块的语义角色标注134
6.3.2 端对端语义角色标注系统135
6.4 中心词驱动的短语结构语法137
6.5 语言资源建设中的语义分析140 第7章 形式语言理论与自然语言生成143
7.1 形式语法与自动机144
7.1.1 形式语法145
7.1.2 自动机理论150
7.2 自然语言生成153
7.2.1 传统的模块化生成框架155
7.2.2 端到端的自然语言生成框架158
7.3 自然语言生成任务159
7.4 自然语言生成质量评价162
7.5 自然语言生成现状分析与展望163
7.6 ChatGPT及其性能评测167 第8章 多语言机器翻译研究进展169
8.1 多路翻译170
8.1.1 参数共享170
8.1.2 训练方法172
8.1.3 语言多样性174
8.2 低资源翻译175
8.2.1增强现有双语平行语料176
8.2.2 融合单语语言模型177
8.2.3 低资源翻译方法178
8.3 多源翻译182
8.3.1 多源翻译的发展契机182
8.3.2 可获得多源数据182
8.3.3 多源数据的缺失183
8.3.4 多源翻译的使用场景184
8.4 领域适配问题184
8.5 机器翻译的难点185
8.6 机器翻译评测188 第9章 文本智能挖掘研究进展193
9.1 文本分类193
9.2 文本聚类195
9.3 主题模型198
9.3.1 LSA和 PLSA199
9.3.2 LDA201
9.4 情感分析与观点挖掘202
9.4.1 文档和句子级情感分析方法203
9.4.2 属性级情感分析205
9.4.3 情感分析中的特殊问题207
9.5 话题检测与跟踪211
9.6 文本自动摘要215 参考文献217 附 录243
附录1 词性标记集243
附录2 数学基础 255 术语表263
展开全部
作者简介
张霄军,博士,西交利物浦大学翻译学科主管、英国利物浦大学客座讲师,社会兼职包括世界翻译教育联盟翻译技术教学研究会副会长等,研究兴趣为计算语言学、机器翻译和翻译技术。
本类五星书
本类畅销
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
外国教育史-第2版
¥24.4¥40.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
飞机总体设计
¥46.8¥78.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0 -
管理学:原理与方法(第7版)(博学.大学管理类)/周三多
¥30.9¥49.0 -
海商法-第四版
¥30.2¥48.0