- ISBN:9787121409998
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:216
- 出版时间:2021-05-01
- 条形码:9787121409998 ; 978-7-121-40999-8
本书特色
适读人群 :人工智能领域从业人员,自然语言处理领域新入门人员。√梳理预训练语言模型的发展历史、基本概念 √剖析具有代表性的预训练语言模型的实现细节,配代码 √预训练语言模型的评测、应用及趋势分析
内容简介
预训练语言模型属于人工智能领域中自然语言处理领域的一个细分。 本书主要介绍预训练语言模型。预训练语言模型是自然语言处理领域的重要突破,得到了越来越广泛的关注,相关研究者和从业人员在实际应用的过程中,亟需一本理论翔实、代码细节充分的参考书。本书详细梳理了预训练语言模型的基本概念和理论基础,并通过实际代码的讲解, 阐述了具有代表性的预训练语言模型的实现细节,很好适合需要快速、全面掌握预训练语言模型的从业者阅读。
目录
第 1 章 预训练语言模型简介 1
1.1自然语言处理研究进展 1
1.2预训练语言模型:为什么要预训练 4
1.2.1预训练 4
1.2.2自然语言表示 5
1.2.3预训练语言模型发展史及分类 8
第 2 章 预训练语言模型基础知识 13
2.1统计语言模型 14
2.2神经网络语言模型 17
2.3词向量:解决相似单词的距离问题 19
2.4RNN 和 LSTM 基础 25
2.5基于 RNN 的语言模型 29
2.6ELMo:解决多义词的表示问题 32
第 3 章 Transformer 与 Attention 37
3.1Transformer 的结构 37
3.2Self-Attention:从全局中找到重点 43
3.3位置编码:为什么有效 54
3.4单向掩码:另一种掩码机制 58
3.5代码解读:模型训练技巧 61
3.5.1训练技巧 1:归一化层前置 62
3.5.2训练技巧 2:梯度累积 64
第 4 章 GPT 系列模型 69
4.1GPT 的结构:基于 Transformer Decoder 69
4.2GPT 任务改写:如何在不同任务中使用 GPT 71
4.3GPT 核心代码解读 74
4.4GPT-2:Zero-shot Learning 的潜力 79
4.4.1N-shot Learning 79
4.4.2核心思想 80
4.4.3模型结构 81
4.5GPT-3:Few-shot Learning 的优秀表现 82
4.5.1看词造句 84
4.5.2语法纠错 84
4.5.3GPT-3 的争议 85
第 5 章 BERT 模型 87
5.1BERT:公认的里程碑 87
5.2BERT 的结构:强大的特征提取能力 88
5.3无监督训练:掩码语言模型和下句预测 91
5.3.1MLM 91
5.3.2NSP 93
5.3.3输入表示 94
5.4微调训练:适应下游任务 95
5.4.1句对分类 95
5.4.2单句分类 96
5.4.3文本问答 97
5.4.4单句标注 99
5.5核心代码解读:预训练和微调 100
5.5.1BERT 预训练模型 101
5.5.2BERT 微调模型 110
5.6BERT 总结 117
第 6 章 后 BERT 时代的模型 119
6.1XLM:跨语言模型 119
6.1.1优化方向 119
6.1.2算法细节 120
6.1.3 小结 121
6.2MT-DNN:多任务融合 121
6.2.1优化方向 121
6.2.2算法细节 122
6.2.3 小结 124
6.3UniLM:获得文本生成能力 124
6.3.1优化方向 124
6.3.2算法细节 125
6.3.3 小结 127
6.4SpanBERT:扩大掩码范围 127
6.4.1优化方向 127
6.4.2算法细节 128
6.4.3 小结 129
6.5XLNet:置换自回归 130
6.5.1优化方向 130
6.5.2算法细节 130
6.5.3 小结 135
6.6ERNIE:知识图谱 136
6.6.1优化方向 136
6.6.2算法细节 136
6.6.3 小结 139
6.7VideoBERT:多模态融合 139
6.7.1优化方向 139
6.7.2算法细节 140
6.7.3 小结 141
6.8ALBERT:参数共享 142
6.8.1优化方向 142
6.8.2算法细节 143
6.8.3 小结 145
6.9RoBERTa:更大的模型 145
6.9.1优化方向 145
6.9.2算法细节 146
6.9.3 小结 146
6.10BART:编解码结构 146
6.10.1优化方向 146
6.10.2算法细节 147
6.10.3 小结 149
6.11T5:大一统模型 149
6.11.1优化方向 149
6.11.2算法细节 150
6.11.3 小结 153
6.12 总结 154
第 7 章 评测和应用 157
7.1评测任务 157
7.1.1通用评测任务 157
7.1.2领域评测任务 162
7.1.3其他评测任务 167
7.2模型应用:Transformers 代码实战 168
7.2.1 安装 168
7.2.2快速上手指南 170
7.2.3微调训练 172
7.2.4BERT 应用 175
7.3模型压缩:量化、剪枝和蒸馏 179
7.3.1BERT 模型分析 179
7.3.2 量化 181
7.3.3 剪枝 181
7.3.4 蒸馏 182
7.3.5 结构无损压缩 187
7.4模型扩展:多模态预训练 188
7.4.1单流模型 189
7.4.2双流模型 191
第 8 章 总结和展望 195
8.1预训练语言模型的发展现状 195
8.2预训练语言模型的未来展望 199
参考文献 203
作者简介
邵 浩日本国立九州大学工学博士,现就职于vivo。曾任狗尾草智能科技AI研究院院长,带领团队打造了AI虚拟生命产品的交互引擎。曾是上海对外经贸大学副教授,硕士生导师。是上海市静安区首届优秀人才,上海市人才发展基金获得者,杭州市高层次人才。任中国中文信息学会青年工作委员会委员,语言与知识计算专委会委员,中国计算机学会语音对话与听觉专业组委员,中文信息技术专委会委员。发表论文50余篇,获专利10余项,主持多项***及省部级课题,曾在联合国、世界贸易组织、亚利桑那州立大学、香港城市大学等机构任访问学者。刘一烽全国中学生物理竞赛保送生,清华大学电子系硕士,曾获学习成绩优异奖学金。现任vivo人工智能研究院AI算法工程师,主要研究方向为强化学习、自然语言处理,主导游戏AI和机器翻译核心算法研发工作。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
零信任网络:在不可信网络中构建安全系统
¥37.2¥59.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥69.3¥99.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥52.4¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥68.2¥89.8 -
LINUX实战——从入门到精通
¥49.0¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥81.8¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
做好课题申报:AI辅助申请书写作
¥48.9¥69.8 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0