自然语言处理实战(预训练模型应用及其产品化)
- ISBN:9787111707912
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:277
- 出版时间:2022-07-01
- 条形码:9787111707912 ; 978-7-111-70791-2
本书特色
适读人群 :对机器学习有所了解,并且使用过Python 以及NumPy、pandas 和matplotlib 等类库。在过去几年中,自然语言处理技术的受欢迎程度呈现“爆炸式”增长。尽管Google、Facebook、OpenAI等前沿公司继续发布着规模更大的语言模型,但许多开发团队仍在摸索着构建与时俱进的自然语言处理应用程序。本书将帮助你快速了解自然语言处理的新技术及未来发展趋势。 通过阅读本书,你将学习如何为组织中的实际应用程序构建、训练和部署模型。作者使用强调现代自然语言处理*佳实践的代码和示例来指导你完成整个过程。 本书的主要内容包括: ?使用先进的自然语言处理模型(如BERT和GPT-3)来解决命名实体识别、文本分类、语义搜索和阅读理解等自然语言处理任务。 ?开发性能可媲美甚至优于开箱即用系统的自然语言处理模型。 ?Transformer架构和现代技巧,比如席卷整个自然语言处理世界的迁移学习。 ?自然语言处理的工具和框架,包括spaCy、Hugging Face和fast.ai。 ?使用Python和PyTorch从头开始构建自然语言处理任务流水线的核心部分,包括分词器、向量嵌入和语言模型。 ?将你的模型从Jupyter Notebook中产品化,并学习如何在生产环境中部署、监控和维护它们。 “这本书富有启发性。作者带领你遨游于自然语言处理的复杂世界。每一章都让你有所收获。” ——Benjamin Muskalla 高级软件工程师 Ankur A. Patel是Glean和Mellow的联合创始人。Glean使用自然语言处理技术生成供应商的支出情报信息,Mellow为程序员提供自然语言处理的API。此前,Ankur曾领导过7Park Data、ThetaRay、R-Squared Macro、Bridgewater Associates(桥水联合基金)和JPMorgan(摩根大通)的团队。他也是Hands-On Unsupervised Learning Using Python一书的作者。 Ajay Uppili Arasanipalai是美国伊利诺伊大学的一名学生,也是人工智能研究机构Landskape AI的联合创始人。作为伊利诺伊大学的ACM SIGAI分会的联合主席,他为本科生组织了教育研讨会和项目。Ajay撰写了许多热门文章,讨论了*先进的深度学习技术。
内容简介
在过去几年中,自然语言处理技术的受欢迎程度呈现“爆炸式”增长。尽管Google、Facebook、OpenAl等前沿公司继续发布着规模更大的语言模型,但许多开发团队仍在努力构建与时俱进的自然语言处理应用程序。本书将帮助你快速了解自然语言处理的新技术及未来发展趋势。 通过阅读本书,你将学习如何为组织中的实际应用程序构建、训练和部署模型。作者使用突出现代自然语言处理很好实践的代码和示例指导你完成整个过程。 本书的主要内容包括: 使用优选的自然语言处理模型(如BERT和GPT-3)来解决命名实体识别、文本分类、语义搜索和阅读理解等自然语言处理任务。 开发性能可媲美甚至优于开箱即用系统的自然语言处理模型。 了解Transformer架构和现代技巧,比如席卷整个自然语言处理世界的迁移学习。 熟悉自然语言处理的工具和框架,包括spaCy、Hugging Face和fast.ai。 使用Python和PyTorch从头开始构建自然语言处理任务流水线的核心部分,包括分词器、向量嵌入和语言模型。 将你的模型从Jupyter Notebook中产品化,并学习如何在生产环境中部署、监控和维护它们。
目录
**部分 浮光掠影
第1章 自然语言处理介绍11
1.1 什么是自然语言处理12
1.2 基本的自然语言处理19
1.3 总结38
第2章 Transformer和迁移学习40
2.1 利用fast.ai库进行训练41
2.2 利用Hugging Face系列库进行推理54
2.3 总结60
第3章 NLP任务和应用程序61
3.1 预训练语言模型61
3.2 迁移学习和微调62
3.3 NLP任务63
3.4 自然语言数据集65
3.5 NLP任务1:命名实体识别70
3.6 NLP任务2:文本分类84
3.7 总结92
第二部分 纲举目张
第4章 分词97
4.1 一个极简的分词器98
4.2 Hugging Face的分词器100
4.3 搭建自己的分词器103
4.4 总结106
第5章 向量嵌入:计算机如何“理解”单词107
5.1 理解文本与读取文本107
5.2 词向量111
5.3 词向量嵌入实践116
5.4 非词条的嵌入122
5.5 总结126
第6章 循环神经网络和其他序列模型128
6.1 循环神经网络130
6.2 长短期记忆网络142
6.3 门控循环单元143
6.4 总结144
第7章 Transformer146
7.1 从头开始构建Transformer146
7.2 注意力机制148
7.3 计算机视觉Transformer161
7.4 总结162
第8章 BERT方法论:博采众长创新篇164
8.1 ImageNet164
8.2 通往NLP“ImageNet时刻”之路165
8.3 预训练的词向量嵌入166
8.4 序列模型170
8.5 循环神经网络172
8.6 注意力机制176
8.7 Transformer架构178
8.8 NLP的“ImageNet时刻”181
8.9 总结184
第三部分 经世致用
第9章 工欲善其事,必先利其器187
9.1 深度学习框架188
9.2 可视化与实验跟踪193
9.3 AutoML196
9.4 机器学习基础设施和计算198
9.5 边缘/终端侧推理201
9.6 云推理和机器学习即服务203
9.7 持续集成和持续交付205
9.8 总结205
第10章 可视化207
10.1 我们的**个Streamlit应用程序208
10.2 总结220
第11章 产品化222
11.1 数据科学家、工程师和分析师222
11.2 Databricks:你的统一数据分析平台224
11.3 Databricks的安装228
11.4 机器学习作业243
11.5 MLflow249
11.6 Databricks的替代品260
11.7 总结261
第12章 归纳提升263
12.1 *后十课263
12.2 *后的话268
附录A 大规模训练269
附录B CUDA273
作者简介
安库·A.帕特尔(Ankur A.Patel),是Glean和Mellow的联合创始人。Glean使用自然语言处理技术生成供应商的支出情报信息,Mellow为程序员提供自然语言处理的API。此前,Ankur曾领导过7Park Data、 ThetaRay、R-SquaredMacro、Bridgewater Associates(桥水联合基金)和JPMorgan(摩根大通)的团队。他也是Hands-On Unsupervised Learning Using Python一书的作者。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0