自然语言处理实战(预训练模型应用及其产品化)

1星价 ¥90.3 (7.0折)

2星价￥90.3 定价￥129.0

作者：(美)安库·A.帕特尔//阿贾伊·乌皮利

出版社：机械工业出版社

本类榜单：计算机/网络

分类：计算机/网络 > 软件工程/开发项目管理

暂无评论

图文详情

ISBN：9787111707912
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：16开
页数：277
出版时间：2022-07-01
条形码：9787111707912 ; 978-7-111-70791-2

本书特色

适读人群：对机器学习有所了解，并且使用过Python 以及NumPy、pandas 和matplotlib 等类库。在过去几年中，自然语言处理技术的受欢迎程度呈现“爆炸式”增长。尽管Google、Facebook、OpenAI等前沿公司继续发布着规模更大的语言模型，但许多开发团队仍在摸索着构建与时俱进的自然语言处理应用程序。本书将帮助你快速了解自然语言处理的新技术及未来发展趋势。通过阅读本书，你将学习如何为组织中的实际应用程序构建、训练和部署模型。作者使用强调现代自然语言处理*佳实践的代码和示例来指导你完成整个过程。本书的主要内容包括： ?使用先进的自然语言处理模型（如BERT和GPT-3）来解决命名实体识别、文本分类、语义搜索和阅读理解等自然语言处理任务。 ?开发性能可媲美甚至优于开箱即用系统的自然语言处理模型。 ?Transformer架构和现代技巧，比如席卷整个自然语言处理世界的迁移学习。 ?自然语言处理的工具和框架，包括spaCy、Hugging Face和fast.ai。 ?使用Python和PyTorch从头开始构建自然语言处理任务流水线的核心部分，包括分词器、向量嵌入和语言模型。 ?将你的模型从Jupyter Notebook中产品化，并学习如何在生产环境中部署、监控和维护它们。 “这本书富有启发性。作者带领你遨游于自然语言处理的复杂世界。每一章都让你有所收获。” ——Benjamin Muskalla 高级软件工程师 Ankur A. Patel是Glean和Mellow的联合创始人。Glean使用自然语言处理技术生成供应商的支出情报信息，Mellow为程序员提供自然语言处理的API。此前，Ankur曾领导过7Park Data、ThetaRay、R-Squared Macro、Bridgewater Associates（桥水联合基金）和JPMorgan（摩根大通）的团队。他也是Hands-On Unsupervised Learning Using Python一书的作者。 Ajay Uppili Arasanipalai是美国伊利诺伊大学的一名学生，也是人工智能研究机构Landskape AI的联合创始人。作为伊利诺伊大学的ACM SIGAI分会的联合主席，他为本科生组织了教育研讨会和项目。Ajay撰写了许多热门文章，讨论了*先进的深度学习技术。

内容简介

在过去几年中，自然语言处理技术的受欢迎程度呈现“爆炸式”增长。尽管Google、Facebook、OpenAl等前沿公司继续发布着规模更大的语言模型，但许多开发团队仍在努力构建与时俱进的自然语言处理应用程序。本书将帮助你快速了解自然语言处理的新技术及未来发展趋势。通过阅读本书，你将学习如何为组织中的实际应用程序构建、训练和部署模型。作者使用突出现代自然语言处理很好实践的代码和示例指导你完成整个过程。本书的主要内容包括：使用优选的自然语言处理模型（如BERT和GPT-3）来解决命名实体识别、文本分类、语义搜索和阅读理解等自然语言处理任务。开发性能可媲美甚至优于开箱即用系统的自然语言处理模型。了解Transformer架构和现代技巧，比如席卷整个自然语言处理世界的迁移学习。熟悉自然语言处理的工具和框架，包括spaCy、Hugging Face和fast.ai。使用Python和PyTorch从头开始构建自然语言处理任务流水线的核心部分，包括分词器、向量嵌入和语言模型。将你的模型从Jupyter Notebook中产品化，并学习如何在生产环境中部署、监控和维护它们。

前言1
**部分浮光掠影
第1章自然语言处理介绍11
1.1 什么是自然语言处理12
1.2 基本的自然语言处理19
1.3 总结38
第2章 Transformer和迁移学习40
2.1 利用fast.ai库进行训练41
2.2 利用Hugging Face系列库进行推理54
2.3 总结60
第3章 NLP任务和应用程序61
3.1 预训练语言模型61
3.2 迁移学习和微调62
3.3 NLP任务63
3.4 自然语言数据集65
3.5 NLP任务1：命名实体识别70
3.6 NLP任务2：文本分类84
3.7 总结92
第二部分纲举目张
第4章分词97
4.1 一个极简的分词器98
4.2 Hugging Face的分词器100
4.3 搭建自己的分词器103
4.4 总结106
第5章向量嵌入：计算机如何“理解”单词107
5.1 理解文本与读取文本107
5.2 词向量111
5.3 词向量嵌入实践116
5.4 非词条的嵌入122
5.5 总结126
第6章循环神经网络和其他序列模型128
6.1 循环神经网络130
6.2 长短期记忆网络142
6.3 门控循环单元143
6.4 总结144
第7章 Transformer146
7.1 从头开始构建Transformer146
7.2 注意力机制148
7.3 计算机视觉Transformer161
7.4 总结162
第8章 BERT方法论：博采众长创新篇164
8.1 ImageNet164
8.2 通往NLP“ImageNet时刻”之路165
8.3 预训练的词向量嵌入166
8.4 序列模型170
8.5 循环神经网络172
8.6 注意力机制176
8.7 Transformer架构178
8.8 NLP的“ImageNet时刻”181
8.9 总结184
第三部分经世致用
第9章工欲善其事，必先利其器187
9.1 深度学习框架188
9.2 可视化与实验跟踪193
9.3 AutoML196
9.4 机器学习基础设施和计算198
9.5 边缘/终端侧推理201
9.6 云推理和机器学习即服务203
9.7 持续集成和持续交付205
9.8 总结205
第10章可视化207
10.1 我们的**个Streamlit应用程序208
10.2 总结220
第11章产品化222
11.1 数据科学家、工程师和分析师222
11.2 Databricks：你的统一数据分析平台224
11.3 Databricks的安装228
11.4 机器学习作业243
11.5 MLflow249
11.6 Databricks的替代品260
11.7 总结261
第12章归纳提升263
12.1 *后十课263
12.2 *后的话268
附录A 大规模训练269
附录B CUDA273

展开全部

作者简介

安库·A.帕特尔（Ankur A.Patel），是Glean和Mellow的联合创始人。Glean使用自然语言处理技术生成供应商的支出情报信息，Mellow为程序员提供自然语言处理的API。此前，Ankur曾领导过7Park Data、 ThetaRay、R-SquaredMacro、Bridgewater Associates(桥水联合基金）和JPMorgan（摩根大通）的团队。他也是Hands-On Unsupervised Learning Using Python一书的作者。

本类五星书