- ISBN:9787111764335
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:211
- 出版时间:2024-10-01
- 条形码:9787111764335 ; 978-7-111-76433-5
本书特色
本教材对多年产教融合一线实践经验进行归纳总结,结合作者技术研究领域,采用PyTorch作为深度学习框架,将搭建深度学习技术和企业应用场景项目需求间的桥梁,使得学生通过本教材的学习,具备企业项目开发能力。为紧跟企业需求,在内容选材上,突出以下要素:
① 通过5个基础项目,重点介绍了CNN、Transformer等主流的神经网络框架,做到逐行代码讲解,结合插图和DEBUG调试技巧,让读者理解神经网络参数变化趋势, 通过逐网络层级可视化,观察网络对特征的提取,揭开网络黑盒,直面神经网络本质。
② 通过3个综合项目,紧扣实际项目需求和行业应用热点,重点介绍了Yolo、UNet、Real-ESRGAN、ChatGPT、Stable Difusion等*新技术,实现了目标检测、图像分割、超分辨率重建、智能问答、文生图、图生图等热门应用,带领读者完成商业级项目开发,让读者具备一定的企业级项目实战能力。
内容简介
《PyTorch深度学习项目教程》根据初学者的学习曲线和职业生涯成长规律,由浅入深设计了5个基础项目和3个综合项目。 基础项目包括手写数字识别、二维曲线拟合、猫狗图像分类、提升猫狗图像分类的准确率和文本翻译,引导读者使用PyTorch构建神经网络算法框架,深入探讨了深度学习数据集构建、神经网络模型原理及实现、算法训练与评价等内容;综合项目包括食品加工人员异常行为检测、工业检测图像分割和内容智能生成,介绍了深度学习的新技术,实现了目标检测、图像分割、超分辨率重建、智能问答、文生图、图生图等应用。 《PyTorch深度学习项目教程》可作为高等职业院校人工智能技术专业相关课程的教材,也可作为工程人员的入门书籍。
目录
项目1 手写数字识别项目背景
任务1.1 初识深度学习
任务1.2 配置PyTorch开发环境
1.2.1 PyTorch概述及硬件要求
1.2.2 Anaconda的下载及安装
1.2.3 CUDA工具包的下载及安装
1.2.4 PyTorch的安装及配置
1.2.5 PyCharm的下载及安装
任务1.3 快速完成手写数字识别功能
1.3.1 MNIST手写数字识别数据库概述
1.3.2 手写数字识别实现
1.3.3 手写数字识别测试
习题
项目2 二维曲线拟合项目背景
任务2.1 理解曲线拟合需求
任务2.2 掌握PyTorch的基本语法
2.2.1 Tensor的创建
2.2.2 Tensor索引操作
2.2.3 Tensor形状变换
2.2.4 PyTorch的数学运算
2.2.5 广播机制
2.2.6 Tensor和NumPy的转换
2.2.7 在GPU上操作
任务2.3 搭建二维曲线数据集
任务2.4 搭建网络结构
2.4.1 神经网络概述
2.4.2 激活函数
2.4.3 多层感知机
任务2.5 训练神经网络模型
2.5.1 正向传播
2.5.2 损失函数
2.5.3 训练迭代与反向传播
2.5.4 训练迭代过程
任务2.6 网络推理
任务2.7 模型结构分析
任务2.8 拟合更多的二维曲线
习题
项目3 猫狗图像分类项目背景
任务3.1 准备猫狗数据集
3.1.1 创建猫狗分类数据集
3.1.2 数据集的读取与预处理
任务3.2 设计图像分类全连接网络
任务3.3 训练图像分类网络
3.3.1 训练日志记录
3.3.2 训练初始化
3.3.3 配置数据集
3.3.4 加载网络模型
3.3.5 配置训练策略
3.3.6 迭代训练
任务3.4 应用分类网络推理更多图片
任务3.5 认识深度学习的主要任务:回归与分类
3.5.1 线性回归
3.5.2 二分类与逻辑回归
3.5.3 多分类问题处理
习题
项目4 提升猫狗图像分类的准确率项目背景
任务4.1 多层感知机问题分析
任务4.2 卷积神经网络的引入
4.2.1 卷积的概念
4.2.2 添加步长
4.2.3 填充边缘
4.2.4 卷积神经网络结构
任务4.3 卷积网络结构编程实现
任务4.4 网络训练及结果评估
任务4.5 认识更多网络结构
4.5.1 AlexNet网络模型
4.5.2 VGGNet网络模型
4.5.3 ResNet网络模型
4.5.4 MobileNet网络模型
习题
项目5 文本翻译项目背景
任务5.1 认知自然语言处理及相关技术
5.1.1 自然语言处理的概念
5.1.2 图灵测试
5.1.3 自然语言处理技术的发展
任务5.2 构建中英文翻译数据集
任务5.3 搭建Transformer神经网络
5.3.1 输入序列向量化
5.3.2 位置编码
5.3.3 编码器、解码器和输出序列化
任务5.4 训练Transformer网络
任务5.5 完成文本翻译推理
任务5.6 理解Transformer网络模型
5.6.1 Transformer模型结构
5.6.2 Transformer的输入和输出
5.6.3 Transformer的推理过程
5.6.4 Transformer的训练过程
5.6.5 nn.Transformer的构造参数
5.6.6 nn.Transformer的forward参数
习题
项目6 食品加工人员异常行为检测项目背景
任务6.1 理解目标检测需求
任务6.2 数据采集及标注
6.2.1 数据采集
6.2.2 数据标注
6.2.3 数据集构建
任务6.3 训练YOLO模型
6.3.1YOLO 工具包的安装
6.3.2 配置文件修改
6.3.3 训练模型
任务6.4 采用YOLO进行异常行为推理
任务6.5 掌握目标检测流程
习题
项目7 工业检测图像分割项目背景
任务7.1 了解图像分割需求
任务7.2 数据集构建
7.2.1 数据标注
7.2.2 数据格式转换及数据集划分
任务7.3 图像分割网络训练
7.3.1 UNet网络概述
7.3.2 UNet网络的建立
7.3.3 创建Dataset类
7.3.4 进行网络训练
任务7.4 网络推理及结果评价
习题
项目8 内容智能生成项目背景
任务8.1 了解人工智能内容生成相关概念
任务8.2 实现图像超分辨率重建
8.2.1 图像超分辨率技术
8.2.2 生成对抗网络技术
8.2.3 Real-ESRGAN应用
任务8.3 实现自动问答
8.3.1 ChatGPT技术概述
8.3.2 类ChatGPT本地化应用
8.3.3 问答提词器的设计技巧
任务8.4 实现AI绘画
8.4.1 扩散模型技术概述
8.4.2 Stable Diffusion UI安装
8.4.3 AI绘图实现
习题
参考文献
作者简介
宋桂岭,博士,研究方向为计算机图形学、视觉机器人和深度学习,毕业于北京邮电大学。现为无锡科技职业学院物联网与人工智能学院教师,原北京邮电大学移动机器人与智能技术实验室成员,北京邮电大学无锡研究院副院长,无锡北邮感知技术产业研究院有限公司副总经理兼总工程师,拥有二十年一线软硬件产品研发经验。2008年度江苏省信息产业厅先进工作者,参与国家级项目5项(前三),主持省级科技项目1项,教研项目1项,市级科技项目4项。拥有软件著作权22项,发明专利5项,发表SCI、EI、中文核心等论文12篇。研发成果包括工业CT算法库平台(日联科技)、计算摄影相关国际标准(传音股份)、移动机器人智能平台(博士毕业课题、173课题)、智能交通集成管控平台(中国智能交通集团)、北邮异地协同办公平台、长春市智慧信访系统(三维通信集团)、上海食品安全异常行为抓拍系统(上海澳润)、“智慧眼”系列智能安防系统、感知工地系统、违章停车全自动抓拍系统,以及博物馆AR虚拟漫游系统等。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0