计算机视觉从入门到进阶实战 基于PyTorch
- ISBN:9787122452023
- 装帧:平装
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:360
- 出版时间:2024-08-01
- 条形码:9787122452023 ; 978-7-122-45202-3
本书特色
本书从初学者的角度出发,全面系统地讲解了Pytorch计算机视觉开发的方法与技巧,书中不光有理论知识的讲解,更有大量的实操案例,帮助读者快速掌握所学知识。本书主要具有以下特色:1.双色印刷,全程图解,更好地呈现知识要点与实操步骤,为读者带来良好的学习体验。2.内容循序渐进,先从基础入手,再通过不同的模块,以实例引导学习,并逐步延伸提升。3.案例丰富实用,全书穿插许多大小实例,帮助读者边练边学,在实践中快速成长。4.附赠配套资源,购书即可获赠全程教学视频、源码等资源,并可享受在线技术支持等服务。
内容简介
本书基于PyTorch深度学习框架,结合计算机视觉中的主流任务,介绍了深度学习相关算法的计算机视觉上的应用。本书主要内容分为两部分。**部分为PyTorch框架使用的相关知识,以及计算机视觉和深度学习的入门知识。第二部分重点介绍深度学习在计算机视觉上的应用,包括:经典的深度卷积网络、深度注意力网络,以及基于自注意力的Transformer系列网络在图像分类中的应用;R-CNN系列、YOLO系列、SSD系列目标检测网络的算法思想及在目标检测中的应用;FCN、U-Net等全卷积网络在图像语义分割领域的应用;针对风格迁移任务,介绍了快速风格迁移、CycleGan等算法的实战应用;针对自编码器和扩散模型,介绍了相关算法在图像重构、去噪以及生成相关计算机视觉任务中的实战应用;*后介绍了迁移学习和域自适应的经典算法在跨域计算机视觉图像分类任务中的应用。本书适合对计算机视觉、深度学习、人工智能、PyTorch使用感兴趣的初学者及研究人员自学使用,也可作为高等院校相关专业的教材及参考书。
目录
1.1 计算机视觉简介 002
1.1.1 数字图像处理基础 003
1.1.2 主流计算机视觉任务 008
1.2 深度学习简介 010
1.2.1 深度学习发展简史 010
1.2.2 感知机与人工神经网络 012
1.2.3 卷积神经网络 012
1.2.4 循环神经网络 013
1.2.5 优化算法 014
1.2.6 欠拟合与过拟合 016
1.3 Python与PyTorch安装 017
1.3.1 安装Python 017
1.3.2 安装PyTorch 020
1.3.3 PyTorch核心模块 021
1.3.4 PyTorch辅组库 023
1.3.5 其他Python库 023
1.4 本章小结 025 第2章 PyTorch快速入门 026
2.1 张量Tensor 027
2.1.1 张量的数据类型 027
2.1.2 张量的生成 028
2.1.3 张量操作 034
2.1.4 张量计算 041
2.2 torch.nn模块 047
2.2.1 卷积层 047
2.2.2 池化层 049
2.2.3 填充层 051
2.2.4 激活函数层 052
2.2.5 归一化函数层 053
2.2.6 循环层 054
2.2.7 全连接层 054
2.2.8 Transformer层 055
2.3 图像数据操作和预处理 055
2.3.1 从datasets模块中导入数据并预处理 057
2.3.2 从文件夹中导入数据并进行预处理 058
2.4 优化器与损失函数 060
2.4.1 优化器 061
2.4.2 损失函数 063
2.5 预训练网络 065
2.6 GPU部署和使用 067
2.7 本章小结 068 第3章 图像分类 069
3.1 经典的深度图像分类网络 070
3.1.1 LeNet-5网络 070
3.1.2 AlexNet网络 071
3.1.3 VGG网络结构 072
3.1.4 GoogLeNet 073
3.1.5 ResNet网络 074
3.1.6 DenseNet网络 076
3.1.7 CLIP模型 078
3.2 卷积神经网络识别FashionMNIST 080
3.2.1 图像数据准备 081
3.2.2 卷积神经网络的搭建 083
3.2.3 卷积神经网络训练与预测 084
3.3 ResNet网络预测CIFAR10 089
3.3.1 图像数据准备 090
3.3.2 ResNet网络搭建 092
3.3.3 ResNet网络训练与预测 096
3.4 微调预训练的卷积网络 101
3.4.1 微调预训练的VGG网络 102
3.4.2 准备新网络需要的数据 104
3.4.3 微调VGG网络的训练和预测 106
3.5 卷积网络可视化 108
3.5.1 网络中间特征可视化 109
3.5.2 类激活热力图可视化 112
3.6 CLIP模型应用 116
3.6.1 CLIP零样本学习 117
3.6.2 CIFAR10使用CLIP特征分类 118
3.7 本章小结 120 第4章 目标检测与识别 121
4.1 目标检测方法 122
4.1.1 目标检测算法分类 122
4.1.2 目标检测评价指标 122
4.1.3 目标检测常用损失函数 123
4.1.4 锚框与非极大值抑制 125
4.2 经典的目标检测网络 126
4.2.1 R-CNN系列网络 126
4.2.2 YOLO系列网络 129
4.2.3 SSD系列网络 132
4.2.4 其他目标检测网络 135
4.3 使用预训练的目标检测网络 138
4.3.1 目标检测常用数据集 138
4.3.2 图像目标检测 139
4.3.3 人体关键点检测 140
4.4 训练自己的YOLOv3目标检测网络 142
4.4.1 PASCAL VOC数据准备 143
4.4.2 YOLOv3网络搭建 154
4.4.3 YOLOv3网络训练 158
4.4.4 YOLOv3目标检测 163
4.5 本章小结 164 第5章 语义分割 165
5.1 语义分割方法 166
5.2 经典的语义分割网络 167
5.2.1 FCN 167
5.2.2 SegNet 169
5.2.3 U-Net 169
5.2.4 DeepLab系列 170
5.2.5 PSPNet 172
5.2.6 SAM 172
5.3 使用预训练的语义分割网络 173
5.3.1 使用预训练网络 173
5.3.2 语义分割评价指标 176
5.4 训练自己的语义分割网络 176
5.4.1 数据准备 177
5.4.2 FCN语义分割网络 186
5.4.3 U-Net语义分割网络 194
5.5 本章小结 201 第6章 注意力机制与Transformer 202
6.1 经典的注意力模型 204
6.1.1 SE-Net 204
6.1.2 SPANet 205
6.1.3 CBAM 206
6.1.4 Transformer 207
6.1.5 ViT 209
6.1.6 Swin Transformer 210
6.2 PyTorch预训练ViT网络应用 211
6.2.1 预训练ViT网络导入 212
6.2.2 CIFAR100数据准备 213
6.2.3 预训练ViT网络训练与预测 214
6.3 ViT网络图像分类 218
6.3.1 ViT网络搭建 220
6.3.2 CIFAR00数据准备 224
6.3.3 ViT网络训练与预测 226
6.4 本章小结 228 第7章 图像风格迁移 229
7.1 经典的图像风格迁移方法 230
7.1.1 固定风格固定内容的风格迁移 231
7.1.2 固定风格任意内容的风格迁移 233
7.1.3 任意风格任意内容的风格迁移 234
7.1.4 基于Gan的图像风格迁移 236
7.2 固定风格固定内容的风格迁移 239
7.2.1 准备VGG19网络 239
7.2.2 图像数据准备 240
7.2.3 图像的输出特征和Gram矩阵的计算 242
7.2.4 进行图像风格迁移 244
7.3 固定风格任意内容的风格迁移 247
7.3.1 快速风格迁移网络准备 247
7.3.2 快速风格迁移数据准备 251
7.3.3 快速风格迁移网络训练和结果展示 253
7.4 CycleGan风格迁移 260
7.4.1 CycleGan网络搭建 260
7.4.2 非成对图像数据准备 263
7.4.3 网络训练 265
7.4.4 图像转换结果展示 270
7.5 本章小结 271 第8章 自编码器与扩散模型 272
8.1 自编器模型与扩散模型介绍 273
8.1.1 自编码器原理 273
8.1.2 变分自编码器 274
8.1.3 VQ-VAE图像生成 275
8.1.4 Stable Diffusion图像生成 276
8.2 自编码器图像重构 278
8.2.1 自编码网络数据准备 279
8.2.2 自编码网络的构建 281
8.2.3 自编码网络的训练 282
8.2.4 自编码网络的数据重构 283
8.2.5 网络的编码特征可视化 284
8.3 自编码器图像去噪 285
8.3.1 数据准备 286
8.3.2 网络搭建 289
8.3.3 网络训练与预测 291
8.4 Stable Diffusion图像生成 296
8.4.1 数据准备 296
8.4.2 网络搭建 298
8.4.3 网络训练与预测 310
8.5 本章小结 312 第9章 迁移学习与域自适应 313
9.1 迁移学习简介 314
9.1.1 迁移学习的定义 314
9.1.2 为什么需要迁移学习 315
9.1.3 迁移学习的分类 316
9.1.4 度量准则 318
9.2 经典的迁移学习算法 319
9.2.1 基于深度迁移的finetune模型 319
9.2.2 基于对抗学习的迁移学习 320
9.2.3 基于对齐的迁移学习 324
9.2.4 基于伪标签的迁移学习 326
9.2.5 其他迁移学习损失函数 328
9.3 迁移学习图像分类实战 328
9.3.1 数据和网络准备工作 329
9.3.2 基于微调的迁移学习 335
9.3.3 基于对齐的迁移学习 338
9.3.4 基于对抗的迁移学习 343
9.3.5 基于目标域标签互信息的迁移学习 347
9.4 本章小结 351 参考文献 352
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0