- ISBN:9787121439551
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:280
- 出版时间:2022-08-01
- 条形码:9787121439551 ; 978-7-121-43955-1
本书特色
如今,虽然GAN已经衍生出许多的变体,商业应用场景变得非常广泛。但GAN本身仍然存在许多开放性研究问题需要继续深入探索,如GAN的评估优化,由于其训练过程本质上是一个无监督学习过程,导致有许多指标在训练过程中虽然高,但是生成效果却未必好,所以目前还很难找到一个比较客观且可量化的评估指标;再如GAN的模型崩溃问题,尽管已经有很多相关研究,但是对于高维数据,这个问题还没完全解决。本书对GAN进行了系统阐述,为之后问题的解决奠定基础。
内容简介
本书深入浅出地介绍了近年来AI领域中十分引人注目的新型人工神经网络――生成对抗网络(GAN)的基本原理、网络结构及其在图像处理领域中的应用;同时,分析了近年来在GAN训练、GAN质量评估及多种改进型GAN方面取得的进展;在实践方面,给出了基于Python的基本GAN编程实例。另外,本书还介绍了支撑GAN模型的基础理论和相关算法,以使读者更好地理解和掌握GAN技术。
目录
1.1 从图像处理到数字视觉 2
1.1.1 数字图像技术 3
1.1.2 数字视觉技术 5
1.1.3 数字视觉的应用 7
1.2 神经网络由浅入深 10
1.2.1 神经网络的发展 10
1.2.2 深度神经网络 11
1.2.3 深度学习的进展 12
1.3 从概率生成到对抗生成 13
1.3.1 概率生成模型 14
1.3.2 概率分布比较 16
1.3.3 对抗生成模型 16
1.4 GAN的应用 18
1.4.1 在图像领域中的应用 18
1.4.2 在其他领域中的应用 20
第2章 数字图像处理 22
2.1 数字图像基础 22
2.1.1 图像的数学表示 22
2.1.2 图像的数字化 23
2.1.3 数字图像的表示 26
2.1.4 图像的分辨率 28
2.2 传统数字图像处理 30
2.2.1 图像采集和压缩 30
2.2.2 图像去噪和滤波 31
2.2.3 图像增强和复原 32
2.2.4 图像分割 33
2.2.5 图像特征提取和目标检测 34
2.2.6 图像变换和超分辨率重建 35
2.3 ANN图像处理 36
2.3.1 图像分类 36
2.3.2 目标检测与跟踪 37
2.3.3 语义分割和实例分割 39
2.3.4 图像生成 40
2.4 常用的图像数据集 43
第3章 人工神经网络 49
3.1 ANN简介 49
3.1.1 从生物到人工神经元 50
3.1.2 从感知机到神经网络 51
3.1.3 从浅层到深度 54
3.1.4 ANN的特点和应用 55
3.2 常见的ANN类型 57
3.2.1 RBF网络 57
3.2.2 ART网络 58
3.2.3 SOM网络 59
3.2.4 波尔兹曼机 59
3.2.5 级联相关网络 61
3.3 ANN的关键技术 62
3.3.1 网络类型 62
3.3.2 网络训练 62
3.3.3 激活函数 64
3.3.4 验证和泛化 65
3.4 BP算法 66
3.4.1 数据的正向传播 67
3.4.2 误差的反向传播 68
3.4.3 BP算法流程 70
3.4.4 BP算法的几个问题 70
3.5 ANN的学习方式 71
3.5.1 有监督学习 71
3.5.2 无监督学习 72
3.5.3 半监督学习 72
3.5.4 强化学习 73
第4章 GAN中常用的ANN 74
4.1 卷积神经网络 74
4.1.1 CNN的结构 75
4.1.2 CNN的核心技术 76
4.1.3 CNN的训练和改进 79
4.1.4 CNN一例 80
4.1.5 图像卷积 81
4.2 循环神经网络 84
4.2.1 RNN的结构 85
4.2.2 RNN与CNN的比较 85
4.3 变分自编码器 86
4.3.1 自编码器 86
4.3.2 VAE概述 87
4.4 深度残差网络 91
4.4.1 深度网络的困境 91
4.4.2 残差块结构 92
4.4.3 残差块的作用 92
4.4.4 ResNet的误差反传 93
第5章 相关算法 96
5.1 和图像处理有关的算法 96
5.1.1 分类算法 96
5.1.2 聚类算法 104
5.1.3 降维算法 106
5.1.4 迁移学习 113
5.1.5 马尔可夫链和HMM 115
5.2 和函数优化有关的算法 120
5.2.1 *小二乘法 120
5.2.2 梯度下降法 121
5.2.3 EM算法 125
第6章 GAN基础 129
6.1 GAN概要 130
6.1.1 GAN的数据生成 130
6.1.2 GAN的网络结构 133
6.1.3 GAN的优势和不足 137
6.2 数据分布及其转换 139
6.2.1 图像数据的高维分布 139
6.2.2 隐变量和隐空间 141
6.2.3 分布函数的转换 143
6.3 生成模型与判别模型 145
6.3.1 生成模型 145
6.3.2 判别模型 149
6.3.3 生成模型和判别模型的关系 150
6.4 GAN的工作过程 152
6.4.1 纳什均衡 153
6.4.2 对抗训练 154
6.4.3 训练流程 157
第7章 GAN的目标函数 160
7.1 数据的信息熵 161
7.1.1 随机变量 161
7.1.2 信息量和信息熵 164
7.1.3 交叉熵 166
7.2 数据分布的差异:散度 168
7.2.1 KL散度 168
7.2.2 JS散度 169
7.2.3 f散度 169
7.3 GAN目标函数及其优化 171
7.3.1 目标函数 171
7.3.2 判别器优化 178
7.3.3 生成器优化 180
第8章 GAN的训练 182
8.1 GAN训练中常见的问题 183
8.1.1 收敛不稳定问题 183
8.1.2 梯度消失问题 184
8.1.3 模式崩溃问题 189
8.2 提升GAN训练的稳定性 192
8.2.1 选择恰当的网络模型 192
8.2.2 选择恰当的目标函数 194
8.2.3 选择恰当的优化算法 196
8.3 GAN训练中的常用技巧 198
8.3.1 数据规范化 198
8.3.2 学习率衰减 199
8.3.3 丢弃技术 200
8.3.4 批量规范化 203
8.3.5 激活函数的选择 203
第9章 GAN的改进 206
9.1 GAN的改进之路 207
9.2 C GAN和info GAN 207
9.2.1 C GAN 207
9.2.2 info GAN 209
9.3 DC GAN 211
9.4 W GAN 213
9.5 Big GAN 214
第10章 GAN的图像处理应用 217
10.1 图像生成 218
10.1.1 图像生成的三种方式 218
10.1.2 几种特殊的图像生成 221
10.2 图像超分辨率重建 221
10.3 图像修复 222
10.4 图像翻译 224
10.4.1 图像至图像的翻译 224
10.4.2 文本至图像的翻译 225
10.5 图像风格迁移 226
10.6 视频预测 227
第11章 GAN的Python编程 228
11.1 Python编程语言 228
11.1.1 Python简介 228
11.1.2 Python的特点 230
11.1.3 Python的应用 232
11.2 常见的Python集成开发环境 233
11.3 深度学习框架 235
11.3.1 主流的深度学习框架 235
11.3.2 主流学习框架的比较 237
11.4 TensorFlow中的GAN编程 238
11.4.1 张量和张量流 239
11.4.2 Python的TensorFlow库 242
11.4.3 TensorFlow的常用模块 243
第12章 GAN图像处理实例 245
12.1 1维GAN编程 245
12.1.1 1维GAN小程序 246
12.1.2 数据对齐 248
12.1.3 训练中的几个问题 249
12.2 MNIST手写数字的生成 249
12.2.1 GAN模型的训练程序 250
12.2.2 GAN模型的生成程序 254
12.2.3 训练程序的图解 256
12.2.4 生成程序的图解 257
作者简介
朱秀昌,男,1947年生,硕士,江苏丹徒人。曾任南京邮电大学通信与信息工程学院教授,博士生导师,"江苏省图像处理与图像通信重点实验室”主任。长期从事图像和多媒体通信方面的科研和教学工作。曾主持完成了多项国家、省部级科研项目,主讲了多门本科生和研究生的专业课程。先后在5个出版社编著出版了"数字图像处理与图像通信”等书籍17本,发表专业技术论文160余篇。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0