- ISBN:9787121437083
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:304
- 出版时间:2022-06-01
- 条形码:9787121437083 ; 978-7-121-43708-3
内容简介
深度学习凭借其在识别应用领域中超高的预测准确率,在图像处理领域获得了极大关注,这势必将提升现有图像处理系统的性能并开创新的应用领域。利用卷积神经网络等深层神经网络的解决方案,可以逐渐取代基于算法可解释的传统图像处理工作。尽管图像预处理、后期处理和信号处理仍在大量采用现有方法,但在图像分类应用中,深度学习变得愈加重要。在该背景下,本书系统介绍了深度学习在数字图像处理各个研究分支的应用,包括图像增强、图像复原、图像检索、图像压缩、图像分割、目标检测、动作识别和图像配准等。每一部分都对传统方法做了概述,并穿插介绍本书作者的研究成果,反映了深度学习在数字图像处理各个研究分支的发展现状。本书可作为高等院校具有一定计算机基础的人工智能、自动化、信号与信息处理、电子信息工程、计算机科学与技术、通信工程等专业的研究生或高年级本科生的教材或参考书,也可作为科研院所相关专业的科技工作者的参考书。
目录
1.1 数字图像的基本概念 1
1.1.1 数字图像 1
1.1.2 获取静态数字图像的方式 7
1.1.3 色彩及色彩模型 10
1.2 数字图像的获取与描述 15
1.2.1 图像数字化 15
1.2.2 图像灰度直方图 17
1.2.3 图像处理算法的形式 20
1.2.4 图像的数据结构与特征 21
1.3 数字图像处理的研究内容和应用领域 25
1.3.1 数字图像处理的基本流程 25
1.3.2 数字图像处理的研究分支 26
1.3.3 传统数字图像处理常用的理论工具 30
1.3.4 数字图像处理的应用领域 30
参考文献 32
第2章 深度学习概述 33
2.1 深度学习的概念 33
2.1.1 深度学习的历史背景 33
2.1.2 深度学习的基本思想 33
2.1.3 深度学习的本质和优势 34
2.2 国内外研究现状 35
2.2.1 深度学习在语音识别领域的研究现状 35
2.2.2 深度学习在图像识别领域的研究现状 37
2.2.3 深度学习在自然语言处理领域的研究现状 40
2.3 深度学习典型模型结构和训练算法 41
2.3.1 感知机 42
2.3.2 前馈神经网络之多层感知机 43
2.3.3 前馈神经网络之卷积神经网络 45
2.3.4 反馈深度网络 48
2.3.5 双向深度网络 50
2.3.6 深度学习训练算法 55
2.4 深度学习的优点和已有的应用 57
2.4.1 深度学习的优点 57
2.4.2 深度学习已有的典型应用 57
2.5 深度学习存在的问题及未来研究方向 60
2.5.1 深度学习目前存在的问题 60
2.5.2 深度学习未来研究方向 61
参考文献 62
第3章 基于深度学习的图像增强与图像恢复 66
3.1 图像去噪 66
3.1.1 传统图像去噪方法概述 66
3.1.2 基于DnCNN的图像去噪 69
3.1.3 基于CBDNet的图像去噪 72
3.2 图像去雾 74
3.2.1 传统图像去雾方法概述 74
3.2.2 基于DehazeNet的图像去雾 77
3.2.3 基于EPDN的图像去雾 79
3.2.4 基于PMS-Net的图像去雾 80
3.3 图像去模糊 82
3.3.1 传统图像去模糊方法概述 82
3.3.2 基于ResBlock的图像去模糊 85
3.3.3 基于DAVANet的图像去模糊 86
3.4 图像增强 91
3.4.1 传统图像增强方法概述 91
3.4.2 基于Deep Bilateral Learning的图像增强 94
3.4.3 基于Deep Photo Enhancer的图像增强 96
3.4.4 基于Deep Illumination Estimation的图像增强 97
参考文献 99
第4章 基于深度学习的图像检索 105
4.1 图像检索的研究背景和研究现状 105
4.1.1 图像检索的研究背景 105
4.1.2 为什么要引入深度学习 106
4.1.3 图像检索的研究现状 106
4.2 图像特征和相似性度量 108
4.2.1 原始数据层特征 108
4.2.2 物理层特征 109
4.2.3 语义层特征 110
4.2.4 图像相似性度量 110
4.3 基于内容的图像检索 111
4.3.1 基于颜色特征的图像检索 111
4.3.2 基于纹理特征的图像检索 113
4.3.3 基于形状特征的图像检索 114
4.3.4 基于多特征的图像检索 115
4.3.5 基于视觉词袋的图像检索 119
4.4 基于注意力机制和卷积神经网络的图像检索 122
4.4.1 注意力机制简介 122
4.4.2 图像检索中的注意力机制 123
4.4.3 基于注意力机制和卷积神经网络模型的图像检索 124
4.4.4 实验结果 127
4.5 基于深度信念网络的人脸图像检索 130
4.5.1 局部二值模式 130
4.5.2 DBN训练模型 130
4.5.3 融合LBP算子与DBN网络模型的图像检索 131
4.5.4 实验结果 131
参考文献 132
第5章 基于深度学习的图像压缩 136
5.1 图像压缩概述 136
5.1.1 图像压缩的目的和意义 136
5.1.2 传统图像压缩的方法分类和简介 137
5.1.3 为什么要引入深度学习 139
5.1.4 基于深度学习的图像压缩技术现状 139
5.2 基于矢量量化的图像压缩方法 140
5.2.1 基于矢量量化的图像压缩概述 140
5.2.2 基于边缘分类和范数排序的K-means算法的码书设计 142
5.2.3 基于特征分类和分组初始化的改进K-means算法的码书设计 146
5.3 基于深度学习的图像压缩方法 151
5.3.1 基于卷积神经网络的图像压缩方法概述 151
5.3.2 基于循环神经网络的图像压缩方法概述 153
5.3.3 基于生成对抗网络的图像压缩方法概述 154
5.3.4 结合卷积神经网络和传统方法的图像压缩 155
5.3.5 实验结果与分析 159
参考文献 161
第6章 基于深度学习的图像分割 167
6.1 图像分割概述 167
6.1.1 图像分割的目的和意义 167
6.1.2 传统图像分割方法分类 168
6.1.3 典型传统图像分割方法简介 170
6.1.4 为什么引入深度学习 175
6.2 复杂背景下毛坯轮毂图像分割及圆心精确定位 176
6.2.1 引言 176
6.2.2 基于超像素能量谱的轮毂分割 177
6.2.3 精确圆拟合算法 178
6.2.4 圆拟合结果分析 179
6.3 基于深度学习的图像分割概述 181
6.3.1 研究现状 181
6.3.2 几种典型实现方案 182
6.3.3 基于全卷积神经网络的图像分割实验结果 185
6.4 基于深度生成对抗网络的超声图像分割 186
6.4.1 引言 186
6.4.2 相关工作 187
6.4.3 基于深度生成对抗网络的臂丛分割 188
6.4.4 实验 190
参考文献 193
第7章 基于深度学习的人脸检测与行人检测 198
7.1 基于深度学习的人脸检测 198
7.1.1 人脸检测概述 198
7.1.2 基于深度学习的人脸检测算法分类和数据集 200
7.1.3 多任务级联卷积网络的加速 203
7.1.4 实验结果 209
7.2 行人检测概述 212
7.2.1 行人检测基本框架 212
7.2.2 基于传统机器学习的方法 212
7.2.3 基于深度学习的方法 213
7.2.4 行人检测评判标准 216
7.3 基于ViBe结合HOG+SVM的快速行人检测与跟踪 216
7.3.1 引言 216
7.3.2 ViBe算法 217
7.3.3 基于HOG+SVM的行人检测 218
7.3.4 基于ViBe结合HOG+SVM方案 220
7.3.5 实验结果与分析 222
参考文献 227
第8章 基于深度学习的动作识别 232
8.1 人体动作识别技术概述 232
8.1.1 引言 232
8.1.2 国内外研究现状 233
8.1.3 研究难点 236
8.2 动作识别相关技术 237
8.2.1 图卷积网络 237
8.2.2 用于骨骼动作识别的空时图卷积网络 239
8.2.3 用于视频动作识别的双流卷积网络 240
8.2.4 动作识别相关数据集 241
8.3 人体姿态估计 244
8.3.1 人体姿态估计的分类 244
8.3.2 OpenPose算法 245
8.3.3 AlphaPose算法 248
8.3.4 实验结果比较分析 251
8.4 基于图卷积网络的骨骼序列动作识别算法 253
8.4.1 引言 253
8.4.2 注意力机制和共现特征学习 253
8.4.3 基于图卷积网络的多任务框架 254
8.4.4 实验结果及分析 257
8.5 一种替代光流的视频动作识别算法 261
8.5.1 基于光流估计的双流卷积网络 261
8.5.2 时间轨迹滤波器 262
8.5.3 随机跨帧融合 264
8.5.4 实验结果及分析 265
参考文献 266
第9章 基于深度学习的医学图像配准 270
9.1 医学图像配准概述 270
9.1.1 基本概念 270
9.1.2 基本变换 270
9.1.3 方法分类 272
9.1.4 典型配准方法 272
9.1.5 评估方法 273
9.2 基于分形沙漏网络由MV-DR合成kV-DRR 274
9.2.1 引言 274
9.2.2 分形沙漏网络 274
9.2.3 实验 276
9.3 基于公共表征学习和几何约束的多模态医学图像配准 278
9.3.1 引言 278
9.3.2 方法 279
9.3.3 实验及算法比较 280
9.4 基于信息瓶颈条件生成对抗网络的MV-DR和kV-DRR配准 281
9.4.1 引言 281
9.4.2 材料和方法 282
9.4.3 结果 287
参考文献 290
作者简介
马龙华,浙江大学宁波理工学院教授,主持和承担国家自然科学基金面上项目3项、重点项目1项,工信部"********”新模式重大专项2项,浙江省杰出青年基金和重点基金各1项;获省部级科技进步奖6项,其中省部级二等奖3项。
-
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
C Primer Plus 第6版 中文版
¥61.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥37.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥20.3¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
大学计算机基础实验教程(MS Office版)——面向数据分析能力培养
¥29.1¥39.8 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥51.8¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥70.0¥89.8 -
LINUX实战——从入门到精通
¥52.4¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
数据存储架构与技术(第2版)
¥62.9¥89.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0