- ISBN:9787030736338
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:232
- 出版时间:2022-11-01
- 条形码:9787030736338 ; 978-7-03-073633-8
本书特色
在**版的基础上,对内容进行了大范围优化,保留了经典内容,精简了部分内容,同时增加了深度学习网络模型部分。
内容简介
本书主要介绍数字图像处理的基础方法,在**版的基础上,对内容进行优化,增加了关于数字图像处理三类深度学习网络模型的介绍。
本书共11章,重点介绍数字图像处理的基本概念、图像增强、图像几何变换、图像去噪、图像锐化、图像分割、二值图像处理、彩色图像处理、图像变换、图像压缩编码、图像处理的深度学习网络模型等。
目录
第1章引言1
1.1数字图像处理、计算机视觉、计算机图形学3
1.2数字图像处理系统的结构5
1.3数字图像的基本概念6
1.3.1数字图像的数值描述6
1.3.2数字图像的灰度直方图9
1.4数字图像处理的主要研究内容12
1.5本书的结构安排14
习题15
第2章图像增强17
2.1γ校正18
2.2对比度线性展宽23
2.3灰级窗与灰级窗切片25
2.3.1灰级窗25
2.3.2灰级窗切片26
2.4动态范围调整28
2.4.1线性动态范围调整28
2.4.2非线性动态范围调整30
2.5直方图均衡化32
2.6自适应直方图均衡化35
2.7伪彩色37
2.8Retinex图像增强方法40
习题42
第3章图像几何变换43
3.1图像的位置变换44
3.1.1图像的平移44
3.1.2图像的镜像45
3.1.3图像的旋转46
3.2图像的形状变换51
3.2.1图像的缩小51
3.2.2图像的放大54
3.2.3图像的错切57
3.3齐次坐标与图像的仿射变换59
3.4图像几何畸变的校正60
习题63
第4章图像去噪65
4.1图像噪声66
4.2均值滤波67
4.2.1均值滤波的原理67
4.2.2均值滤波方法68
4.3中值滤波71
4.3.1中值滤波的原理71
4.3.2中值滤波方法71
4.4边界保持类平滑滤波73
4.4.1K近邻均值滤波74
4.4.2对称近邻均值滤波75
4.5非局部均值滤波77
习题79
第5章图像锐化81
5.1图像细节的基本特征82
5.2一阶微分算子83
5.2.1具有方向性的一阶微分算子84
5.2.2Roberts交叉微分算子87
5.2.3Sobel微分算子88
5.2.4Priwitt微分算子89
5.3二阶微分算子91
5.3.1Laplacian微分算子91
5.3.2Wallis微分算子95
5.4微分算子在边缘检测中的应用95
5.5Canny算子96
5.6LOG滤波算法102
习题104
第6章图像的分割105
6.1阈值分割方法106
6.1.1p-参数法106
6.1.2*大熵方法108
6.1.3*大类间、类内方差比法109
6.2区域生长分割方法110
习题112
第7章二值图像处理113
7.1二值图像中的基本概念114
7.1.1连接与点特性114
7.1.2几何特征115
7.2腐蚀与膨胀118
7.2.1腐蚀118
7.2.2膨胀120
7.3开运算与闭运算122
7.3.1开运算122
7.3.2闭运算123
7.4贴标签124
7.4.1连通域标签法124
7.4.2轮廓标签法127
7.5细线化方法128
习题130
第8章彩色图像处理131
8.1彩色的形成原理与基本概念132
8.2表色系133
8.2.1计算颜色模型系统134
8.2.2视觉颜色模型系统137
8.2.3工业颜色模型系统139
8.3色彩平衡140
8.3.1白平衡法141
8.3.2灰色世界法142
8.4彩色补偿143
习题146
第9章图像变换147
9.1图像的频域变换(傅里叶变换)148
9.1.1一维傅里叶变换148
9.1.2二维傅里叶变换151
9.1.3快速傅里叶变换(FFT)153
9.1.4图像的频谱分布特性157
9.2小波变换159
9.2.1连续小波变换160
9.2.2离散小波变换162
9.2.3小波的多尺度分解与重构163
9.3小波变换在图像处理中的应用169
9.3.1应用于图像压缩169
9.3.2应用于图像融合170
9.3.3应用于图像增强171
9.3.4应用于图像去噪172
习题172
第10章图像压缩编码173
10.1图像冗余的概念174
10.1.1冗余的概念174
10.1.2图像中的冗余175
10.2图像无损压缩编码177
10.2.1行程编码(RLE)177
10.2.2哈夫曼(Huffman)编码180
10.3图像有损压缩编码183
10.3.1彩色图像的有损编码183
10.3.2小波变换编码184
习题187
第11章深度学习与图像处理189
11.1深度卷积网络的基本结构190
11.1.1卷积层190
11.1.2激活层192
11.1.3BN层(批数据归一化处理层)193
11.1.4池化层194
11.2超分辨率图像重建卷积网络195
11.2.1SRCNN网络195
11.2.2ESPCN网络198
11.3图像分类深度卷积网络199
11.3.1LeNet-5网络199
11.3.2AlexNet网络203
11.4图像目标检测深度卷积网络205
11.4.1Faster-RCNN网络206
11.4.2YOLO网络211
习题218
参考文献219
节选
第1章引言 人类获得的信息70%以上来自于视觉,换句话说,人类将双眼观察到的世界,进行缜密地分析和思考之后,推动科技的进步,同时推动整个世界的发展。图像带给人们的信息非常直观,图像处理技术随着计算机技术、多媒体技术的飞速发展,取得了长足的进步。图像具有可以反映人类**感觉下的思维的魅力,这些年来,图像技术快速向多个研究领域渗透。本章首先介绍数字图像处理的基本概念,并对数字图像处理的系统结构和主要研究内容进行概述。 图像是对客观存在物体的一种相似性的生动模仿与描述,是物体的一种不完全、不精确的,但是在某种意义上非常适当的表示。 图1.1所示是对一枝桂花的描述,可以从图中感受到这枝桂花盛开的场景,这种感受来自于图像对场景的生动模仿。而这种模仿的写实性、生动性,以及直观性是其他表达方式所不能及的。从感受桂花美感的角度讲,这幅图像是对当时状况的一个适当表示。但是从图中无法知道当时整棵桂花树的状态,从这个角度来说,这幅图像同时也只是不完全、不精确的描述。 图1.1桂花 根据上面对图像的定义,可以将图像分为物理图像和虚拟图像。 物理图像是指物质或能量的实际分布。例如,光学图像的光强度的空间分布,能够被人的肉眼看见,因此也称为可见图像,是与人类的视觉特性相吻合的通常意义下的图像。不可见的物理图像,例如,温度、压力、高度等的分布图,在医学诊断中使用的以超声波、放射线手段成像得到的医学影像等,这类图像是将不可见的物理量通过可视化的手段转换成方便人眼识别的图像形式。物理图像的好坏,很大程度地依赖于物理信号检测设备的性能。以光学图像为例,光感应特性好的设备,可以得到效果好的图像,同时,光感应器件的适应范围(可以感知的*大、*小光强度的范围)不同,使用目的也不同。 虚拟图像是指采用数学的方法,将由概念形成的物体(不是实物)进行表示的图像。虚拟图像从想象中的物体到想象中的光照,再到想象中的摄像机等,都采用数学建模的方式,利用成像几何原理,在计算机上制作。虚拟图像的应用包括增强现实和虚拟现实两个方向。增强现实是在现实场景图像中,增加虚拟的物体。例如,很多电影中合成的灾难场面、历史场面等,在提升电影感染力方面发挥了很好的作用。虚拟现实则全部是虚拟的景物,例如,虚拟手术、虚拟驾驶训练舱等,在提升参与者的操作能力方面发挥了很好的作用。 数字图像是用数字阵列表示的图像。数字阵列中的每个数字表示数字图像的一个*小单位,称为像素。通过对每个像素点的颜色或者亮度等进行数字化的描述,就可以得到在计算机上进行处理的数字图像。显然,数字图像可以是物理图像,也可以是虚拟图像。 1.1数字图像处理、计算机视觉、计算机图形学 与数字图像相关的研究领域,包括数字图像处理、计算机视觉、计算机图形学等。这三个研究领域所研究的内容有一定的交叉和覆盖,也有其不同的侧重点。 1.数字图像处理 数字图像处理可以通俗地理解为以下两个方面的操作。 1)从图像到图像的处理 从图像到图像的处理是对一幅效果不好的图像进行处理,获得效果好的图像。如图1.2所示,图1.2(a)是实际拍摄的大雾天气的一个场景,我们希望提高画面的清晰度,由此观察到场景中的景物细节。分析图像不清晰的原因,是因为空气中悬浮着许多微小的水颗粒,这些水颗粒在光线的散射下,在景物与镜头(或人眼)之间形成一个半透明层。如果通过适当的图像处理方法,消除或减弱这层遮挡视线的大雾层,就可以得到一幅清晰的图像,如图1.2(b)所示。这就是从图像到图像的处理。 ( a )( b ) 图1.2从图像到图像的处理示例 2)从图像到决策表达的一种表示 这类处理通常称为数字图像分析,是对一幅图像中的若干目标物进行识别分类后,给出其特性测度。例如,道路监控系统拍摄到一幅卡口图像,图像记录了道路上行驶的若干车辆,通过对图像的处理与分析,可以分检出车辆的数量、车辆的类型、车辆的车牌等信息。 这种从图像到非图像的表示,在许多图像分析中起着非常重要的作用。例如,对人体组织切片图像中的细胞分布进行自动识别与分析,给出病理分析报告就是计算机辅助诊断系统的一个重要应用。这类处理方法在图像检测、图像测量等领域有着非常广泛的应用。 2.计算机视觉 计算机视觉是指通过对采集的图像进行处理,实现对自然景物的理解。 计算机视觉为设备或机器人提供眼睛的功能。因此,计算机视觉的处理包括三维景物信息的识别与处理,对景物中所包含目标的内容及信息进行理解,*终得到一个决策。 如图1.3所示,在一个生产线上,机械手由三个装有吸盘的手爪构成,当需要机械手平稳地抓起工件时,就需要计算机视觉给出三个手爪可以抓到的*平稳的面。 3.计算机图形学 计算机图形学是指用计算机对由概念或者数学描述表示的虚构物体图像进行处理和显示的过程。 计算机图形学采用的方法是,利用成像几何对需要表示的虚构物体进行数学建模,并对光照、想象中的摄像机等进行数学建模,获得需要的场景。 图1.3工件示例 虽然数字图像处理、计算机视觉以及计算机图形学都有其相对独立的研究方法,但是,这三个领域的交叉覆盖面相对比较宽,在实际应用中,很多时候是三者的结合。本书的目的是介绍数字图像处理的基本方法,读者在实际应用中如果需要计算机视觉或者是计算机图形学方面的技术,请参考相关著作或参考文献。 1.2数字图像处理系统的结构 数字图像处理系统结构示意图如图1.4所示。摄像单元记录对象物反射的光强度,通过光电传感器转换成电信号,电信号在A/D转换单元转换成数字信号,存储在图像存储单元中,之后读入计算机,进行相关的处理并将处理结果进行显示。 图1.4数字图像处理系统结构示意图 实际上,*终形成的图像取决于光源、光源与对象物的位置关系,以及对象物的反射光强度等要素。光源包括各种人造光源以及白昼自然光,而光源与对象物的位置关系则大致可分为图1.5所示的背光光照、正面光照、斜射光照等情况。 (a) (b) (c) 图1.5光照模式 背光光照下,由于背景光的强度大于前景(对象物),如果拍摄人物图像,人脸的细节部分在图像中呈现的效果不是很好。但是,在某些工业自动化生产线上,为了快速获得目标物的定位,常常将光源设置为背光照明方式。 正面光照下,如果目标物有非常光滑的反射表面,如金属表面,并且其表面是凸面,则会在画面上产生高光区,高光区部分的颜色等细节会退化。但是对于一般的非特殊光滑表面的物体,正面照射可以获得反映目标物细节的图像。 斜射光照下,画面会产生光照不均的效果,如果要进行景物渲染,这是一种非常好的方法,但是当需要从画面提取相应目标物时,光照不均会严重影响正确获取目标物。 显然,在构造数字图像处理系统时,如果允许设置光源,需要综合考虑系统的功能目标来进行合理的设置。 1.3数字图像的基本概念 数字图像是指用数字阵列表示的图像,阵列中的每一个元素称为像素。像素是组成数字图像的基本元素,数字图像由有限个像素组成,构成数字图像的所有像素构成矩阵,矩阵大小表示像素数量。每英寸图像内的像素个数称为图像的分辨率,是由采样精度确定的;矩阵中像素值的分布范围,则是由量化精度确定的。 图像分辨率是面阵传感器采集图像的指标,例如,手机拍摄到一个大小为4032×3024的图像,其像素数为12192768,在购买具有这个分辨率的数码相机时,产品性能介绍上会给出1200万像素分辨率这一参数。 扫描分辨率是线阵传感器采集图像的指标,一台扫描仪输入图像的细微程度指每英寸扫描所得到的点,单位是dpi(dot per inch,每英寸点数)。扫描分辨率数值越大,被扫描的图像转化为数字化图像越逼真,扫描仪质量也越好。 量化是把采样点上表示亮暗信息的连续量离散化后,用数值来表示。一般的量化值为整数。图像的量化等级反映了量化的质量,例如,图像中每个像素都采用8位二进制数表示,则有28=256个量级;若采用16位二进制数表示,则有216=65536个量级;若采用24位二进制数表示,则有224≈1677万个量级。 1.3.1数字图像的数值描述 图像可以看成对三维客观世界的二维投影,因此一幅图像可以定义为一个二维函数f(x, y),其中,x, y是空间坐标,f(x, y)表示图像在该点的亮度或灰度,或简称为像素值。 因为矩阵是二维结构的数据,同时量化值取整数,因此,一幅数字图像可以用一个整数矩阵来表示。矩阵的元素位置(i, j)对应数字图像上一个像素点的位置。矩阵元素的值f(i, j)即对应像素点的像素值。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0