- ISBN:9787111690344
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:236
- 出版时间:2021-09-01
- 条形码:9787111690344 ; 978-7-111-69034-4
本书特色
适读人群 :所有从事人工智能技术,尤其是图像识别技术的读者。(1)作者背景深厚:两位作者是AI和计算机视觉方面的专家,在阿里、腾讯、百度等企业有超过10年的相关工作经验; (2)内容结构讲究:针对初学者需求精心安排,从预备知识、深度学习基础,到目标检测算法和工程案例,由浅入深,理论与实践结合; (3)内容通俗易懂:语言通俗,逻辑性强;尽量绕开复杂的数学公式推导,无需数学基础,降低读者的阅读门槛; (4)丰富实战案例:内容遵循知识点背景介绍→原理讲解→案例分析的思路,提供大量案例; (5)提供源码下载:第2~11章均提供源数据和完整代码,代码均经过严格测试,可直接在Github上下载。
内容简介
内容简介 这是一本从工具、原理、算法3个维度指导读者零基础快速掌握目标检测技术及其应用的入门书。 两位作者是资深的AI技术专家和计算机视觉算法专家,在阿里、腾讯、百度、三星等大企业从事计算机视觉相关的工作多年,不仅理论功底扎实、实践经验丰富,而且知道初学者进入计算机视觉领域的痛点和难点。据此,两位作者编写了这本针对目标检测初学者的入门书,希望从知识体系和工程实践的角度帮助读者少走弯路。 第1~2章是目标检测的准备工作,主要介绍了目标检测的常识、深度学习框架的选型、开发环境的搭建以及数据处理工具的使用。 第3~5章是目标检测的技术基础,主要讲解了数据预处理和卷积神经网络等图像分类技术的基础知识。 第6章比较详细地介绍了香港中文大学的开源算法库mmdetection。 第7~10章详细地讲解了目标检测的概念、原理、一阶段算法、二阶段算法以及提升算法性能的常用方法。 第11章简单介绍了目标检测的相关案例(以工业为背景),以帮助读者构建一个更完整的知识体系。
目录
第1章 目标检测概述 1
1.1 什么是目标检测 1
1.2 典型的应用场景 2
1.2.1 人脸识别 2
1.2.2 智慧交通 2
1.2.3 工业检测 3
1.3 目标检测技术发展简史 3
1.3.1 传统算法 4
1.3.2 深度学习算法 5
1.4 目标检测领域重要的公开评测集 8
1.5 本章小结 11
第2章 目标检测前置技术 12
2.1 深度学习框架 12
2.1.1 Theano 12
2.1.2 TensorFlow 13
2.1.3 MXNet 14
2.1.4 Keras 15
2.1.5 PyTorch 15
2.1.6 Caffe 16
2.2 搭建开发环境 17
2.2.1 Anaconda 17
2.2.2 Conda 19
2.2.3 PyTorch的下载与安装 21
2.3 NumPy使用详解 22
2.3.1 创建数组 22
2.3.2 创建NumPy数组 24
2.3.3 获取NumPy属性 27
2.3.4 NumPy数组索引 28
2.3.5 切片 28
2.3.6 NumPy中的矩阵运算 29
2.3.7 数据类型转换 31
2.3.8 NumPy的统计计算方法 31
2.3.9 NumPy中的arg运算 32
2.3.10 FancyIndexing 33
2.3.11 NumPy数组比较 33
2.4 本章小结 35
第3章 卷积神经网络 36
3.1 卷积神经网络基础 36
3.1.1 全连接层 36
3.1.2 卷积层 37
3.1.3 池化层 42
3.1.4 三维数据的卷积运算 44
3.1.5 批规范化层 45
3.1.6 Dropout层 47
3.2 本章小结 48
第4章 数据预处理 49
4.1 数据增强 49
4.1.1 resize操作 50
4.1.2 crop操作 51
4.1.3 随机的水平和竖直翻转 52
4.1.4 随机角度的旋转 53
4.1.5 亮度、对比度和颜色的随机变化 54
4.1.6 彩色图转灰度图 55
4.2 数据的探索—Kaggle猫狗大战 56
4.3 本章小结 64
第5章 常见卷积神经网络结构 65
5.1 LeNet神经网络 65
5.2 AlexNet神经网络 70
5.3 VGGNet神经网络 77
5.4 GoogLeNet神经网络 81
5.4.1 inception模块 83
5.4.2 GoogLeNet的实现 85
5.4.3 GoogLeNet的演变 88
5.5 ResNet 89
5.5.1 残差模块 90
5.5.2 ResNet模型 92
5.6 DenseNet 92
5.7 其他网络结构 95
5.8 实战案例 96
5.9 计算图像数据集的RGB均值和方差 98
5.10 本章小结 99
第6章 mmdetection工具包介绍 100
6.1 mmdetection概要 100
6.2 mmdetection支持的检测框架和算法实现 101
6.3 搭建mmdetection开发环境 102
6.4 使用入门 103
6.4.1 使用预训练模型进行推理 103
6.4.2 训练模型 105
6.4.3 有用的工具 106
6.4.4 如何使用mmdetection 108
6.5 标注图像 110
6.6 实战案例 112
6.6.1 检测人体 113
6.6.2 检测猫和狗 115
6.7 本章小结 120
第7章 目标检测的基本概念 121
7.1 概念详解 121
7.1.1 IoU计算 122
7.1.2 NMS操作 122
7.1.3 感受野 124
7.1.4 空洞卷积 128
7.1.5 评价指标mAP 129
7.2 本章小结 131
第8章 两阶段检测方法 132
8.1 R-CNN算法 132
8.1.1 生成候选区域 132
8.1.2 类别判定 133
8.1.3 位置修正 136
8.1.4 检测过程 137
8.1.5 R-CNN算法的重要意义 138
8.2 SPP-Net算法 139
8.2.1 空间金字塔采样 139
8.2.2 网络训练 141
8.2.3 测试过程 142
8.3 Fast R-CNN算法及训练过程 143
8.3.1 ROI池化层 144
8.3.2 模型训练 144
8.3.3 测试过程 147
8.4 Faster R-CNN算法及训练过程 147
8.4.1 候选框提取网络 148
8.4.2 RPN和Fast R-CNN共享特征的方法 152
8.5 Faster R-CNN代码解析 153
8.5.1 代码整体结构 153
8.5.2 数据加载 158
8.5.3 构建主干网络 160
8.5.4 候选框提取网络 161
8.5.5 对候选框进行分类和位置校正 163
8.5.6 算法模型架构图 165
8.6 本章小结 165
第9章 检测算法的进一步改进 167
9.1 特征金字塔 167
9.1.1 特征金字塔结构 167
9.1.2 FPN代码解析 170
9.2 焦点损失函数 174
9.3 本章小结 175
第10章 一阶段检测算法 176
10.1 YOLO算法 176
10.1.1 YOLO**版 176
10.1.2 YOLO第二版 182
10.1.3 YOLO第三版 185
10.2 SSD算法 196
10.2.1 SSD算法原理 197
10.2.2 训练方法 197
10.2.3 SSD代码解析 201
10.3 FCOS算法 208
10.3.1 FCOS算法原理 208
10.3.2 FCOS源码解析 213
10.4 本章小结 217
第11章 工业AI的发展 218
11.1 工业AI的概念和互联网 218
11.2 工业AI落地应用 219
11.2.1 工业AI的典型场景 220
11.2.2 工业AI落地背后的本质 221
11.2.3 展望 221
11.3 工业生产
作者简介
作者简介 涂铭 ? 资深数据架构师和人工智能技术专家,现就职于腾讯,曾就职于阿里。对大数据、自然语言处理、图像识别、Python、Java等相关技术有深入的研究,积累了丰富的实践经验。 ? 在工业领域曾参与了燃煤优化、设备故障诊断以及正泰光伏电池片和组件EL图像检测项目;在自然语言处理方面,曾担任导购机器人项目的架构师,主导开发机器人的语义理解、短文本相似度匹配、上下文理解,以及通过自然语言检索产品库,在项目中构建了NoSQL+文本检索等大数据架构,同时负责问答对的整理和商品属性的提取,带领NLP团队构建了语义解析层。 ? 合著有畅销书《Python自然语言处理实战:核心技术与算法》《深度学习与图像识别:原理与实践》《会话式AI:自然语言处理与人机交互》。 ? 金智勇 ? 计算机视觉算法专家,在计算机视觉领域深耕12年。现就职于百度,曾就职于阿里和三星等知名高新技术企业。业务领域涵盖增强现实、人脸识别、图像美化、智能交通、工业质检等多个方向,具有丰富的算法研究与落地经验。
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0