×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787302623762
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:264
  • 出版时间:2023-04-01
  • 条形码:9787302623762 ; 978-7-302-62376-2

本书特色

本书有以下特色: 1.覆盖全面,对于计算机视觉没有经验的读者也可以通过本书的学习掌握深度学习技术在典型计算机视觉技术领域的应用方法。 2.知行合一,重要的算法除了介绍算法原理和推导过程外,也配置了相应的实验。 3.学以致用,介绍了工业界视觉应用系统的搭建。带领读者动手搭建图像识别系统。 4.工业经验,借鉴百度先进的视觉系统经验,做到理论和实践相结合。 5.动手实操,本书配套实验会部署到在线深度学习运行平台AI-studio 。使用该平台读者可以非常方便的阅读、运行和修改代码,并且可以使用免费GPU资源训练模型介绍工业界视觉应用系统的搭建,带领读者搭建图像识别系统,借鉴百度先进的视觉系统经验,提供课件与代码介绍工业界视觉应用系统的搭建,带领读者搭建图像识别系统,借鉴百度先进的视觉系统经验,提供课件与代码

内容简介

本书在介绍深度学习、百度飞桨等相关知识的基础上,着重介绍了图像分类、目标检测、语义分割、人体关键点检测、图像生成、视频分类、图像文本检测和识别、图像识别等计算机视觉任务的实现原理及深度学习模型框架,并通过具体案例来详细介绍各任务的实现细节。 全书分为理论篇和实战篇。理论篇(第1~4章)梳理了计算机视觉技术的发展历程、主要任务、行业应用系统,同时简要介绍了深度学习开发框架、飞桨(PaddlePaddle)开发平台,以及深度学习的基础知识与网络模型架构。实战篇(第5~12章)结合计算机视觉的各个任务要求与技术发展,对其中经典的深度学习算法模型进行介绍。全书提供了实例代码,详解了在飞桨开发框架下各任务的模型实现过程。 本书适合作为高等院校人工智能、计算机视觉专业高年级本科生、研究生的教材,同时可作为计算机视觉相关任务实践教程,也可以作为科研工作者的参考书籍。

目录

理论篇


第1章计算机视觉概述


1.1计算机视觉技术的发展


1.2计算机视觉任务概述


1.2.1计算机视觉经典任务


1.2.2计算机视觉常见任务


1.3计算机视觉处理应用系统


1.3.1计算机视觉行业产业链


1.3.2计算机视觉行业应用系统


1.4计算机视觉处理常用工具


1.4.1OpenCV简介


1.4.2OpenCVPython


1.4.3OpenCV的基础模块


1.4.4其他CV常用工具


1.5本章小结


参考文献


第2章深度学习开发框架


2.1常见的深度学习开发框架


2.1.1TensorFlow深度学习开发框架


2.1.2PyTorch深度学习开发框架


2.1.3PaddlePaddle深度学习开发框架


2.2飞桨基础


2.2.1开发环境


2.2.2开发套件


2.2.3工具组件


2.2.4开发平台


2.3本章小结


参考文献







第3章深度学习算法基础


3.1机器学习


3.2神经网络的基本组成


3.2.1神经元


3.2.2神经网络的结构


3.3神经网络的计算


3.3.1激活函数


3.3.2正向传播


3.3.3反向传播


3.3.4优化算法


3.4卷积神经网络的基本组成


3.4.1卷积层


3.4.2池化层


3.4.3ReLU激活函数


3.4.4全连接层


3.5深度学习模型的训练技巧


3.5.1归一化


3.5.2丢弃法


3.5.3权重衰减


3.5.4参数初始化


3.6本章小结


参考文献


第4章深度学习网络模型


4.1深度学习网络架构


4.2代表性的网络模型


4.2.1卷积神经网络模型


4.2.2循环神经网络模型


4.2.3Transformer网络模型


4.2.4复杂MLP网络模型


4.3网络搭建案例


4.3.1环境准备


4.3.2数据准备


4.3.3模型构建


4.3.4模型训练与验证


4.3.5模型可视化


4.4本章小结


参考文献


实战篇


第5章图像分类算法原理与实战


5.1图像分类任务的基本介绍


5.1.1图像分类技术的发展


5.1.2图像分类的评价指标


5.2基于残差的网络


5.2.1ResNet模型


5.2.2DenseNet模型


5.2.3DPN模型


5.3基于Transformer的网络


5.3.1ViT模型


5.3.2SwinTransformer模型


5.4轻量化的网络


5.4.1MobileNet模型


5.4.2PPLCNet模型


5.5飞桨实现图像分类案例


5.5.1环境安装与配置


5.5.2数据准备


5.5.3模型构建


5.5.4模型训练


5.5.5模型预测


5.6本章小结


参考文献


第6章目标检测算法原理与实战


6.1目标检测任务基本介绍


6.1.1目标检测技术的发展


6.1.2目标检测的评价指标


6.2Faster RCNN基本解析


6.2.1RCNN系列


6.2.2Faster RCNN整体架构


6.2.3Faster RCNN主要特点


6.3SSD基本解析


6.3.1SSD基本架构


6.3.2SSD主要特点


6.4YOLOv3基本解析


6.4.1YOLO系列


6.4.2YOLOv3主要特点


6.5FCOS基本解析


6.5.1FCOS基本架构


6.5.2FCOS主要特点


6.5.3损失函数的设计


6.5.4FCOS的优缺点


6.6DETR基本解析


6.6.1DETR基本结构


6.6.2DETR主要特点


6.7飞桨实现目标检测案例


6.7.1环境准备


6.7.2数据读取与增强


6.7.3模型构建


6.7.4模型训练


6.7.5模型测试与可视化


6.8本章小结


参考文献


第7章语义分割算法原理与实战


7.1语义分割任务的基本介绍


7.1.1语义分割的发展


7.1.2语义分割的评价指标


7.2深度学习语义分割基础网络


7.2.1FCN模型


7.2.2SegNet模型


7.2.3UNet模型


7.3语义分割网络的系列改进


7.3.1空洞可分离卷积: DeepLabv3+


7.3.2低层细节信息保留: RefineNet


7.3.3全局语义特征聚合: OCRNet


7.4飞桨实现语义分割案例


7.4.1环境准备


7.4.2数据准备与预处理


7.4.3模型构建


7.4.4模型训练


7.4.5模型验证与评估


7.5本章小结


参考文献


第8章人体关键点检测原理与实战


8.1人体关键点检测任务的基本介绍


8.1.1人体关键点检测的发展


8.1.2人体关键点检测的评价指标


8.2人体关键点检测的经典方法


8.2.1模板匹配


8.2.2贝叶斯估计


8.3多尺度人体姿态检测方法


8.3.1Hourglass模型架构


8.3.2一阶Hourglass模块


8.3.3多阶Hourglass网络


8.4高分辨率人体姿态估计方法


8.4.1HRNet模型


8.4.2HigherHRNet 模型


8.5人体姿态识别OpenPose


8.5.1卷积姿态机CPM


8.5.2OpenPose架构


8.6飞桨实现人体关键点检测案例


8.6.1环境准备


8.6.2数据集准备


8.6.3模块导入


8.6.4数据集定义


8.6.5模型构建


8.6.6损失函数定义


8.6.7模型训练


8.6.8模型预测


8.7本章小结


参考文献


第9章图像生成算法原理与实战


9.1图像生成任务的基本介绍


9.1.1图像生成应用与发展


9.1.2图像生成的评价指标


9.2基于图像生成的图像转换: Pix2Pix


9.3基于图像生成的风格迁移: CycleGAN


9.3.1CycleGAN的网络结构


9.3.2CycleGAN的循环训练流程


9.4基于图像生成算法的图像属性控制: StyleGAN


9.4.1StyleGANv1的网络结构与训练技巧


9.4.2StyleGANv1对隐空间耦合度的量化


9.4.3StyleGANv2的改进


9.5飞桨实现图像生成案例


9.5.1环境准备


9.5.2数据读取与预处理


9.5.3模型构建


9.5.4模型训练


9.5.5模型验证与评估


9.5.6模型测试


9.6本章小结


参考文献


第10章视频分类原理与实战


10.1视频分类任务的基本介绍


10.1.1视频分类的应用与发展


10.1.2视频分类任务的评价指标


10.2基于时序划分的双流网络


10.2.1TSN模型


10.2.2SlowFast模型


10.3基于时序移位的类3D网络: TSM


10.3.1类3D思想


10.3.2网络设计


10.4基于自注意力机制的网络


10.4.1Nonlocal模型


10.4.2TimeSformer模型


10.5飞桨实现视频分类案例


10.5.1环境准备


10.5.2数据读取与预处理


10.5.3模型构建


10.5.4模型训练


10.5.5模型验证与评估


10.5.6模型测试


10.6本章小结


参考文献


第11章图像文本检测和识别原理与实战


11.1图像文本检测和识别任务的基本介绍


11.1.1OCR任务的应用与发展


11.1.2OCR任务的评价指标


11.2文本检测算法


11.2.1小尺度文本检测算法: CTPN


11.2.2场景文本检测算法: EAST


11.2.3任意形状文本检测器: SAST


11.2.4二值化检测模型: DBNet


11.3文本识别算法


11.3.1基于卷积循环神经网络的识别模型: CRNN


11.3.2基于空间注意力残差网络的识别模型: STARNet


11.3.3具有自动校正功能的鲁棒识别模型: RARE


11.3.4基于语义推理网络的识别模型: SRN


11.4端到端ORC方法


11.4.1FOTS模型


11.4.2PGNet模型


11.5飞桨实现OCR案例


11.5.1环境准备


11.5.2数据读取与预处理


11.5.3模型构建


11.5.4CTC Loss


11.5.5训练配置


11.5.6模型训练


11.5.7验证前准备


11.5.8开始验证


11.6本章小结


参考文献


第12章图像识别原理与实战


12.1图像识别系统任务流程基本概述


12.1.1图像识别任务基本介绍


12.1.2百度飞桨图像识别系统简介


12.2目标检测模块


12.3特征学习模块


12.3.1度量学习算法原理及主要内容


12.3.2深度度量学习常见算法框架


12.3.3百度飞桨中深度度量学习应用


12.4特征检索系统


12.4.1特征检索系统介绍


12.4.2特征检索原理介绍


12.5飞桨实现图像识别应用案例


12.5.1环境配置


12.5.2已知类别的图像识别


12.5.3商品识别与检索


12.5.4基于新的索引库的图像识别


12.6本章小结


参考文献



展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航