×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
计算机视觉与PYTORCH项目实战:基于深度学习框架的端到端产品级模型设计与开发

计算机视觉与PYTORCH项目实战:基于深度学习框架的端到端产品级模型设计与开发

1星价 ¥74.3 (7.5折)
2星价¥74.3 定价¥99.0
暂无评论
图文详情
  • ISBN:9787302657422
  • 装帧:80g胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:220
  • 出版时间:2024-04-01
  • 条形码:9787302657422 ; 978-7-302-65742-2

本书特色

如爱因斯坦所说:“提出问题往往比解决问题更重要。”李飞飞认为,关键问题的提出会推进计算机视觉,甚至整个AI领域的发展。 本书针对计算机视觉领域尤为重要的业务问题,结合实例,重点阐述了如何基于深度学习框架来设计和开发端到端的产品级商用视觉模型。 通过本书的阅读,读者将能够使用迁移学习和PyTorch来搭建产品级别的计算机视觉模型。 · 使用PyTorch来解决计算机视觉问题· 实现迁移学习和执行图像分类、对象检测、图像分割和其他计算机视觉应用· 面向现实世界中的行业问题设计和开发产品级计算机视觉项目· 解释计算机视觉模型并解决业务问题一本书,助力数据科学家、机器学习工程师以及Python软件工程师迅速掌握新技能

内容简介

《计算机视觉与PyTorch项目实战:基于深度学习框架的端到端产品级模型设计与开发》使用PyTorch 框架来讨论计算机视觉算法及其应用。首先介绍计算机视觉基础,主题涉及卷积神经网络、ResNet、YOLO、数据增强和业内使用的其他常规技术。随后简要概述PyTorch 库。接下来探究图像分类问题、对象检测技术以及如何在训练和运行推理的同时实现迁移学习。*后通过一个完整的建模过程来阐述深度学习框架PyTorch 是如何运用优化技巧和模型AI 可解释性的。 《计算机视觉与PyTorch项目实战:基于深度学习框架的端到端产品级模型设计与开发》适合具有一定基础的中高级读者阅读和参考,可以帮助他们使用迁移学习和PyTorch 来搭建产品级的计算机视觉模型。

目录

简明目录 第1章 计算机视觉的基础构成 第2章 图像分类 第3章 构建目标检测模型 第4章 构建图像分割模型 第5章 基于图像的搜索和推荐系统 第6章 姿态估计 第7章 图像异常检测 第8章 图像超分辨率 第9章 视频分析 第10章 计算机视觉的可解释AI 详细目录 第1章 计算机视觉的基本构成 001 1.1 什么是计算机视觉 002 1.1.1 应用 002 1.1.2 通道 005 1.1.3 卷积神经网络 007 1.1.4 了解CNN架构类型 014 1.1.5 掌握深度学习模型 021 1.1.6 PyTorch简介 024 1.2 小结 026 第2章 图像分类 027 2.1 本章所涵盖的主题 028 2.2 方法概述 028 2.3 创建图像分类流程 029 2.3.1 **个基本模型 030 2.3.2 数据 030 2.3.3 数据探索 032 2.3.4 数据加载器 033 2.3.5 定义模型 035 2.3.6 训练过程 040 2.3.7 基本模型的第二种变体 044 2.3.8 基本模型的第三种变体 046 2.3.9 基本模型的第四种变体 052 2.7 小结 053 第3章 构建目标检测模型 055 3.1 使用Boosted Cascade进行目标检测 056 3.2 R-CNN 058 3.2.1 区域候选网络 059 3.2.2 快速区域卷积神经网络 062 3.2.3 候选区域网络的工作原理 063 3.2.4 锚框生成层 064 3.2.5 候选区域层 065 3.3 Mask R-CNN 065 3.4 YOLO 066 3.5 YOLO V2/V3 068 3.6 项目代码片段 069 3.7 小结 082 第4章 构建图像分割模型 083 4.1 图像分割 084 4.2 PyTorch预训练支持 086 4.2.1 语义分割 086 4.2.2 实例分割 089 4.3 模型优化 090 4.4 小结 106 第5章 基于图的搜索和推荐系统 107 5.1 问题陈述 107 5.2 方法和方法论 108 5.3 实现 109 5.3.1 数据集 109 5.3.2 安装和导入库 110 5.3.3 导入和理解数据 111 5.3.4 特征工程 114 5.3.5 计算相似度和排名 121 5.3.6 可视化推荐结果 122 5.3.7 从用户处接收图输入并推荐相似产品 125 5.4 小结 128 第6章 姿态估计 129 6.1 自顶向下的方法 130 6.2 自底向上的方法 130 6.3 OpenPose 131 6.3.1 分支1 131 6.3.2 分支2 131 6.4 HRNet 133 6.5 Higher HRNet 135 6.6 PoseNet 136 6.6.1 PoseNet工作机制 136 6.6.2 PoseNet的优点和缺点 140 6.6.3 姿态估计的应用 140 6.6.4 在杂货店视频上进行的测试用例 140 6.7 实现 141 6.8 小结 148 第7章 图像异常检测 149 7.1 异常检测 149 7.2 方法1:使用预训练的分类模型 151 7.3 方法2:使用自编码器 165 7.4 小结 168 第8章 图像超分辨率 169 8.1 利用*近邻概念放大图像 170 8.2 理解双线性插值 171 8.3 变分自编码器 172 8.4 生成式对抗网络 176 8.5 模型代码 177 8.6 模型开发 177 8.7 运行应用程序 188 8.8 小结 190 第9章 视频分析 191 9.1 问题陈述 192 9.2 方法 194 9.3 实现 195 9.3.1 数据 196 9.3.2 把视频上传到Google Colab 197 9.3.3 将视频转换为一系列图像 197 9.3.4 图像提取 198 9.3.5 数据预处理 198 9.3.6 确定杂货店中的热点 200 9.3.7 导入图像 203 9.3.8 获取人群计数 203 9.3.9 安保与监控 205 9.3.10 确定人口统计学特征(年龄和性别) 208 9.4 小结 210 第10章 计算机视觉的可解释AI 211 10.1 Grad-CAM 212 10.2 Grad-CAM++ 213 10.3 NBDT 214 10.4 Grad-CAM和Grad-CAM++的实现 216 10.4.1 在单个图像上的Grad-CAM和Grad-CAM++实现 216 10.4.2 在单个图像上的NBDT实现 219 10.5 小结 221
展开全部

作者简介

阿克谢·库尔卡尼(Akshay Kulkarni),AI与机器学习(ML)布道师和思想领袖,为财富500强提供咨询服务,帮助客户推动AI和数字化战略转型。作为谷歌开发者,他经常受邀在机器学习和数据科学大会(包括Strata、O'Reilly的Conf和GIDS)发表演讲。他还是印度多个顶级研究生院的客座教授。2019年,他入选“印度40位40岁以下数据科学家”名单。业余时间,他喜欢阅读、写作、写代码以及为有抱负的数据科学工程师提供帮助。目前,他和自己的家人居住在印度班加罗尔。 阿达沙·希瓦南达(Adarsha Shivananda),数据科学和MLOps先行者,致力于创建世界级的MLOps能力以确保人工智能可以持续交付价值。他的使命是在组织内部和外部建立一个数据科学家人才库,通过培训来解决问题,他在这方面一直保持领先地位。他先后就职于制药、保健、包装消费、零售和营销领域。目前,他居住在印度班加罗尔,喜欢阅读和数据科学培训。 尼廷·奈杰·夏尔马(Nitin Ranjan Sharma),诺华制药产品经理,主要带领团队使用多模型技术来开发产品,此外也为财富500强公司提供咨询服务,使用机器学习和深度学习框架来帮助他们解决复杂的业务问题。他主要关注的领域和核心专长是计算机视觉,比如解决图像和视频数据的业务难题。在加入诺华制药之前,他的身份是Publicis Sapient、EY和TekSystems Global Services数据科学团队成员。他经常受邀在数据科学大会上发表演讲并喜欢培训和指导数据科学爱好者开展工作。此外,他还是一名非常活跃的开源贡献者。 欧拉,奉行知行合一,擅长于问题的引导和拆解。目前感兴趣的方向有机器学习、人工智能和商业分析。 贾莱姆·拉吉·罗希特(Jalem Raj Rohit),Episource公司的高级数据科学家,全面领导计算机视觉工作。他参与创办了Pydata德里和Pydata孟买等机器学习社群并以组织者和嘉宾的身份举办和参加了很多小型聚会与大型会议大会。 他写了两本书,录制了视频课程(Julia语言和无服务器项目)。他的兴趣领域包括计算机视觉、MLOps和分布式系统。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航