×
视觉:对人类如何表示和处理视觉信息的计算研究

视觉:对人类如何表示和处理视觉信息的计算研究

1星价 ¥77.4 (6.5折)
2星价¥77.4 定价¥119.0
暂无评论
图文详情
  • ISBN:9787121423703
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:340
  • 出版时间:2022-01-01
  • 条形码:9787121423703 ; 978-7-121-42370-3

本书特色

适读人群 :本书可供心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、 研究生及高年级本科生等学习使用或作为研究参考。√影响一代脑、认知、计算机视觉专家的经典著作 √详细阐述Marr提出的用于研究和理解视觉感知的一般框架 √厘清计算理论、算法、实现三个研究层次 √掌握本书介绍的视觉计算理论,对在人工智能和计算机视觉领域内开展进一步探索至关重要 √吴佳俊教授倾情翻译

内容简介

本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学、视觉神经科学和心理物理学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,掌握本书介绍的视觉计算理论,对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。

目录

第Ⅰ部分 引言和哲学基础

第1章 哲学原理和方法 7

1.1 背景知识 7

1.2 理解复杂的信息处理系统 16

表示和描述 16

处理 17

信息处理的三个层次 19

计算理论的重要性 21

J. J. Gibson 的方法 22

1.3 视觉的表示框架 24

第Ⅱ部分 视觉

第2章 图像的表示 33

2.1 早期视觉的物理背景 33

图像的表示 35

基本物理假设 35

图像表示的一般性质 40

2.2 过零点和原初草图 42

过零点 42

生物学的意义 48

原初草图 54

哲学私语 59

2.3 图像的空间排布 62

2.4 光源和透明度 68

其他光源效果 70

透明 70

结论 71

2.5 聚合过程和全初草图 71

主要论点 75

纹理辨别的计算方法及其心理物理学意义 76

第3章 从图像到表面 78

3.1 人类视觉处理的模块化组织 78

3.2 图像的处理、约束和可用表示 81

3.3 立体视觉 87

测量立体视差 87

从视差中计算距离和表面朝向 121

3.4 方向选择性 124

视觉运动引言 124

利用方向选择性来分离独立运动的表面 136

渐进 141

3.5 似动 141

为什么要研究似动 142

把问题一分为二 143

对应问题 146

从运动中恢复结构 158

光流 164

3.6 形状轮廓 166

一些例子 167

遮挡轮廓 168

表面朝向的不连续 173

表面轮廓 175

3.7 表面纹理 180

分离纹理元素 180

小结 184

3.8 明暗和光度立体视觉 184

梯度空间 185

表面光照、表面反射和图像强度 188

反射率图 189

从明暗中恢复形状 191

光度立体视觉 192

3.9 明度、亮度和色彩 194

Helson-Judd 方法 195

关于亮度和色彩的视网膜—皮层理论 196

同时对比的重要性的物理依据 200

对强度非线性变化的表层起源的假设 202

测量三色图像的意义 203

本方法小结 204

3.10 本章小结 205

第4章 可见表面的直接表示 208

4.1 引言 208

4.2 图像分割 209

4.3 对问题的重新建模 211

4.4 需要表示的信息 213

4.5 2.5 维草图的一般形式 215

4.6 表示的可能形式 216

4.7 可能的坐标系 220

4.8 插值、延续性和不连续性 221

4.9 插值问题的计算 224

不连续 224

插值方法 226

4.10 其他内部计算 228

第5章 用于识别的形状表示 230

5.1 引言 230

5.2 形状表示引起的问题 231

评判形状表示的有效性的标准 232

形状表示的设计选择 233

5.3 三维模型表示 235

自然坐标系 236

基于坐标轴的描述 236

三维模型表示的模块化组织 237

三维模型的坐标系 239

5.4 自然推广 241

5.5 推导和使用三维模型表示 244

三维模型描述的推导 244

以观察者为中心的坐标系和以物体为中心的坐标系的关系 247

三维模型的索引和目录 247

推导和识别的交互 250

5.6 心理学的考量 253

第6章 总结 256

第Ⅲ部分 尾声

第7章 对计算方法的辩护 261

7.1 引言 261

7.2 一段对话 261

原书第2版后记Marr的《视觉》和计算神经科学 284

中文版后记从Marr的《视觉》到人类智能问题 288

术语表 292

参考文献 298

展开全部

作者简介

作者:David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。 译者:吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航