视觉:对人类如何表示和处理视觉信息的计算研究(博文视点出品)

视觉:对人类如何表示和处理视觉信息的计算研究(博文视点出品)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

√影响一代脑、认知、计算机视觉专家的经典著作√详细阐述Marr提出的用于研究和理解视觉感知的一般框架√厘清计算理论、算法、实现三个研究层次√掌握本书介绍的视觉计算理论,对在人工智能和计算机视觉领域内开展进一步探索至关重要√吴佳俊教授倾情翻译

内容简介

本书研究了人类对视觉信息的表示和处理,并对视觉计算处理过程提出了全面的计算理论。全书立足于计算机科学、视觉神经科学和心理物理学的进展,是跨学科交叉研究的经典教科书,并对多个学科的研究都有深刻启发作用。特别值得一提的是,在近年深度学习的热潮之中,掌握本书介绍的视觉计算理论,对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。

作者简介

作者:David Courtnay Marr是计算神经科学领域的创始人之一,曾任麻省理工学院心理学教授。Shimon Ullman是位于以色列雷霍沃特的魏茨曼科学研究所的计算机科学Samy和Ruth Cohn讲席教授。Tomaso Poggio是麻省理工学院脑和认知科学系的Eugene McDermott讲席教授。Ullman和Poggio都曾在麻省理工学院与David Marr共事。


译者:吴佳俊,斯坦福大学计算机科学系助理教授,研究方向是计算机视觉、机器学习和计算认知科学。 加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。 他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。

章节目录

 

第Ⅰ部分 引言和哲学基础

第1章 哲学原理和方法 7

1.1 背景知识 7

1.2 理解复杂的信息处理系统 16

表示和描述 16

处理 17

信息处理的三个层次 19

计算理论的重要性 21

J. J. Gibson 的方法 22

1.3 视觉的表示框架 24

第Ⅱ部分 视觉

第2章 图像的表示 33

2.1 早期视觉的物理背景 33

图像的表示 35

基本物理假设 35

图像表示的一般性质 40

2.2 过零点和原初草图 42

过零点 42

生物学的意义 48

原初草图 54

哲学私语 59

2.3 图像的空间排布 62

2.4 光源和透明度 68

其他光源效果 70

透明 70

结论 71

2.5 聚合过程和全初草图 71

主要论点 75

纹理辨别的计算方法及其心理物理学意义 76

第3章 从图像到表面 78

3.1 人类视觉处理的模块化组织 78

3.2 图像的处理、约束和可用表示 81

3.3 立体视觉 87

测量立体视差 87

从视差中计算距离和表面朝向 121

3.4 方向选择性 124

视觉运动引言 124

利用方向选择性来分离独立运动的表面 136

渐进 141

3.5 似动 141

为什么要研究似动 142

把问题一分为二 143

对应问题 146

从运动中恢复结构 158

光流 164

3.6 形状轮廓 166

一些例子 167

遮挡轮廓 168

表面朝向的不连续 173

表面轮廓 175

3.7 表面纹理 180

分离纹理元素 180

小结 184

3.8 明暗和光度立体视觉 184

梯度空间 185

表面光照、表面反射和图像强度 188

反射率图 189

从明暗中恢复形状 191

光度立体视觉 192

3.9 明度、亮度和色彩 194

Helson-Judd 方法 195

关于亮度和色彩的视网膜—皮层理论 196

同时对比的重要性的物理依据 200

对强度非线性变化的表层起源的假设 202

测量三色图像的意义 203

本方法小结 204

3.10 本章小结 205

第4章 可见表面的直接表示 208

4.1 引言 208

4.2 图像分割 209

4.3 对问题的重新建模 211

4.4 需要表示的信息 213

4.5 2.5 维草图的一般形式 215

4.6 表示的可能形式 216

4.7 可能的坐标系 220

4.8 插值、延续性和不连续性 221

4.9 插值问题的计算 224

不连续 224

插值方法 226

4.10 其他内部计算 228

第5章 用于识别的形状表示 230

5.1 引言 230

5.2 形状表示引起的问题 231

评判形状表示的有效性的标准 232

形状表示的设计选择 233

5.3 三维模型表示 235

自然坐标系 236

基于坐标轴的描述 236

三维模型表示的模块化组织 237

三维模型的坐标系 239

5.4 自然推广 241

5.5 推导和使用三维模型表示 244

三维模型描述的推导 244

以观察者为中心的坐标系和以物体为中心的坐标系的关系 247

三维模型的索引和目录 247

推导和识别的交互 250

5.6 心理学的考量 253

第6章 总结 256

第Ⅲ部分 尾声

第7章 对计算方法的辩护 261

7.1 引言 261

7.2 一段对话 261

原书第2版后记Marr的《视觉》和计算神经科学 284

中文版后记从Marr的《视觉》到人类智能问题 288

术语表 292

参考文献 298

视觉:对人类如何表示和处理视觉信息的计算研究(博文视点出品)是2022年由电子工业出版社出版,作者[美]David Marr。

得书感谢您对《视觉:对人类如何表示和处理视觉信息的计算研究(博文视点出品)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
基于单目视觉的智能汽车行人检测技术研究 电子书
基于单目视觉的行人检测是城市交通环境下智能汽车辅助导航技术中的一项关键技术,也是目前计算机应用领域的研究热点之一。本书以作者在智能汽车领域的研究成果为基础,重点讨论了基于树形Adaboost算法和Haar-like特征的行人候选区域分割算法;基于mean-shift方法的多尺度检测融合算法;基于改进Shapelet特征的行人识别算法;基于子结构的部位集成检测器设计方法,该算法主要针对复杂场景下行人
计算机信息处理案例教程(Windows 7+Office 2010) 电子书
本书主要讲述了Windows7操作系统、Office2010常用办公软件和计算机网络的应用。具体内容包括计算机基本知识、Windows7软件应用、Word2010软件应用、Excel2010电子表格、PowerPoint2010演示文稿、计算机网络应用。本教材的主要特点是“教、学、做”融为一体,强化学生计算机基本操作技能的培养。
电商视觉营销(微课版 第2版) 电子书
随着互联网的快速发展,购物方式逐渐多元化,商家在购物平台上的竞争日趋激烈,而极具吸引力的视觉营销内容可以引起用户的关注,帮助商家获得更多竞争优势。本书主要讲解电商视觉营销的相关知识,先介绍视觉营销基础、电商视觉营销的布局和商品图片的处理,然后依次从店铺首页的视觉营销设计、专题页和活动页的视觉营销设计、商品详情页的视觉营销设计、广告图的视觉营销设计、移动端店铺的视觉营销设计、短视频的视觉营销设计等方
视觉营销与运营实战从入门到精通 电子书
《视觉营销与运营实战从入门到精通》结合典型案例,深刻、系统地剖析了视觉营销与运营的思维和策略,是一本介绍视觉营销与运营的实战手册。《视觉营销与运营实战从入门到精通》内容主要分为四个部分。第一,讲解视觉营销的基础知识。第二,介绍视觉营销的具体实战方法:通过10个品牌视觉塑造窍门,抢占客户心智;通过11种店铺视觉优化方法,助力皇冠店铺;通过16种产品视觉设计方法,打造爆款产品;通过10种文案视觉呈现技
视觉之外:全链路UI设计思维的培养与提升 电子书
本书可以带领设计师快速了解与产品、交互、视觉、编程和数据分析相关的内容。