- ISBN:9787121494659
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:228
- 出版时间:2025-02-01
- 条形码:9787121494659 ; 978-7-121-49465-9
本书特色
适读人群 :理工科专业学生,科研人员,人工智能爱好者
一线专家撰写:技术功底深厚,复盘从0开始的计算机视觉科研思路,启迪思考
关注技术落地应用:从1到N,结合实际案例分析产品化过程,助力初学者成长
人文与科学融合:探讨科学家精神,赋予技术人文温度
内容简介
本书生动地讲述了底层视觉的发展历史,总结了人工智能前沿的*新成果,揭示了高清大片背后的科学奥秘,展现了实事求是和永无止境的科学家精神。本书*大的特色是运用散文化的语言讲述深奥的学术知识,深入浅出、活泼真实,同时附有作者的科研感悟和心路历程,富有启发性。本书适合理工科专业的大学生和研究生、科研人员,以及人工智能爱好者阅读。
前言
本书缘起
我本来想写一本介绍底层视觉前沿技术的教材,但后来发现它注定会成为一本历史书。既然如此,干脆就写一本历史书,让技术成为媒介,将那段波澜壮阔的历史,补充以我的个人经验,呈现给大家。这也是将本书命名为《底层视觉之美:高清大片背后的人工智能》的原因。过去十年来,我对底层视觉感触颇深。在底层视觉里,技术的背后有着对艺术的追求,艺术的背后又有着科学的力量,而科学注定与哲学相互交织,这就是本书想表达的底层视觉之美,一种在智能时代才有的全新美学。这本书适合所有领域的读者,希望所有对底层视觉感兴趣的人,都能徜徉其中,没有障碍地阅读。接下来,我会分几个方面介绍写这本书的写作动机,以及这本书独特的呈现方式。
底层视觉需要一本专业性的技术书
目录
**部分:科学之美
第1章 人工智能是什么 2
1.1 人工智能是可以解决复杂问题的算法 3
1.2 人工智能可以实现复杂的目标 4
1.3 人工智能具备从数据中学习的能力 5
1.4 人工智能要与人类主观意识互通 6
第2章 底层视觉是什么 9
2.1 底层视觉与计算机视觉 10
2.2 底层视觉与人工智能 11
2.3 底层视觉与图像处理 12
第3章 从0到1,从来都不简单 17
3.1 图像超分辨率的发展历程 17
3.2 SRCNN的诞生 23
3.3 解构SRCNN 26
第4章 从1到N的发展规律 34
4.1 传统算法奋起直追 35
4.2 传统算法与深度学习算法协同发展 36
4.3 深度学习算法持续进化 38
4.4 深度学习算法脱颖而出 39
4.5 越来越大的网络 40
4.6 越来越小的网络 46
4.7 深度学习算法快速发展的原因 48
第5章 从算法到产品:为落地而战 59
5.1 寻找趁手的锤子 60
5.2 小心棘手的钉子 61
5.3 千锤百炼终得正果 63
第6章 无中生有的真相与假象:论生成式图像复原 75
6.1 什么是生成式复原 77
6.2 生成式复原是如何诞生的 77
6.3 生成式模型和判别式模型有什么区别 78
6.4 生成对抗网络的原理和局限是什么 80
6.5 扩散模型的原理和局限是什么 81
6.6 扩散模型真的比生成对抗网络好吗 85
6.7 生成式复原的经典模型 86
第7章 时空的交错与融合:论视频超分辨率 98
7.1 多帧图像超分与时空超分 98
7.2 基于深度学习的视频超分 103
7.3 Transformer有何不同 108
7.4 生成模型带来了哪些变化 111
第8章 深度学习中的科学之光:底层视觉可解释性 120
8.1 模型的效果为什么好 121
8.2 从相关关系到因果关系 124
8.3 模型内部究竟学到了什么 129
8.4 网络是如何学习多任务的 132
8.5 底层视觉的泛化性问题 135
8.6 做个泛化性指标吧 138
8.7 可解释性还可以怎么用 140
第9章 通往终极智能之路:论通用底层视觉 149
9.1 通用何以智能 149
9.2 通用底层视觉是什么 152
9.3 通用的图像超分算法 153
9.4 通用的图像复原算法 157
9.5 通用的底层视觉算法 162
第二部分:人格之美
第10章 如何写一篇自己喜欢的论文 176
第11章 XPixel的团队文化:奉献、专注、平衡 180
11.1 奉献 180
11.2 专注 181
11.3 平衡 181
第12章 XPixel的科研地图:XPixel Metaverse 183
第13章 不朽的科学家精神:读爱因斯坦 186
13.1 探索未知 187
13.2 实事求是 188
13.3 永无止境 189
第14章 研究员的一天 191
第15章 中华智慧解读“钝感力” 195
15.1 技巧:太极圆转 195
15.2 智慧:难得糊涂 196
15.3 爱:包容宽恕 197
第16章 打破束缚 198
第17章 放松点儿,我的朋友 203
参考文献 209
相关资料
这是一本有深度、有力度、更有温度的专业书,也是科学、艺术与人文相结合的典范,书中所体现的科学家精神在当今时代尤为珍贵,值得年轻的同学们学习。深圳理工大学校长,樊建平 董超教授的新书读来饶有趣味,以亲历者的视角将底层视觉在深度学习和生成式人工智能时代的进展与创新娓娓道来,不求全,但兼具对技术与人文之美的追求,也兼顾技术落地与研究的平衡。这种坦诚的分享有益于年轻科研人员的成长。上海人工智能实验室主任,周伯文
作者简介
董超,博士生导师,中国科学院深圳先进技术研究院研究员,深圳理工大学教授,上海人工智能实验室双聘领军科学家。主要研究方向为底层计算机视觉,包括图像超分辨率、去噪和增强等,发表相关论文100余篇,截至2024年底,谷歌学术引用量超过40000次。2014年,提出深度超分辨率算法SRCNN,首次将深度学习引入图像超分辨率领域。2017年至今,多次带队参加国际图像超分辨率比赛,共获得9项冠军。2016—2018年就职于商汤科技,带领商汤超分团队开发了世界首款基于深度学习的数码变焦软件,并成功落地在vivo X23手机上。2021年,被斯坦福大学评选为世界前2%**科学家。2022年被清华大学评为AI2000人工智能全球*具影力学者。2023年,获得上海市技术发明奖一等奖。
胡锦帆,中国科学院深圳先进技术研究院2022级博士生,XPixel团队成员,师从董超研究员。于2019年和2022年在电子科技大学取得本科和硕士学位。研究方向为底层计算机视觉,同时致力于探索该领域的可解释性问题。
-
莫言的奇奇怪怪故事集
¥19.0¥59.9 -
悉达多
¥13.0¥28.0 -
中国近代史
¥13.7¥39.8 -
死魂灵
¥14.0¥48.0 -
事已至此先吃饭吧
¥15.9¥55.0 -
本森小姐的甲虫
¥15.9¥55.0 -
一个陌生女人的来信
¥12.9¥39.8 -
偏见
¥17.8¥56.0 -
面纱
¥16.9¥49.8 -
失去一切的人
¥16.6¥52.0 -
诺贝尔文学奖大系-窄门
¥14.9¥31.0 -
罗生门
¥15.9¥36.0 -
1984-插图珍藏版
¥9.9¥29.8 -
鸟与兽的通俗生活
¥17.7¥39.8 -
鼠疫
¥12.6¥38.8 -
2025读书月阅读盲盒——我独钟意命运角落的人
¥42.3¥168.0 -
重生
¥12.9¥39.8 -
女性生存战争
¥29.7¥66.0 -
她们
¥16.0¥46.8 -
我是一只骆驼
¥14.2¥32.0