- ISBN:9787121475474
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:296
- 出版时间:2024-04-01
- 条形码:9787121475474 ; 978-7-121-47547-4
本书特色
从多模态基础模型到世界模型Sora 多模态大模型基础技术
内容简介
本书以深入浅出的方式介绍近年来人工智能领域*热门的技术――多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。全书共5章,第1章深入探讨拥有代表性的大模型结构,第2章深度剖析多模态大模型的核心技术,第3章介绍多个具有代表性的多模态大模型,第4章深入分析视觉问答、AIGC 和具身智能这3个典型应用,第5章探讨实现通用人工智能的可行思路。 本书不仅适合高校相关专业高年级本科生和研究生作为教材使用,更是各类IT 从业者的推荐参考之作。
目录
作者简介
刘阳,中山大学计算机学院副研究员,中山大学人机物智能融合实验室(HCP-Lab)骨干成员。主要研究方向为多模态认知理解、因果推理和具身智能。截至2023年12月,在IEEE T-PAMI、T-IP、ICCV、ACM MM等期刊和会议上发表论文30余篇,2篇论文入选ESI高被引和热点论文。提出的视觉-语言因果推理开源框架CausalVLR受到国内外广泛关注。主持多项国家级、省部级科研项目,作为课题骨干参与国家人工智能重大专项。获得2023年中国软件大会“达闼杯”机器人大模型与具身智能挑战赛优胜奖,广东省第三届计算机科学青年学术秀一等奖。 林倞,人工智能领域国际著名学者(IEEE Fellow、IAPR Fellow、IET Fellow)、鹏城实验室多智能体与具身智能研究所所长、中山大学二级教授、国家杰出青年科学基金获得者、国家人工智能重大专项首席科学家;在多模态认知计算、生成式模型、具身交互与学习等领域形成一系列突破创新成果。截至2023年10月,发表论文400余篇(含T-PAMI论文40余篇),论文被引用30000余次(谷歌学术统计),5次获得*佳论文奖。获黑龙江省自然科学奖一等奖、吴文俊人工智能奖(自然科学类)、中国图象图形学学会科学技术奖一等奖等荣誉;指导学生获得CCF优秀博士论文奖、ACM China优秀博士论文奖及CAAI优秀博士论文奖。带领团队坚持产学研结合的科技创新思路,曾任商汤科技研究院执行院长,孵化新一代人工智能领军企业拓元智慧。在企业数智化、元宇宙、智慧城市等领域形成了具有广泛影响力的商业化产品和项目。
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
贝叶斯推理与机器学习
¥139.3¥199.0