- ISBN:9787121475313
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:244
- 出版时间:2024-06-06
- 条形码:9787121475313 ; 978-7-121-47531-3
内容简介
视觉问答任务要求机器根据指定的视觉图像内容, 对单轮或多轮的自然语言问题进行作答。其本质上是一个多学科的研究问题,涉及计算机视觉、自然语言处理、知识表示与推理等。本书共5 部分,第1 部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术,包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2 部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外,概述基于图像的其他视觉问答任务,例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3 部分讨论基于视频的视觉问答及其相关模型。第4 部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解,它们是视觉问答任务的扩展。第5 部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。
目录
作者简介
吴琦,澳大利亚阿德莱德大学高级讲师(副教授),博士生导师,澳大利亚青年学者基金获得者 (Australian Research Council DECRA Fellow),澳大利亚机器人视觉研究中心(ACRV)vision-language课题组组长,澳大利亚科学院罗素奖获得者。吴琦博士于2015年在英国巴斯大学获得博士学位,致力于计算机视觉领域研究,尤其关注于计算机视觉-自然语言相关领域的研究。吴琦博士在CVPR,ICCV,ECCV, NeurIPS, TPAMI等多个国际会议和期刊发表论文七十余篇,吴琦博士亦担任TPAMI,IJCV,TIP,CVPR,NIPS,ACL等学术期刊会议审稿人以及ICCV2021 领域主席。
-
大学计算机实践教程-面向计算思维能力培养-(第2版)
¥26.5¥35.0 -
食品安全与质量控制(第二版)(高等职业教育食品质量与安全专业教材)
¥29.6¥52.0 -
2023考研数学接力题典1800
¥25.6¥82.0 -
数据驱动的物流选址与调度模型及其实践
¥41.8¥68.0 -
地球三极:全球变化的前哨
¥79.8¥145.0 -
小小百科图书馆(全40册)
¥70.8¥118.0 -
机械设计基础
¥26.2¥35.0 -
大跨空间结构-(第二版)
¥16.0¥19.0 -
小微企业安全生产市场化服务研究
¥121.0¥168.0 -
积分几何中的BUFFON投针问题(2020年数学基金)
¥138.6¥198.0
-
造神:人工智能神话的起源和破除 (精装)
¥32.7¥88.0 -
大数据技术导论(第2版)
¥28.9¥41.0 -
人人都能学AI
¥40.4¥68.0 -
人工智能
¥20.3¥55.0 -
系统架构设计师教程(第2版)(全国计算机技术与软件专业技术资格(水平)考试指定用
¥102.7¥158.0 -
过程控制技术(第2版高职高专规划教材)
¥27.6¥38.0 -
数据结构基础(C语言版)(第2版)
¥41.7¥49.0 -
WPS OFFICE完全自学教程(第2版)
¥97.3¥139.0 -
智能视频目标检测与识别技术
¥43.5¥59.0 -
人工智能基础及应用
¥36.0¥48.0 -
深入浅出软件架构
¥117.2¥186.0 -
计算机网络基础(微课版)
¥39.0¥55.0 -
剪映:即梦AI绘画与视频制作从新手到高手
¥66.0¥89.0 -
红蓝攻防 技术与策略(原书第3版)
¥95.9¥139.0 -
Web前端开发基础
¥37.5¥57.0 -
软件设计的哲学(第2版)
¥52.0¥69.8 -
人工智能的底层逻辑
¥58.7¥79.0 -
软件工程理论与案例
¥63.4¥99.0 -
剪映+PREMIERE+AIGC 短视频制作速成
¥73.5¥98.0 -
剪映AI
¥52.0¥88.0