×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
基于多层次理解的视频分析技术与应用

基于多层次理解的视频分析技术与应用

1星价 ¥45.2 (7.8折)
2星价¥45.2 定价¥58.0
暂无评论
图文详情
  • ISBN:9787563572854
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:167
  • 出版时间:暂无
  • 条形码:9787563572854 ; 978-7-5635-7285-4

内容简介

在“视频大数据”时代,利用人工智能技术对视频中的目标行为进行智能识别与分析,可为公共与国防安全、体育与娱乐等领域的诸多应用提供更高层级的技术支持。本书以体育场景为重点,进行案例剖析。研究体育运动中人类活动规律,构造智能系统,可为提高运动员竞技能力、促进大众科学健身提供新的高科技手段,极大提高了体育产业的智能化程度。 本书剖析了主流的视频行为分析技术,基于多个层次对体育视频中个体及群体行为进行理解,重点研究了体育视频中的目标跟踪与行为识别,具体包括单目标跟踪,多目标跟踪,单目标行为识别,群体行为识别等智能视觉任务,涉及关系学习,监督学习,无监督学习等优化方法。本书剖析了体育场景的特殊性,体育目标描述的复杂性,体育群体关系建模的专业性等难题,并提出一系列基于深度模型的解决方法,建立起契合体育场景的、高效鲁棒的目标分析框架,以供广大读者参考。 编辑团队总结了人工智能在视频分析领域的*新成果,在编写过程中参考了大量书籍、文献及手册资料,在此向各位相关作者表示诚挚的感谢。同时,由于作者水平有限,而且智能体育分析技术是一种正在不断发展和完善的技术,本书难以概括全面,敬请读者批评指正。

目录

第1章 背景与意义 第2章 国内外研究现状 2.1 行为识别方法 2.1.1 行为识别数据库 2.1.2 传统的行为识别方法 2.1.3 基于深度学习的行为识别方法 2.2 多目标跟踪方法 2.3 群体行为识别方法 2.3.1 群体行为数据库 2.3.2 传统的群体行为识别方法 2.3.3 基于深度学习的群体行为识别方法 本章小结 第3章 体育视频中运动员协同跟踪和行为识别一体化框架 3.1 引言 3.2 相关工作 3.2.1 目标跟踪 3.2.2 行为识别 3.3 BeaVoll数据库 3.4 尺度遮挡鲁棒的跟踪方法 3.4.1 压缩跟踪 3.4.2 尺度细化 3.4.3 遮挡恢复 3.5 长时间区域导向的递归神经网络 3.5.1 多尺度金字塔卷积神经网络 3.5.2 长短时记忆单元结构 3.5.3 训练和测试 3.6 实验结果与分析 3.6.1 实验细节 3.6.2 在BeaVoll数据库上的实验结果 3.6.3 在UIUC2数据库上的实验结果 本章小结 第4章 基于长时间动作线索的体育视频中多运动员跟踪方法 4.1 引言 4.2 相关工作 4.3 基于长时间动作依赖的层级深度匹配方法 4.3.1 问题描述 4.3.2 检测框连接代价 4.3.3 孪生跟踪片相似度网络和跟踪片连接代价 4.4 数据库 4.5 实验结果与分析 4.5.1 实验细节 4.5.2 评估指标 4.5.3 结果分析 本章小结 第5章 基于注意力机制和上下文建模的体育视频中群体行为识别方法 5.1 引言 5.2 基于注意力机制和上下文建模的群体行为识别方法 5.2.1 注意力机制的LSTM网络结构 5.2.2 层级注意力网络 5.2.3 层级上下文网络 5.3 实验结果与分析 5.3.1 实验细节 5.3.2 基准方法 5.3.3 在Collective Activity数据库上的实验结果 5.3.4 在Volleyball数据库上的实验结果 本章小结 第6章 面向复杂语义自适应建模的群体战术识别方法 6.1 引言 6.2 复杂语义自适应建模的群体战术识别方法 6.2.1 自适应的图卷积神经网络 6.2.2 注意力时序卷积网络 6.3 实验结果与分析 6.3.1 实验细节 6.3.2 消融实验 6.3.3 与其他先进方法的比较 本章小结 第7章 基于多尺度交叉距离Transformer模型的群体行为识别方法 7.1 相关工作 7.2 基于多尺度交叉距离Transformer模型的群体行为识别方法 7.2.1 方法概览 7.2.2 跨距离注意力块 7.2.3 层次结构 7.2.4 多尺度重构学习 7.3 实验结果与分析 7.3.1 数据库 7.3.2 实验细节 7.3.3 消融实验 7.3.4 与其他先进方法的比较 本章小结 第8章 基于长短状态预测Transformer的群体表征自学习方法 8.1 引言 8.2 相关工作 8.2.1 自监督学习 8.2.2 行为预测 8.3 基于长短状态预测Transformer的群体表征自学习方法 8.3.1 概览 8.3.2 长短状态编码器 8.3.3 长短状态解码器 8.3.4 联合学习机制 8.4 实验结果与分析 8.4.1 数据库 8.4.2 实验细节 8.4.3 消融实验 8.4.4 与其他先进方法的比较 本章小结 第9章 基于上下文关系预测编码的群体行为表征自学习方法 9.1 引言 9.2 基于上下文关系预测编码的群体行为表征自学习方法 9.2.1 概述 9.2.2 群体标记生成器 9.2.3 串并行Transformer编码器 9.2.4 混合上下文Transformer解码器 9.2.5 联合损失 9.3 实验结果与分析 9.3.1 数据库 9.3.2 实验细节 9.3.3 与其他先进方法的比较 9.3.4 消融实验 本章小结 第10章 总结与展望 参考文献
展开全部

作者简介

孔龙腾,北京邮电大学博士后,毕业于北京航空航天大学,长期从事计算机视觉与模式识别研究。发表IEEE Transactions on Image Processing (TIP),IEEE Transactions on Circuits and Systems for Video Technology (TCSVT)等国际权威期刊或会议15篇,其中**作者或通讯作者5篇,均为中科院1区),主持或参与国自然青年基金项目、国自然面上项目、科技部重点研发项目、港澳台专项项目8项。现为人工智能顶级期刊TIP、TCSVT、TMM等审稿人,北京图象图形学学会(BSIG)青年工作委员会委员、人工智能人机交互专委会委员。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航