×
暂无评论
图文详情
  • ISBN:9787302676317
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:0
  • 出版时间:2024-12-01
  • 条形码:9787302676317 ; 978-7-302-67631-7

本书特色

本书是本领域的学者、研究者、大专院校师生和工程技术人员极具参考价值的一部介绍相关科学原理、技术方法和实际应用的图书。

内容简介

本书系统介绍了智能视频检测与识别中的主要原理、方法和技术。智能视频分析技术,特别是检测与识别技术,在智慧城市、平安城市和公共安防领域的应用,是目前人工智能**的落地场景应用。引领了人工智能技术的发展方向,推动了信息和计算机学科的发展,同时为人们生活的安全便捷提供了保障。本书按照技术应用分为检测篇和识别篇,检测篇包括视频目标检测、无人机对地目标检测、人脸检测、行人检测、车辆检测、异常检测;识别篇包括人脸识别、行人再识别、行为识别、场景文字识别与车牌识别。系统介绍了相关的算法和实现过程,内容丰富,既阐述方法原理,图文并茂;又贴近实际应用,是本领域的学者、研究者、大专院校师生和工程技术人员极具参考价值的一部介绍相关科学原理、技术方法和实际应用的图书。

前言

2022年10月,习近平总书记在党的二十大报告中指出,“……加快实现高水平科技自立自强。以国家战略需求为导向,集聚力量进行原创性引领性科技攻关,坚决打赢关键核心技术攻坚战”。创新是**动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。
2017年7月8日,国务院发布了《新一代人工智能发展规划》(国发〔2017〕 35号)。人工智能成为国际竞争的新焦点,人工智能是引领未来的战略性技术; 人工智能已经成为经济发展的新引擎,成为新一轮产业变革的核心驱动力; 人工智能带来社会建设的新机遇,也将深刻改变人类社会生活、改变世界格局。抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国是我们的首要任务。在《新一代人工智能发展规划》

中提出,要“促进人工智能在公共安全领域的深度应用,推动构建公共安全智能化监测预警与控制体系。围绕社会综合治理、新型犯罪侦查、反恐等迫切需求,研发集成多种探测传感技术、视频图像信息分析识别技术、生物特征识别技术的智能安防与警用产品,建立智能化监测平台。加强对重点公共区域安防设备的智能化改造升级,支持有条件的社区或城市开展基于人工智能的公共安防区域示范”。智能视频检测与识别技术是上述任务的技术基础。

智能视频检测与识别技术是利用计算机图像分析技术以及近两年出现的大模型技术,通过对场景视频图像进行感知,判断背景和目标,并分析前景目标的属性和状态,追踪在摄像机场景内以及跨域出现的目标轨迹。应用系统具有多种视频内容分析的功能,通过在不同摄像机的场景中预设不同的视觉任务和预警规则,当感兴趣的目标在场景中出现或发生了预警规则所定义的现象或行为时,智能视频检测与识别系统会产生响应,并实施预警。

视频图像中的目标检测和识别,以定位并识别图像中感兴趣的对象为目的,是计算机视觉和机器学习中一项重要的任务。当前,深度学习的发展为视频图像目标检测和识别性能的提升带来了显著进展。结合图像目标检测并融合多帧图像中的时序信息实现高准确度的视频目标检测和识别是该领域的重要课题。同时,相比基于图像的目标检测和识别,视频目标检测不仅要保证在每帧图像上检测的准确性,还要保证检测结果具有帧间一致性和时序连续性,对于特征表征描述的挑战性更强,具有重要的理论研究意义。视频目标检测和识别是高阶场景内容理解与应用的基础,在智慧城市、公安安防、智能交通、无人驾驶、机器人等诸多场景中有重要应用。

目前,虽然有部分书籍分别介绍了智能视频检测与识别技术的某项技术内容,但并没有系统全面地讲解以现代机器学习和深度学习为主要方法的视频中常用典型目标的检测和识别。本书可作为高等院校人工智能与计算机相关专业、信息与信号处理、计算机视觉和机器人等智能体等相关领域的教学参考书,也可供从事智能安防相关领域的技术人员参考使用。

本书共分10章,由多位专家撰写。各章分别对人们关注和重要应用的典型视频目标检测和识别技术进行了论述。第1~6章主要介绍智能视频中目标检测技术的发展和检测方法,包括视频目标检测、无人机目标检测、人脸检测、行人检测、车辆检测、异常检测。第7~10章主要介绍智能视频中目标识别技术的发展和识别方法,包括人脸识别、行人再识别、行为识别、视频车牌识别。

本书每一章都对应一个主题。首先概述主题,围绕主题介绍背景,讲解技术。技术的讲解以方法为主,结合实际场景展示应用结果,便于读者综合学习和加深理解。其中第1~2章由清华大学李亚利撰写,第3章、第7~8章由清华大学王生进撰写,第4~5章由天津大学庞彦伟撰写,第6章和第9章由国防科技大学谢剑斌撰写,第10章由清华大学彭良瑞撰写。清华大学豆朝鹏、许景焘 张佩仪、赵珂萌,天津大学曹家乐、高阿麒,墨尔本大学谢昌颐,中北大学常智超等参与了本书的部分整理工作。另外,由于本书源自作者的一些实际研究成果,因此部分内容参考了多位作者指导的博士研究生和硕士研究生(舒晗、陈荡荡、郑良、许勤、孙奕帆)学位论文的部分内容。

本书部分研究成果来自国家自然科学基金项目“重现的行人目标数据关联和深度跟踪理论及方法研究”、国家自然科学基金项目“开放场景下基于深度学习的时空信息融合行人再识别方法研究”、科技部“863”计划项目“基于人类视觉感知和认知机理的视频图像模式识别和机器学习”、国家“十三五”重点研发计划项目“课题1: 动态人脸获取和快速比对技术与装备研究”、国家“十四五”重点研发计划项目“课题3: 人像鉴定及活体检测系统攻击检测与防御技术研究”、国家科技创新2030新一代人工智能重大项目“类脑通用视觉模型及应用”等。

在计算机视觉和人工智能领域,智能视频检测与识别技术的发展非常迅速,特别是2023年以来大模型出现以后更是如此。尽管本书力求全面并努力跟随技术发展趋势,但由于作者水平和时间有限,书中难免存在疏漏之处,恳请读者给予批评指正。

 

作者
2024年5月

 

目录

第1章视频目标检测
1.1视频目标检测概述
1.1.1视频目标检测的数据集
1.1.2视频目标检测的研究思路
1.1.3视频目标检测的应用场景
1.2基于深度学习的视频目标检测
1.2.1静态目标检测方法
1.2.2视频目标检测方法
参考文献
第2章无人机目标检测
2.1无人机目标检测概述
2.1.1无人机目标检测的挑战
2.1.2无人机目标检测数据集
2.2无人机目标检测的一般思路
2.3无人机目标检测方法
2.3.1基于图像切分的无人机目标检测
2.3.2基于尺度自适应特征的无人机目标检测
2.4无人机目标检测应用示范
参考文献
第3章人脸检测
3.1人脸检测概述
3.1.1人脸检测的应用需求
3.1.2研究人脸检测的基本方法
3.2深度卷积神经网络人脸检测
3.2.1一种常用的人脸检测方法框架
3.2.2原理设计
3.2.3人脸检测测试
3.3人脸检测应用实例
3.3.1人脸识别
3.3.2虚拟眼镜佩戴
参考文献
第4章行人检测
4.1引言
4.2基于手工设计特征的行人检测方法
4.2.1基于通道特征的行人检测方法
4.2.2基于形变模型的行人检测方法
4.2.3基于非相邻特征的行人检测方法
4.3非端到端深度行人检测方法
4.3.1非端到端行人检测方法分类
4.3.2基于多层通道特征的行人检测方法
4.4端到端深度行人检测方法
4.4.1两阶段行人检测方法
4.4.2单阶段行人检测方法
4.4.3基于掩膜引导注意力网络的行人检测方法
参考文献
第5章车辆检测
5.1引言
5.2基于单目的车辆检测方法
5.2.1基于单目的2D车辆检测方法
5.2.2基于单目的3D车辆检测方法
5.3基于双目的车辆检测方法
5.3.1双目车辆检测方法分类
5.3.2基于高效3D几何特征的双目车辆检测方法
5.3.3基于非均匀采样的双目车辆检测方法
5.4车辆检测的研究趋势
参考文献
第6章异常检测
6.1异常检测概述
6.1.1异常的定义
6.1.2异常检测的定义
6.1.3异常检测的难点
6.2基于传统方法的异常检测
6.2.1基于模型的方法
6.2.2基于聚类的方法
6.2.3基于邻近度的方法
6.2.4基于分类的方法
6.2.5图像异常检测
6.3基于深度学习的异常检测
6.3.1深度异常检测方法分类
6.3.2深度图像异常检测
6.3.3深度视频异常检测
参考文献
第7章人脸识别
7.1人脸识别概述
7.1.1人脸识别的应用需求
7.1.2人脸识别的研究概要
7.2基于深度学习的人脸识别
7.2.1深度卷积神经网络
7.2.2基于深度学习实现人脸识别
7.3人脸识别算法架构
7.3.1人脸检测
7.3.2人脸关键点定位
7.3.3人脸跟踪
7.3.4人脸归一化与特征提取
7.4基于级联卷积神经网络的人脸识别
7.4.1网络架构
7.4.2阈值选择
参考文献
第8章行人再识别
8.1行人再识别概述
8.1.1行人再识别难点
8.1.2行人再识别研究目标
8.1.3行人再识别研究方法
8.2行人再识别评价指标与数据集
8.3基于深度网络特征空间正交优化的行人再识别
8.3.1权向量间相关性及其影响
8.3.2SVDNet网络模型
8.4基于特征配准的行人再识别
8.4.1行人语义部件特征学习
8.4.2行人广义部件特征学习
8.4.3遮挡等信息不完全条件下的行人部件学习
8.4.4基于特征校正层的深度特征表征方法
8.5面向域泛化行人再识别
参考文献
第9章行为识别
9.1行为识别概述
9.2行为识别基础
9.3基于传统方法的人体行为识别
9.3.1整体特征表示
9.3.2局部特征表示
9.4基于深度学习的人体行为识别
9.4.1双流网络结构
9.4.23D卷积神经网络结构
9.4.3混合网络结构
9.4.4其他行为识别方法
9.5数据集
参考文献
第10章视频车牌识别
10.1引言
10.2视频车牌识别研究现状
10.2.1车牌识别方法
10.2.2车牌检测方法
10.2.3车牌跟踪方法
10.2.4数据集与测试指标
10.3基于深度学习的车牌识别方法
10.3.1特征提取网络
10.3.2编码器解码器模型
10.3.3图像校正方法
10.3.4预训练方法
10.3.5车牌识别实验结果
10.4视频车牌识别系统
10.4.1基于自注意力机制的车牌检测方法
10.4.2多目标车牌跟踪方法
10.4.3实验结果
参考文献


展开全部

作者简介

王生进,清华大学长聘教授,信息认知与智能系统研究所所长、媒体大数据认知计算研究中心主任。主要研究领域计算机视觉、机器学习、行人再识别、多模态机器人脑计算与协作机器人。参与制定行业和国家标准7项。获2008年国家科技进步二等奖1项、获2006、2021北京市科学技术奖一等。2018年获国际模式识别学会ICPR2018*佳论文奖;2019年获公安部科学技术奖二等,2019年获第九届吴文俊人工智能自然科学奖二等,2021年北京市科学技术奖技术发明一等奖。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航