自然场景文本检测算法研究
温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>
- ISBN:9787115583871
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:159
- 出版时间:2021-12-01
- 条形码:9787115583871 ; 978-7-115-58387-1
本书特色
丰富的图文讲解先进的文本识别算法有效的检测模型拥有高F测度值展示了自然场景文本识别的新研究成果展示了自然场景文本识别的新研究成果
内容简介
以深度学习为基础的文本检测算法有基于回归的模型和基于分割的模型,目前这两种模型的应用效果各有优劣。为解决回归模型对训练数据的依赖,以及分割模型受目标尺寸影响的问题,本书提出了两种新的算法:TSFnet和Mnet。 全书分为5章,概述了自然场景下文本检测的研究现状,陈述了相关算法的问题、数据集与存在的挑战,并通过实验,对基于融合网络的TSFnet模型及结合区域网络与注意力网络的Mnet模型进行了详细的介绍,*后对相关的应用进行了简介。 本书结构清晰,文字流畅,图文并茂,适合从事场景文本检测与识别研究的相关读者阅读,也适合作为高校相关专业学生的参考书。
目录
第 1章 绪论 1
1.1研究背景 1
1.2 问题与挑战 3
1.3主要研究内容 5
1.4 本文的组织结构 5
第 2章 场景文本检测算法综述 7
2.1简介 7
2.2场景文本检测和识别过程概述 8
2.3场景文本检测和识别算法分类 10
2.3.1基于传统机器学习的场景文本检测和识别算法 10
2.3.2基于深度学习的场景文本检测和识别算法 28
2.4文本检测和识别的评价指标 41
2.5文本检测和识别的数据集 42
2.5.1 ICDAR数据集 42
2.5.2 SVT数据集 44
2.5.3 IIIT数据集 45
2.5.4 KAIST数据集 46
2.5.5 CTW数据集 46
2.5.6 RCTW-17数据集 47
2.5.7 ICPR MWI 2018数据集 48
2.5.8 Total-Text数据集 48
2.5.9 Google FSNS数据集 49
2.5.10 COCO-TEXT数据集 49
2.5.11 Synthetic数据集 50
2.6 总结 50
第3章 基于融合网络的TSFnet模型 52
3.1 问题形成 52
3.2 相关研究 52
3.2.1基于回归的模型 53
3.2.2 基于分割的模型 53
3.3 TSFnet 54
3.4实验 60
3.4.1评价指标 60
3.4.2 参数设置 60
3.4.3 结果与分析 61
3.5 本章小结 64
第4章 结合区域建议网络与注意力网络的Mnet算法 66
4.1 问题形成 66
4.2 相关研究 66
4.2.1基于回归的模型 66
4.2.2 基于分割的模型 67
4.2.3 两阶段检测模型 67
4.3 Mnet 68
4.3.1 Scale-RPN 69
4.3.2回归网络 70
4.3.3 分割网络 70
4.3.4 注意力网络 71
4.4 实验 72
4.4.1评价指标 72
4.4.2参数设置 72
4.4.3实验对比与分析 73
4.5 本章小结 75
第5章 场景文本检测与识别应用 77
5.1卡证文字检测与识别 77
5.1.1证件文字检测与识别 77
5.1.2 银行卡文字检测与识别 79
5.1.3 名片文字检测与识别 79
5.1.4 营业执照文字检测与识别 80
5.2票据文字检测与识别 80
5.3汽车场景文字检测与识别 81
5.3.1 车牌检测与识别 81
5.3.2 汽车VIN码检测与识别 83
5.4 文档文字检测与识别 83
5.5 自然场景文字检测识别 84
第6章 总结与展望 86
6.1 总结 86
6.2展望 86
参考文献 88
作者简介
主编:赵雪专,男,1986年7月出生,讲师,博士,博士毕业于中国科学院大学,主要研究方向为机器学习与模式识别,研究成果主要应用有于计算机视觉领域。近年来,主持或参与多项国家和省部级科研项目,发表相关学术论文20余篇。申请专利24项,其中授权13项。主持完成多项横向项目,如探地雷达定位系统、视频摘要系统、智能视频监控系统、DSP无线车型识别系统、疲劳检测系统等。 副主编:李玲玲,女,1973年1月出生,教授,博士后,郑州航空工业管理学院智能工程学院院长,多模信息感知河南省工程实验室主任、河南省航空物流大数据工程研究中心主任。博士毕业于华中科技大学图像识别与人工智能研究所,厦门大学博士后流动站出站。研究方向为计算机视觉。河南省创新人才杰出青年,河南省学术技术带头人,河南省“创新型科技团队”带头人、河南省高校科技创新团队带头人、郑州市科技创新团队带头人,河南省高等学校青年骨干教师,河南省教育厅学术带头人,河南省计算机教育学会常务理事。国家自然科学基金评审,通信学报、中国图像图形学报、武汉大学学报等评审。主持国家自然科学基金面上项目、人才支持计划、河南省科技创新杰出青年基金、航空科学基金、河南省科技攻关项目等科研项目16项;完成省级项目鉴定9项;出版科研5部;先后获得河南省科学技术进步三等奖等奖项15项。 罗向阳,男,1978年生,战略支援部队信息工程大学教授、博导,河南省网络空间态势感知重点实验室主任,国防科技青年基金获得者,先后入选河南省科技创新杰出青年和杰出人才、中原科技创新领军人才。先后主持国家自然科学基金5项(其中重点项目2项),国家863项目军口课题、国家重点研发计划课题、装发预研重点项目等国家、军队和省部级科研项目30余项,在IEEE JSAC、TIFS、TDSC、TII、TMM、TCSVT、TCC、TCSS、ACM TIOT、ACM TIOS、ACM TOMM、IEEE/ACM TNET、《中国科学》、《计算机学报》、《软件学报》、《计算机研究与发展》和IJCAI、WWW、INFOCOM、ACM MM、IH、IH&MMSec等国内外重要学术期刊/会议发表论文200余篇,其中被SCI检索120余篇,5篇论文入选ESI高被引论文。在科学出版社出版《网络空间测绘》专著1部,获发明专利授权30余项。先后获百篇优博提名奖和全军博士学位论文奖,获技术发明一等奖和中国电子学会技术发明一等奖各1项、军队和河南省科技进步二等奖4项,军队教学成果二等奖1项,指导研究生获全军和河南省学位论文4篇。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0