- ISBN:9787121496554
- 装帧:平塑
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:208
- 出版时间:2025-02-01
- 条形码:9787121496554 ; 978-7-121-49655-4
内容简介
本书详细介绍了地质大数据挖掘的方法及实现过程。全书分为8章,介绍了绪论、机器学习与深度学习、数据清洗与预处理、地质命名实体识别算法及实现、地质实体关系智能抽取算法及实现、地质报告表格检测与内容识别算法及实现、地质图中图例与字符自动识别算法及实现、栅格地质图自动分割算法及实现等内容。
目录
第1章 绪论 1
1.1 地质科学研究范式 1
1.2 地质科学大数据的内涵 3
1.3 地质科学大数据挖掘的基本任务 4
1.3.1 面向多源、多类型文本的挖掘 8
1.3.2 面向多类型复杂地质图件的挖掘 9
1.3.3 面向图文数一体化的知识挖掘 10
1.4 常用的数据挖掘工具与软件 10
1.4.1 Python 10
1.4.2 其他常用的数据挖掘建模工具 14
1.4.3 常用的中文分词工具 16
1.4.4 数据标注平台 17
参考文献 23
第2章 机器学习与深度学习 26
2.1 机器学习发展史 26
2.2 机器学习的分类 26
2.3 典型的机器学习算法 32
2.3.1 支持向量机 32
2.3.2 决策树 34
2.3.3 人工神经网络 35
2.4 典型的深度学习算法 36
2.4.1 现代卷积神经网络 36
2.4.2 现代循环神经网络 38
2.4.3 大语言模型 39
2.5 Python算法的实现 40
2.5.1 基于支持向量机的地质命名实体识别 40
2.5.2 基于决策树的地质命名实体识别 42
2.5.3 基于人工神经网络的地质命名实体识别 43
2.5.4 基于现代卷积神经网络的地质命名实体识别 44
2.5.5 基于现代循环神经网络的地质命名实体识别 48
2.5.6 基于迁移学习的地质命名实体识别 51
2.5.7 基于大语言模型的地质命名实体识别 52
参考文献 54
第3章 数据清洗与预处理 56
3.1 数据清洗 56
3.2 地质文本数据预处理 59
3.3 地质图像数据预处理 62
3.3.1 几何校正 62
3.3.2 去噪 64
3.3.3 主图区域的定位 67
3.3.4 膨胀与腐蚀处理 67
3.4 地质数据增强方法 68
3.4.1 面向文本数据的增强方法 68
3.4.2 面向图件数据的增强方法 72
3.5 数据标注 76
3.6 数据一致性检验 78
3.7 Python主要的数据预处理函数 79
参考文献 80
第4章 地质命名实体识别算法及实现 81
4.1 相关分析 81
4.2 典型算法 82
4.2.1 基于ALBERT-BiLSTM-CRF模型的地质命名实体识别 82
4.2.2 基于BERT-BiGRU-Attention-CRF模型的地质命名实体识别 86
4.3 Python算法实现 89
4.4 面向地质报告的命名实体识别应用案例 91
4.4.1 ALBERT框架下基于多特征融合的工程地质命名实体识别 91
4.4.2 顾及文本上下文信息的矿产资源地质命名实体识别 95
参考文献 98
第5章 地质实体关系智能抽取算法及实现 100
5.1 相关分析 100
5.2 实体关系抽取 101
5.2.1 实体关系抽取的研究现状 101
5.2.2 实体关系抽取的典型算法 103
5.2.3 实体关系抽取工具 115
5.3 Python算法实现 124
5.3.1 BERT-BiGRU-CRF模型 124
5.3.2 TPLinker模型 125
5.3.3 GPLinker模型 127
5.3.4 CasRel模型 129
5.4 应用案例 131
5.4.1 面向地质报告的实体关系抽取 131
5.4.2 面向地质灾害的实体关系抽取 134
参考文献 139
第6章 地质报告表格检测与内容识别算法及实现 144
6.1 相关分析 144
6.2 典型算法 145
6.2.1 基于Mask RCNN的目标检测模型 145
6.2.2 基于Attention-Mask RCNN的表格解析模型 147
6.3 Python算法实现 148
6.3.1 Mask RCNN模型构建 148
6.3.2 表格内容识别 153
6.3.3 表格结构解析 154
6.4 应用案例 156
参考文献 164
第7章 地质图中图例与字符自动识别算法及实现 168
7.1 相关分析 168
7.2 典型算法 169
7.2.1 地质图自动理解分析 169
7.2.2 基于DT-SE-ResNet50模型的地质图例识别 170
7.2.3 基于CRNN模型的地质图字符识别 171
7.3 Python算法实现 172
7.3.1 基于DT-SE-ResNet50模型的地质图例识别算法实现 172
7.3.2 基于CRNN模型的地质字符识别算法实现 174
7.4 应用案例 175
参考文献 181
第8章 栅格地质图自动分割算法及实现 184
8.1 相关分析 184
8.2 典型算法 185
8.2.1 基于BP神经网络的彩色地质图面-线-点要素信息智能提取 185
8.2.2 基于UNet模型与Felz聚类算法的彩色地质图分割 186
8.3 Python算法实现 192
8.4 应用案例 195
参考文献 198
作者简介
邱芹军,工学博士、特任副研究员/博士后,新加坡南洋理工大学访问学者(2023),China Geology/地质通报青年编委,国际数字地球学会中国国家委员会虚拟地理环境专业委员会委员、中国地理信息产业协会自然资源信息工作委员会,湖北省测绘行业协会技术标准与知识产权工作委员会副秘书长,高校GIS新锐(2022)。主要从事地质大数据挖掘、地学知识图谱嵌入表示与推理、智能空间认知与推理等研究。
-
中国城镇住房保障制度设计研究
¥16.9¥30.0 -
动物秘密大搜罗-动物感官的秘密
¥17.5¥29.9 -
改变,从写作开始:教育写作实用技巧30讲/大夏书系
¥26.9¥39.8 -
小儿与成长骨髓MRI诊断图谱-正常表现.变异和弥漫性病变
¥52.0¥150.0 -
产品经理实务(卓越产品经理EPM中级线上培养工程考试教材)/知行信产品创新管理丛书
¥46.6¥95.0 -
你为什么不离开我的生活?
¥30.4¥49.8 -
反攻-1945年中国抗日战场纪实
¥29.8¥48.0 -
曾国藩家书
¥32.1¥59.8 -
趣解作文.初中写作方法初中写作难题点对点解决方案
¥22.5¥29.8 -
谷白自选集:升平街纪事
¥24.0¥56.0
-
2025读书月阅读盲盒——我独钟意命运角落的人
¥42.3¥168.0 -
2025读书月阅读盲盒——经常作案的朋友都知道
¥42.3¥168.0 -
2025读书月阅读盲盒——你以为你以为的就是你以为的吗?
¥42.3¥168.0 -
生死场
¥8.6¥36.0 -
阅读是一座随身携带的避难所
¥15.8¥39.0 -
莫言的奇奇怪怪故事集
¥22.2¥59.9 -
女性生存战争
¥24.4¥66.0 -
林徽因讲建筑
¥11.9¥29.0 -
东京梦华录
¥19.9¥46.0 -
1984-插图珍藏版
¥11.3¥29.8 -
悉达多
¥14.3¥28.0 -
给青年的十二封信
¥6.3¥15.0 -
我从未如此眷恋人间
¥16.9¥49.8 -
她们
¥17.3¥46.8 -
告白
¥14.0¥36.8 -
我的心曾悲伤七次
¥9.0¥25.0 -
茶,汤和好天气
¥10.1¥28.0 -
大宋宰相王安石
¥18.6¥55.0 -
中国近代史
¥15.5¥39.8 -
得半日之闲,抵十年尘梦
¥10.1¥28.0