- ISBN:9787030646132
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:B5
- 页数:232
- 出版时间:2021-06-01
- 条形码:9787030646132 ; 978-7-03-064613-2
内容简介
海量地理空间数据中通常隐含着多种类型空间分布特征(亦称模式),其中地理空间异常是一种偏离整体或局部空间分布的模式,可能表征地理事物或现象之间潜在的关联关系、变化规律和发展趋势,并代表特殊的地理现象或地理过程。地理空间异常模式探测已成为地理空间数据挖掘的重要研究内容,亦是地理知识发现的一种主要手段,并在特别气候事件识别、环境保护、交通拥堵检测、犯罪和流行病暴发热点探测等众多领域得到广泛应用。目前,地理空间数据获取能力大大提升,地理空间数据类型众多,数据之间的关系复杂,并与空间/时间尺度密切相关。因此,本书针对不同类型的地理空间数据并结合实际应用,系统地研究了地理空间数据异常模式的探测方法,主要内容包括:(1)对国内外相关研究工作进行了系统地分类总结;(2)结合地理空间数据的特点,对不同类型的空间/时空异常模式进行了定义和描述;(3)系统地阐述不同类型空间/时空异常的探测方法;(4)阐述不同类型空间/时空异常探测的可靠性分析方法。
目录
“地球观测与导航技术丛书”编写说明
前言
第1章 绪论 1
1.1 研究背景 1
1.2 研究意义 3
1.3 地理空间异常研究概况 4
1.4 地理空间异常研究框架 6
1.5 本书的内容组织 8
1.6 本章小结 10
参考文献 10
第2章 地理空间异常的定义与分类描述 13
2.1 引言 13
2.2 事务型数据异常的定义与分类 13
2.3 空间数据的分类与表达 15
2.3.1 空间数据的分类 15
2.3.2 空间数据的特征 15
2.3.3 空间数据的表达 16
2.3.4 空间邻域的构建 18
2.4 空间异常的定义与分类描述 20
2.4.1 空间异常的定义 20
2.4.2 空间异常的分类描述 20
2.5 时空数据的分类与表达 22
2.5.1 时空数据的分类 22
2.5.2 时空数据的特征 23
2.5.3 时空数据的表达 24
2.5.4 时空邻域的构建 25
2.6 时空异常的定义与分类描述 26
2.6.1 时空轨迹异常的定义与分类描述 26
2.6.2 时空序列异常的定义与分类描述 26
2.7 本章小结 29
参考文献 29
第3章 基于位置信息的空间异常探测 32
3.1 引言 32
3.2 基于统计的异常探测 33
3.2.1 参数统计探测法 33
3.2.2 非参数统计探测法 35
3.3 基于邻近关系度量的异常探测 40
3.3.1 欧氏距离度量探测法 40
3.3.2 角度度量探测法 42
3.3.3 局部密度度量探测法 43
3.4 基于聚类分析的异常探测 47
3.4.1 直接探测法 47
3.4.2 间接探测法 48
3.5 基于层次约束不规则三角网的异常探测 50
3.5.1 同类空间点事件探测法 50
3.5.2 两类空间点事件探测法 56
3.5.3 实例分析 61
3.6 本章小结 71
参考文献 71
第4章 基于位置和属性信息的空间异常探测 74
4.1 引言 74
4.2 基于变量关系可视化的异常探测 76
4.3 基于属性距离度量的异常探测 77
4.3.1 空间距离等权探测法 78
4.3.2 空间距离加权探测法 79
4.4 基于密度估计的异常探测 80
4.4.1 局部密度探测法 81
4.4.2 高斯核密度探测法 83
4.5 基于聚类分析的异常探测 86
4.5.1 直接探测法 87
4.5.2 间接探测法 88
4.6 基于智能计算的异常探测 90
4.6.1 随机游走模型探测法 90
4.6.2 自组织映射神经网络探测法 92
4.7 基于图论的异常探测 94
4.7.1 K邻近图探测法 95
4.7.2 图论-密度耦合探测法 96
4.7.3 实例分析 106
4.8 本章小结 111
参考文献 111
第5章 时空轨迹异常探测 113
5.1 引言 113
5.2 时空轨迹形状异常探测 114
5.2.1 轨迹划分探测法 114
5.2.2 方向-密度度量探测法 116
5.2.3 格网计数探测法 117
5.3 时空轨迹分布异常探测 119
5.3.1 距离度量探测法 119
5.3.2 PCA探测法 120
5.3.3 扫描统计探测法 122
5.3.4 时空聚类探测法 122
5.3.5 实例分析 126
5.4 本章小结 129
参考文献 129
第6章 时空序列异常探测 131
6.1 引言 131
6.2 基于属性距离度量的异常探测 132
6.2.1 时空分治探测法 132
6.2.2 时空一体化探测法 134
6.3 基于空间扫描统计的异常探测 136
6.4 基于聚类分析的异常探测 139
6.4.1 多尺度模糊探测法 139
6.4.2 密度聚类探测法 140
6.5 基于尺度空间的多尺度异常探测 141
6.5.1 尺度空间理论 142
6.5.2 改进的尺度空间聚类法 143
6.5.3 基于尺度空间聚类的多尺度异常探测 145
6.6 基于动态时空建模的异常探测 146
6.6.1 动态时空建模探测法 147
6.6.2 实例分析 156
6.7 本章小结 179
参考文献 179
第7章 地理空间异常的可靠性分析 182
7.1 引言 182
7.2 基于关联规则挖掘的地理空间异常可靠性分析 183
7.2.1 基于Voronoi图的空间关联规则挖掘方法 183
7.2.2 基于事件影响域的时空关联规则挖掘方法 185
7.3 基于遥相关模式挖掘的地理空间异常可靠性分析 187
7.3.1 层次聚类分区-时间延迟法 188
7.3.2 尺度空间分区-滑动时间窗口法 189
7.3.3 实例分析 192
7.4 基于环境相似性的地理空间异常可靠性分析 202
7.4.1 地理环境相似性 202
7.4.2 地理空间异常显著性检验方法 203
7.4.3 实例分析 207
7.5 本章小结 214
参考文献 214
第8章 总结与展望 218
8.1 总结 218
8.2 研究展望 219
彩图
节选
第1章 绪论 1.1 研究背景 随着对地观测技术、传感网技术、网络通信技术、空间科学技术的迅速发展,地理空间数据的获取能力大大增强,地理空间数据量呈指数级增长。如何从这些海量地理空间数据中挖掘人们感兴趣的、隐藏的、潜在有用的信息和知识,是一项极具挑战性的研究难题,称为地理空间数据挖掘(李德仁等, 2006;龚健雅, 2007)。 地理空间数据挖掘是计算机科学与地理信息科学领域的交叉前沿方向。在计算机领域,数据挖掘正是为了解决“数据极度丰富而信息极度匮乏”这一难题而诞生的(Han & Kamber, 2000;Tan et al., 2006)。数据挖掘*初以“从数据库中发现知识”(knowledge discovery in databases,KDD)的概念诞生于1989年在美国底特律召开的第11届国际联合人工智能学术会议上。此后,美国人工智能协会(Association for the Advancement of Artificial Intelligence,AAAI)每年主办一次KDD国际学术研讨会;自1997年起在欧洲和亚洲地区也每年分别召开一次亚太数据挖掘与知识发现(Data Mining and Knowledge Discovery, DMKD)会议和欧洲DMKD会议。1993年,美国电气和电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)中的知识与数据工程(Knowledge and Data Engineering, KDE)会议期刊首次收录了有关KDD的论文集,这些论文对KDD与机器学习、专家系统、数理统计之间的区别及联系进行了详细阐述。1996年,学者Fayyad等首次对数据挖掘进行了详细定义,将数据挖掘描述为从海量的数据集中提取潜在的、有用的、新颖的、有意义的知识和模式的过程(Fayyad et al., 1996),这个经典的定义一直沿用至今。1997年,Data Mining and Knowledge Discovery杂志诞生,这是国际上**本有关KDD的正式杂志。2000年,Han和Kamber出版了世界上**本数据挖掘专著Data Mining: Concepts and Techniques(Han & Kamber, 2000)。2006年,Tan等出版了另一部有关数据挖掘的专著Introduction in Data Mining(Tan et al., 2006)。 数据挖掘融合了数据库技术、机器学习、模式识别、数理统计、专家系统、人工智能等多个领域的相关理论和方法,主要技术手段包括聚类分析、异常探测、关联规则挖掘、分类、预测等,这些技术手段通常可以单独用来挖掘知识(Han & Kamber, 2000; Fayyad et al., 1996)。当数据集或分布模式较为复杂时,需要融合多种技术手段进行挖掘分析。 空间数据通常具有空间相关性、异质性和尺度依赖性等特征,较传统的事务型数据更为复杂。为了从空间数据库中发现潜在的、有用的、新颖的、有意义的规则、规律和模式等知识,李德仁院士从地理信息系统(geographic information system, GIS)数据库中发现知识,并系统地阐述了空间数据挖掘的特点和方法,标志着空间数据挖掘的概念正式诞生(Li & Cheng, 1994)。空间数据挖掘可以视为传统数据挖掘技术在空间数据库中的扩展,已成为数据挖掘领域的重要发展方向,引起了众多国际学术组织的广泛关注和重视(Miller & Han, 2001; 邸凯昌, 2000)。通过二十多年的相关国际会议主题可以发现,空间数据挖掘一直都是ACM- SIGMD (Asso-ciation for computing Machineny-Special Interest Group on Management of Data)数据管理国际会议、大型空间数据库研讨会(Symposium on Large Spatial Databases, SLSD)、DMKD会议、国际摄影测量遥感(International Society of Photogrammetry and Remote Sensing, ISPRS)会议、空间数据处理(Spatial Data Handling,SDH)会议、国际空间信息理论会议(Conference on Spatial Information Theory, COSIT)等重要国际会议的热点讨论主题。国际著名学者Han、Easter、Miller、Shekhar等均对空间数据挖掘开展了持续性的研究工作,促进了空间数据挖掘的蓬勃发展(Han et al., 1997;Ester et al., 1997; Miller & Han, 2001; Shekhar et al., 2003)。 空间数据通常同时包含空间位置信息(如经纬度)和非空间专题属性信息(如降水、气温等)(王家耀, 2001)。此外,空间数据还可能具有非线性、多尺度、高维、不完备等特性(裴韬等, 2001),这些特性使得传统的数据挖掘技术不能直接用于空间数据挖掘,而需要在顾及空间数据特性的基础上,融合各种数据挖掘技术来得到空间实体或地理现象之间的联系,以揭示空间实体或地理现象的发展趋势和变化规律。 随着时空数据的空间或时间分辨率不断提高以及时空数据量呈指数倍地急剧增长,如何从海量、复杂的时空数据库中快速、有效地分析挖掘各类潜在的、有用的知识和模式,以深入地理解和预测各种空间实体、地理现象以及它们之间的复杂关系、动态变化和发展趋势,亟须发展时空数据挖掘的理论、技术和方法,主要研究内容包括时空聚类、时空异常探测、时空关联挖掘、时空预测建模等。其中,时空异常具体可表现为极端气候事件、交通拥堵现象、环境污染、疾病暴发等,已引起人们的广泛关注,准确探测时空异常模式并深入分析其内在的关联机制和发展规律将有助于精准预测,从而辅助政府相关部门进行科学决策。 相对来说,时空数据挖掘技术起步较晚,近年来开始受到较为广泛的关注,一些代表性的国际会议包括:空间与时空数据挖掘(Spatial and Spatio-temporal Data Mining, SSDM)、国际知识发现与数据挖掘会议(International Conference on Knowledge Discovery and Data Mining, ICKDDM)、国际数据工程会议(International Conference on Data Engineering, ICDE)、国际地理信息系统发展会议(International Conference on Advances in Geographic Information Systems, ICAGIS)、国际时空数据库发展会议(International Symposium on Advances in Spatial and Temporal Databases, ISASTD)等,时空数据挖掘作为这些会议的重要议题,主要探讨时空数据挖掘的理论、模型、算法和应用等问题。 1.2 研究意义 “异常”*初被定义为严重偏离数据整体分布的观测对象,以至于令人怀疑它由不同机制产生(Hawkins, 1980)。在这种情况下,异常探测一方面可以过滤海量数据中的噪声,以达到数据清理的目的;另一方面可以发现一些不同寻常的行为或变化,以便及时采取应急或预防措施。例如,金融欺诈行为实际上是盗卡人的购买模式,与持卡人通常具有明显差异,通过对这类异常购买行为进行准确识别并进行重点关注,可以帮助持卡人发现信用卡被盗窃,从而**限度地降低持卡人的经济损失。 海量地理空间数据通常蕴含着丰富而又极其复杂的异常信息或异常模式,这些异常信息或异常模式可能是无用的噪声,亦可能代表着事物发展的某种特殊规律,如交通领域的交通拥堵事件、环境领域的土壤重金属污染、气象领域的厄尔尼诺现象、流行病领域的疾病暴发等,在现实生活中这些时空异常模式往往更能引起人们的关注。 ① 城市交通管制。通过有效识别城市交通拥堵事件,进一步分析交通拥堵的内在成因,有助于交通高效管制,方便市民制订合理的出行计划。 ② 环境保护。工业污染一直是严重的环境问题,工厂排出的废水废气严重影响土壤和空气质量,通过探寻污染异常严重的区域,有助于追根溯源,科学制定相关政策进行环境治理。 ③ 极端气候事件探测。十多年来,我国受极端气候的影响较为严重,造成了重大的人员伤亡和经济损失,通过时空异常探测手段对极端气候事件进行准确识别,可有助于深入分析极端气候事件的内在发展规律,为未来极端气候事件的准确预测奠定重要的先验知识。 ④ 流行病爆发热点探测。流行病的爆发通常呈现出时空聚集特性,根据大量的历史数据对流行病爆发热点进行探测识别,将有利于进一步掌握流行病爆发的时空演变规律,实现流行病爆发的准确预测。 因此,地理空间异常模式的高效探测已成为时空数据挖掘的重要研究内容之一,并引起了相关领域学者的广泛关注。 为了能够进一步准确预测时空异常事件(如极端气候事件)的发生和发展,需要研究时空异常事件间的关联机制,其主要目的在于深入挖掘时空异常事件的内因和外因,以及它们之间存在的单向或者双向甚至多向的影响链,亦有助于深入分析时空异常的可靠性。总而言之,时空异常模式属于地理空间数据中的一类特殊知识,可能蕴含着某些未知的、具有特殊意义的时空现象或时空变化规律,在气象、环保、交通等领域将具有重要的实际应用价值。 1.3 地理空间异常研究概况 自“异常”的概念被提出以来,计算机领域的学者针对事务型数据发展了大量异常探测法。随着空间数据挖掘的概念相继被提出(Li & Cheng, 1994),许多学者针对空间数据的特点提出了一系列空间异常探测方法。进入21世纪以来,学者们开始重点关注空间实体或现象的动态性及其演化规律或发展趋势,研究的注意力也从空间异常探测拓展到时空异常探测,甚至实时异常探测,并提出了诸多代表性方法。 通过对现有地理空间异常探测的相关研究进行归纳总结,本书以异常探测所涉及的数据类型为依据进行分类,大致分为以下类型:①基于位置信息的空间异常探测;②基于位置和属性信息的空间异常探测;③基于时间和位置信息的时空轨迹异常探测;④基于时间、位置和属性信息的时空序列异常探测。学者们针对不同类型的地理空间异常探测,从探测手段的角度进行更为细致的划分,并给出相应的探测方法,整个分类体系如表1.1所示。下面分别对各种类型地理空间异常探测研究进行详细阐述。 1. 基于位置信息的空间异常探测 自Hawkins提出“异常”的概念以来,来自计算机领域的学者们针对事务型数据发展了一系列异常探测方法,*初从全局角度提出了基于统计(Barnett & Lewis, 1994)、基于欧氏距离度量(Knorr & Ng, 1998)等的方法,后来又相继发展了基于局部密度度量(Breunig et al., 2000)、基于空间聚类(Jiang et al., 2001)及基于角度度量(Krirgel et al., 2008)等的方法。这些异常探测方法将数据的多维属性统一为一个高维向量进行差异性度量,因而可以直接用于仅包含位置信息的空间数据(如空间点事件)异常探测分析。 2. 基于位置和属性信息的空间异常探测 Shekhar等学者*早将空间异常定义为与其空间邻域内实体间专题属性值差异明显偏大,而在整体上与其他实体相比可能并无明显差异的空间实体(Shekhar et al., 2001; Shekhar &a
-
昆虫采集制作及主要目科简易识别手册
¥17.5¥50.0 -
勒维特之星-大发现系列丛书
¥4.0¥16.0 -
昆虫的生存之道
¥14.1¥38.0 -
改变世界的发现
¥16.8¥48.0 -
喜马拉雅山珍稀鸟类图鉴
¥27.9¥68.0 -
宇宙与人
¥12.3¥35.0 -
声音简史
¥18.2¥52.0 -
星空探奇
¥14.4¥39.0 -
古文诗词中的地球与环境事件
¥9.8¥28.0 -
隐秩序:适应性造就复杂性
¥14.7¥39.8 -
中国古代科学思想二十讲
¥15.1¥43.0 -
希格斯:“上帝粒子”的发明与发现
¥14.4¥48.0 -
民国时期机电技术
¥15.8¥45.0 -
不匹配的一对:动物王国的性别文化
¥13.7¥42.8 -
几何原本
¥35.6¥93.6 -
折纸中的几何练习
¥17.8¥48.0 -
宇宙、量子和人类心灵
¥43.5¥58.0 -
科学之死:20世纪科学哲学思想简史
¥16.0¥50.0 -
图说相对论(32开平装)
¥17.0¥46.0 -
自然感悟丛书街巷里的四季:成都草木寻踪
¥18.0¥50.0