×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
地球剖分时空数据库导论

地球剖分时空数据库导论

1星价 ¥86.4 (7.2折)
2星价¥86.4 定价¥120.0
暂无评论
图文详情
  • ISBN:9787030748652
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:210
  • 出版时间:2023-02-01
  • 条形码:9787030748652 ; 978-7-03-074865-2

内容简介

本书围绕空间信息数据库剖分存储与检索体系,系统论述了剖分数据库的概念与定义、时空编码、系统架构、时空存储结构、时空索引模型、时空查询计算、时空查询策略、时空引擎等技术体系的思路、模型和方法,展望了空间信息剖分数据库与时空引擎的应用前景。

目录


前言
第1章 概述 1
1.1 大数据与时空大数据 1
1.2 时空数据管理现状与发展趋势 2
1.3 时空数据库 4
1.4 地球剖分时空数据库 6
1.5 本章小结 7
第2章 地球空间剖分编码 8
2.1 GeoSOT地球剖分网格的提出 8
2.2 GeoSOT地球剖分网格的设计规约 8
2.3 GeoSOT地球剖分网格的平面剖分 12
2.4 GeoSOT地球剖分网格的立体剖分 17
2.5 GeoSOT地球剖分网格编码 34
2.6 本章小结 39
第3章 时间剖分编码 40
3.1 时间剖分编码的提出 40
3.2 单尺度时间剖分编码模型 43
3.3 多尺度时间剖分编码模型 45
3.4 时间跨度编码 57
3.5 时间剖分编码计算方法 59
3.6 时间剖分编码应用方法 60
3.7 本章小结 64
第4章 时空四维剖分编码与数据建模 65
4.1 时空对象 65
4.2 时空剖分网格与编码 69
4.3 时空对象建模 82
4.4 时空剖分编码生成与解码试验 85
4.5 本章小结 89
第5章 地球剖分时空数据库体系架构 90
5.1 经典数据库系统 90
5.2 分布式数据库系统 91
5.3 云数据库系统 95
5.4 地球剖分时空数据库架构 97
5.5 本章小结 100
第6章 地球剖分时空数据库存储结构 101
6.1 典型数据库存储结构 101
6.2 地球剖分时空数据库存储结构 107
6.3 基于时空网格的数据重分布机制 111
6.4 本章小结 113
第7章 地球剖分时空数据库索引模型 114
7.1 空间数据库索引 114
7.2 时空数据库索引 120
7.3 地球剖分时空索引模型 122
7.4 地球剖分时空索引构建与维护 126
7.5 本章小结 128
第8章 地球剖分时空数据库时空关系计算 129
8.1 空间关系计算 129
8.2 时间关系计算 141
8.3 空间分析计算 144
8.4 时空网格体元关系计算 152
8.5 时空网格体元关系计算试验 153
8.6 本章小结 156
第9章 地球剖分时空数据库查询策略 157
9.1 网格并行化处理策略 157
9.2 时空范围查询策略 158
9.3 KNN查询 162
9.4 本章小结 167
第10章 地球剖分时空引擎原型及试验 168
10.1 地球剖分时空引擎原型设计 168
10.2 时空数据加载试验 174
10.3 全局数据划分试验 175
10.4 时空数据部署试验 176
10.5 时空查询与分析试验 179
10.6 时空统计生成试验 185
10.7 时空伴随模式挖掘试验 187
10.8 本章小结 191
参考文献 192
图目录
图2.1 GeoSOT剖分网格的虚拟扩展示意图 13
图2.2 GeoSOT剖分的第0~第3级“度”级网格 14
图2.3 GeoSOT剖分的第10~第15级“分”级网格 15
图2.4 GeoSOT剖分的第16~第21级“秒”级网格 15
图2.5 GeoSOT两极地区剖分示意图 17
图2.6 GeoSOT-3D立体网格剖分 18
图2.7 地球立体空间 19
图2.8 基于经纬度坐标的地球立体空间 19
图2.9 GeoSOT-3D剖分0级网格 20
图2.10 GeoSOT-3D剖分1级网格立体视图(a)和顶视图(b) 20
图2.11 GeoSOT-3D剖分1级网格实际形状 21
图2.12 GeoSOT-3D剖分2级网格立体视图(a)和顶视图(b) 22
图2.13 GeoSOT-3D剖分2级部分网格实际形状 23
图2.14 GeoSOT-3D剖分3级网格立体视图(a)和顶视图(b) 23
图2.15 GeoSOT-3D剖分3级部分网格实际形状 24
图2.16 GeoSOT-3D剖分4级网格立体视图(a)和顶视图(b) 25
图2.17 GeoSOT-3D剖分4级部分网格实际形状 25
图2.18 GeoSOT-3D剖分5级网格立体视图(a)和顶视图(b) 26
图2.19 GeoSOT-3D剖分6级网格立体视图(a)和顶视图(b) 26
图2.20 GeoSOT-3D剖分6级部分网格实际形状 27
图2.21 GeoSOT剖分7级网格立体视图(a)和顶视图(b) 27
图2.22 GeoSOT-3D剖分7级部分网格实际形状 28
图2.23 GeoSOT-3D9级体块扩展示意图 29
图2.24 非等距高程地球立体空间及高度域网格粒度关系示意图 31
图2.25 GeoSOT剖分框架的四种编码形式 35
图2.26 三维填充Z序曲线及其顶视图 35
图2.27 二进制一维编码方案构成 36
图2.28 GeoSOT-3D二进制三维编码 36
图2.29 GeoSOT剖分框架编码间的转换 37
图2.30 GeoSOT剖分框架编码与坐标系统间的转换关系 38
图3.1 时间剖分编码模型总体架构 42
图3.2 单尺度时间剖分编码结构示意图 43
图目录
图2.1 GeoSOT剖分网格的虚拟扩展示意图 13
图2.2 GeoSOT剖分的第0~第3级“度”级网格 14
图2.3 GeoSOT剖分的第10~第15级“分”级网格 15
图2.4 GeoSOT剖分的第16~第21级“秒”级网格 15
图2.5 GeoSOT两极地区剖分示意图 17
图2.6 GeoSOT-3D立体网格剖分 18
图2.7 地球立体空间 19
图2.8 基于经纬度坐标的地球立体空间 19
图2.9 GeoSOT-3D剖分0级网格 20
图2.10 GeoSOT-3D剖分1级网格立体视图(a)和顶视图(b) 20
图2.11 GeoSOT-3D剖分1级网格实际形状 21
图2.12 GeoSOT-3D剖分2级网格立体视图(a)和顶视图(b) 22
图2.13 GeoSOT-3D剖分2级部分网格实际形状 23
图2.14 GeoSOT-3D剖分3级网格立体视图(a)和顶视图(b) 23
图2.15 GeoSOT-3D剖分3级部分网格实际形状 24
图2.16 GeoSOT-3D剖分4级网格立体视图(a)和顶视图(b) 25
图2.17 GeoSOT-3D剖分4级部分网格实际形状 25
图2.18 GeoSOT-3D剖分5级网格立体视图(a)和顶视图(b) 26
图2.19 GeoSOT-3D剖分6级网格立体视图(a)和顶视图(b) 26
图2.20 GeoSOT-3D剖分6级部分网格实际形状 27
图2.21 GeoSOT剖分7级网格立体视图(a)和顶视图(b) 27
图2.22 GeoSOT-3D剖分7级部分网格实际形状 28
图2.23 GeoSOT-3D9级体块扩展示意图 29
图2.24 非等距高程地球立体空间及高度域网格粒度关系示意图 31
图2.25 GeoSOT剖分框架的四种编码形式 35
图2.26 三维填充Z序曲线及其顶视图 35
图2.27 二进制一维编码方案构成 36
图2.28 GeoSOT-3D二进制三维编码 36
图2.29 GeoSOT剖分框架编码间的转换 37
图2.30 GeoSOT剖分框架编码与坐标系统间的转换关系 38
图3.1 时间剖分编码模型总体架构 42
图3.2 单尺度时间剖分编码结构示意图 43
图6.1 基于关系型数据库的时空数据存储管理系统分类 101
图6.2 基于数据模型的NoSQL 数据库系统分类 104
图6.3 不同子划分单元上数据访问频率分布示例 109
图7.1 R树索引结构 114
图7.2 分布式存储系统中名称节点与数据节点 115
图7.3 二维与三维Z阶曲线 117
图7.4 Geohash两种常见的编码形式 118
图7.5 二维与三维Hilbert曲线 119
图7.6 S2值生成流程 120
图7.7 地球剖分网格两级索引结构 123
图7.8 空间域四叉树划分的不均衡现象(θ=5) 124
图7.9 索引键结构 126
图7.10 基于MapReduce的时空网格索引并行构建 127
图8.1 两种不同的空间关系示意图 129
图8.2 网格膨胀结果示意图 130
图8.3 两个实体的Voronoi边界终止情形示意图 131
图8.4 两个实体对象的球面Voronoi计算结果图 132
图8.5 含有空洞的对象Voronoi图 133
图8.6 实体之间相离关系的四种情形 134
图8.7 实体之间相接关系的三种情形 135
图8.8 实体之间相交关系的四种情形 135
图8.9 实体之间包含关系的四种情形 136
图8.10 膨胀路径逆向追溯的过程图 138
图8.11 两个实体形心之间的方位关系示意图 139
图8.12 边界的方位分类模板示意图 139
图8.13 实体对象的方位关系判断方法示意图 140
图8.14 实体对象的方位关系定量计算方法示意图 140
图8.15 Allen提出的13种时态关系 141
图8.16 剖分体元集合缓冲区网格分析流程图 144
图8.17 剖分多路径原理示意图 146
图8.18 空间叠加运算示意图 147
图8.19 剖分体元间并运算流程图 147
图8.20 剖分体元集合间交运算流程图 148
图8.21 剖分体元集合间并运算流程图 148
图8.22 地理空间与剖分空间各层级网格数量对比图 149
图8.23 空间数据的剖分表达效果图 150
图8.24 剖分数据的绘制过程示意图 151
图8.25 剖分数据绘制的屏幕分辨率转换示意图 152
图8.26 基于不同形式编码的包含关系判断 154
图8.27 基于不同形式编码的邻域关系判断 155
图9.1 查询条件转换的一般过程 159
图9.2 时空范围查询条件的分解与合并示例 161
图9.3 并行化时空范围查询 161
图9.4 时空KNN查询区域扩展 164
图10.1 GeoSOT-STDOM系统架构与功能模块 168
图10.2 基于GeoSOT-STDOM的多源异构数据集成组织 169
图10.3 数据剖分预处理步骤 170
图10.4 物理视图 171
图10.5 GeoSOT-STDOM两层索引结构 172
图10.6 GeoSOT-STDOM的数据分布示例 172
图10.7 GeoSOT-STDOM的查询处理流程 173
图10.8 数据入库试验结果示意图 175
图10.9 全局划分数据分布 176
图10.10 集群节点层数据的访问时间分布 177
图10.11 集群节点层数据的访问时间分布标准差 178
图10.12 集群节点层的数据量分布 
展开全部

节选

第1章概述 1.1大数据与时空大数据 随着信息技术快速发展,无所不在的传感器网产生了反映自然和人类活动的百万兆(TB)级到十亿兆(PB)级,乃至万亿兆(EB)级数据。2008年9月,Nature上刊登了一篇名为BigData:Wiklomlcs的文章,“大数据”一词由此拉开序幕。2011年2月,Science 也出版了专刊Dealing with Data。2012年3月,美国投资2亿美元启动大数据研究和发展计划,旨在提高和改进人们从大数据中获取知识的能力。面对大数据时代的挑战与机遇,国际上的专家学者针对大数据处理开展了一系列的探索和研究。2012年,在印度首都新德里举行的“首届大数据分析国际会议”上,与会代表达成共识,认为大数据的表达、检索、挖掘是大数据处理面临的三大挑战。 目前,对大数据的研究已经逐渐发展成为信息科学的主要研究热点之一。然而,迄今为止,“大数据科学”尚未有统一的定义。但是,科学家普遍认为它是以海量的多元异构数据为主要研究对象,以大数据的存储、处理和理解方法为主要研究内容,以新兴的计算技术为主要研究工具,以扩展人类对数据的利用能力为主要目标的一门新兴的综合性学科。它主要针对当前海量(volume)、多元(variety)和高速更新(velocity)数据处理的瓶颈问题,重点研究如何将当前高速发展的计算技术用于数据处理与挖掘、有效地利用数据、从海量多元的数据本身去发现新的知识。 越来越多的数据使世界进入真正的大数据时代。其中,大量与时空位置有关的数据称为时空大数据。据不完全统计,全世界80%以上的数据都与位置、时间相关。因此,时空大数据也是大数据的重要组成部分。时空大数据由于其所在空间的空间实体和空间现象在时间、空间和属性三个方面的固有特征,呈现出多维、语义、时空动态关联的复杂性。因此,时空大数据多维关联描述的形式化表达、关联关系动态建模与多尺度关联分析方法、时空大数据协同计算与重构等都是时空大数据研究的重点和热点: (1)时空大数据包含对象、过程、事件在空间、时间、语义等方面的关联关系。 (2)时空大数据具有时变、空变、动态、多维演化等特点,这些基于对象、过程、事件的时空变化是可度量的,其变化过程可作为事件来描述,通过对象、过程、事件的关联映射,可建立时空大数据的动态关联模型。 (3)时空大数据具有多尺度特性,可建立时空大数据时空演化关联关系的尺度选择机制;针对不同尺度时空大数据的时空演化特点,可实现对象、过程、事件关联关系的尺度转换与重建,进而实现对时空大数据的多尺度关联分析。 (4)时空大数据时空变化具有多类型、多尺度、多维、动态关联等特点,对关联约束可进行面向任务的分类分级,建立面向任务的关联约束选择、重构与更新机制,根据关联约束之间的相关性,可建立面向任务的关联约束启发式生成方法。 (5)时空大数据具有时间和空间维度上的特点,实时地抽取阶段行为的时空特征,以及参考时空关联约束建立态势模型,实时地觉察、理解和预测导致某特定阶段行为发生的态势。可针对时空大数据事件理解与预测问题,研究空间大数据事件行为的本体建模和规则库构建,为异常事件的模式挖掘和主动预警提供知识保障;可针对相似的行为特征、时空约束和事件级别,来挖掘事件模式并构建大尺度事件及其应对方案的规则库。 1.2时空数据管理现状与发展趋势 1.时空数据模型的发展 时间、空间、属性是空间对象的固有特性。将时间用于空间对象的历史序列,*简单的方法就是米用快照浏览模式,即同样的地理信息系统(geographic information system,GIS)空间数据,均按不同时相单独保存。随着时间序列的增长,这种管理方式所产生的数据量惊人。当需要对空间数据进行时间钻取操作以观察历史变化时,这种快照方式缺乏时空语义,难以反映空间对象时间序列的前后变化及其关系。这种GIS只是解决了海量数据的存储问题,无法呈现空间对象的历史追溯过程。因此,人们开始研究时空数据模型(spatial-temporal data model,STDM)来解决上述问题。 对时空数据模型的研究,始于20世纪70年代末。Berry于1964年提出了能够管理时空数据的地理时空矩阵模型;Thrift于1977年提出了“TGIS3”的概念;Longan从时变数据存储的角度出发,总结了时空立方体、快照序列、基态修正和时空复合共四种时态数据模型;Worboys建立了时空对象模型;Donna提出了一种基于事件的时空数据模型ESTDM,表达了离散时空对象的等级结构,将每个栅格的属性记录到数组中,以表达记录随时间变化的地理现象;Raper等开发了一种面向对象的地形数据模型OOgeomorph;May提出了一种集对象模型与连续场模型于一体的概念框架,并以暴雨为例,阐述了表达事件与过程的动态地理现象的方法。许多学者对时空数据模型有着广泛的关注,并推出了许多新的模型。其中,比较典型的有快照模型、修正基态模型、时空复合数据模型、基于事件的时空数据模型、三维模型、历史图形模型、对象关系模型、面向对象的时空数据模型、联合时空数据模型和移动数据对象模型。针对时空大数据云计算和并行处理的要求,为此,Zhu Dingju提出了云并行时空数据模型的概念、划分方法和数学公式,以智能地找到云并行时空数据模型的*佳参数,用于解决云并行计算环境中并行加速率或并行效率*高的问题的数据模型。 目前,实现大规模时空数据存储管理主要有两种方式:**种是结合已有的时空索引方法,基于通用的大数据存储管理系统对其进行改造,使之适用于时空数据;另一种是建立单独的分布式并行时空索引结构,不依赖于现有系统,而形成大规模时空数据存储管理的专用系统。 2.时空数据管理面临的挑战 随着数据量级从百万兆(TB)级到十亿兆(PB)级、万亿兆(EB)级的爆炸式增长,时空数据的组织、存储、管理模式和技术体系都将面临空前的挑战。 1)时空数据组织问题 长期以来,地理信息科学领域研究倾向于关注空间属性。在很多传统空间应用中,由于空间数据的采样时间间隔较长,时间信息通常只是作为空间对象的属性之一,用于标识空间数据的采样时间点。随着泛在感知系统的发展和普及,使得连续地、近实时地采集位置信息成为可能,由此产生了大量具有高时空分辨率的数据,传统空间应用中对时间信息的组织方式难以对这些丰富的信息进行充分利用。 时空数据应用往往是同时基于空间维和时间维,所以时空一体化组织需求越来越迫切。然而,现有研究受传统空间应用的影响,在数据组织时虽对空间属性和时间属性的整合展开了尝试,但大部分采用的是时空分治的思想,即以空间优先或时间优先的方式进行数据组织。这种数据组织方式使得空间维和时间维不具备同等权重,难以为后续基于时空范围的数据快速存取和时空高效应用提供有效的底层组织机制。 2)时空数据存储管理问题 经典的集中式架构已经很难应对大规模时空数据存储管理需求。分布式云存储环境下的NoSQL数据系统,具有水平可扩展性强、并发性能好、数据模型灵活等优点,非常适合于大规模数据存储管理。然而,分布式NoSQL数据存储并非专门针对时空数据设计,直接利用这些数据系统存储管理时空数据仍存在一系列技术瓶颈。 (1)难以保证时空数据的局部性。NoSQL数据系统通过划分策略(partitioning),将大规模数据集划分为大小可管理的子数据集,并部署到集群的多个服务器节点上,为系统的水平可扩展性提供解决方案;同时,系统利用数据的均匀分布将负载压力分散到集群中不同的节点上,以平衡负载,应对高并发访问场景。 NoSQL数据存储的划分机制主要是为了让数据均匀地分布在集群中。然而,由于分布式NoSQL数据存储并非专门针对时空数据设计,其划分时没有考虑数据的时空邻近性。因此,在数据划分过程中,可能使得一些原本在时空上相邻的数据对象被分至不同的子划分块中,存储到不同的服务器节点上。这种数据分布方式使得时空应用中数据取回代价大。考虑以下应用场景:查询17~18时经过机场附近的出租车,当时空数据分散在大量不同的子划分块时,面对上述时空查询,即使只对较小时空范围的数据进行取回,仍需要访问大量的子划分块,磁盘访问I/O代价很大。 (2)时空邻近性与负载均衡的权衡问题。为保持数据良好的局部性,针对上述问题,许多研究将空间上或时空上邻近的数据对象尽可能存储在同一子划分块。通过这种方式,上述时空范围查询操作,只需要访问指定时空范围与查询条件对应的子划分块,这样大大减少了对大量无效的子划分块读取,从而提高时空查询的效率。 然而,将时空邻近的数据存储在一起将带来另一个挑战,即数据倾斜问题。感知设备节点的空间不均匀分布、人类移动模式与城市结构的强相关,以及热点事件的产生,都是驱动特定时空范围内数据读写访问请求远大于其他时空范围的因素。如基站分布密度在地理空间上存在的区域不平衡性(10~100倍差异),使得移动手机蜂窝基站数据产生,城市中心地区远多于郊区;每天早晚高峰时期,城市居民对特定路段拥堵情况发出查询请求;数万人在演出活动结束后发送打车请求等等。这些场景中,当数据按照时空邻近性存储时,将不可避免地使得存储相应时空范围的子划分块热度极高,导致集群中相应服务器节点过载。 (3)位置语义决定的数据访问模式带来周期性空间热点问题。时空应用中天然存在着动态热点。除了热点事件的产生之外,其他许多空间热点在时间维上都具有周期性规律。这些具有周期性规律的热点,通常是由空间位置语义决定的。例如,通过对北京微博签到数据分析,研究人员发现,居民倾向于选择在下午时段内,在繁华的商业区进行社交活动,签到数据在11~17时主城区的繁华商业地段这一时空范围内存在热点。若数据按照空间邻近性存储,相应空间范围将在11~17点产生大量数据读写请求,而在其他时间段产生的数据访问请求较少,且该规律呈现出周期性特点。面对这一问题,现有研究在存储管理时空数据时,通常利用不断分裂子划分块来消除热点影响,很少利用空间热点的周期性特征。 3)时空数据应用问题 现有NoSQL数据存储提供的是键值对(key-value)模式的查询,基于行键的数据查询非常高效,但并不天然支持除行键之外其他列上的索引,其在多维度复杂查询上具有局限性。当要进行多维度查询时,需要对整个表进行扫描,这样将导致查询效率低下。因此,其并不适用于具有多维度特征的时空数据查询应用。 除此之外,考虑到时空数据的庞大规模,为了实现高效的时空应用,需要充分发挥分布式数据存储管理平台的并行计算优势。以Hadoop框架和MapReduce模型为代表,它们为并行化时空查询与分析应用提供了有效机制,但现有研究中面向大规模时空数据的应用方法还不够完善,尚未能充分发挥分布式系统架构的并行计算优势。 时空数据模型能够对时间、空间和属性语义等方面的数据实施有效的组织和管理,是能客观、完整地模拟现实地理世界的数据模型,是应对大数据挑战的主要技术抓手,可为时空大数据的组织、存储和管理提供高效的解决方案。在有效组织管理的基础上,通过时空数据建模,可以利用时空大数据快速直观地反映动态变化目标的多时态性和分布性,在航空航天、航海、交通、国土、市政、物流以及救灾等领域有着广阔的应用前景。 1.3时空数据库 1.时空数据库的概念 时空数据库是专门用于处理时空对象的存储、访问、索引、查询的数据库。从发展趋势上看,时空数据库可以看作是空间数据库的扩展,因为研究时空数据库的方法常常是基于空间数据库现有方法的拓展,如R树索引、过滤-精炼的查询处理机制等。在此基础上,时空数据模型必须能够捕捉时空对象的特性并加以处理,而且能够表达时空对象的语法和语义;时空数据索引必须能够提供高效的时空数据检索机制;时空操作和时空查询需要

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航