交通时空大数据分析、挖掘与可视化(Python版)
- ISBN:9787302611967
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:450
- 出版时间:2022-09-01
- 条形码:9787302611967 ; 978-7-302-61196-7
本书特色
交通领域需要有一本图书能够系统地梳理交通时空数据处理中所涉及的各种基 础知识,总结数据处理过程中的各类解决方案,介绍如何用跨学科的方法从数据中挖掘出 有价值的信息
内容简介
大数据时代已经到来,随着数据的逐步开放,交通领域的研究课题或多或少都要接触、使用时空 大数据。交通领域的从业者迫切需要强有力的工具和技术应对日益纷杂的交通数据。交通是一个交叉 学科,交通数据分析人才的知识体系需要与数据处理、网络爬虫、数据可视化、地理信息、复杂网络、 数据挖掘、机器学习等多学科知识深度融合,这也为交通领域的人才培养带来巨大挑战。 在此背景下,本书针对不同的学习阶段与业务需求设计了三篇共15章内容。基础篇(第1~5章) 梳理Python数据分析、网络爬虫、数据可视化、地理信息等基础知识;应用篇(第6~10章)介绍 出租车GPS数据、地铁IC刷卡数据、共享单车订单数据、公交GPS数据等各类时空大数据的实际案 例应用;方法篇(第11~15章)融汇数据挖掘、空间统计、复杂网络学科等交叉学科方法,与交通 领域的大量实际案例分析结合,全面梳理总结交通时空大数据所需跨学科技能。 本书由浅入深,学科交叉,强调实践。对读者不同的学习阶段与业务需求设计相应内容,全面梳 理总结交通大数据科研所需技能,并与交通领域的大量实际案例分析结合。本书可作为教材也可作为 参考工具书,基础篇定位交通数据领域新手入门,应用篇定位有数据分析需求的高校学生或社会人士, 方法篇定位高校学术科研人员。
目录
基??础??篇
第1章 绪论 2
1.1??多源交通时空大数据简介 2
1.1.1??传统集计统计数据 3
1.1.2??个体连续追踪数据 4
1.1.3??地理空间信息数据 5
1.2??为什么要用Python处理交通大数据 6
1.2.1??常用数据处理技术 6
1.2.2??Python在交通大数据领域中的优势 8
1.2.3??Python与SQL的比较 9
1.3??大规模数据处理的解决方案 9
1.3.1??决定大数据处理性能的三个硬件要素 9
1.3.2??分布式数据处理架构 11
1.4??本章习题 14
第2章 Python数据处理基础 15
2.1??Python的环境配置 15
2.1.1??Python的集成开发环境 15
2.1.2??Anaconda的安装 16
2.1.3??Jupyter Notebook的使用 16
2.1.4??Python第三方库的安装 18
2.2??Python基本语法 19
2.2.1??对象与变量 19
2.2.2??运算符 20
2.2.3??内置数据类型 20
2.2.4??语句 24
2.2.5??函数 26
2.2.6??包的使用 27
2.2.7??数据分析常用第三方库简介 28
2.3??pandas数据处理基础 29
2.3.1??数据文件的编码格式与存储形式 30
2.3.2??数据表的行列处理 33
2.3.3??数据的表格运算 41
2.4??时空大数据的处理思维 46
2.4.1??复杂数据处理任务的解决思路 46
2.4.2??数据处理任务分解实例:地铁换乘量识别 49
2.5??数据处理中表格运算的常用技巧 51
2.5.1??分组编号 51
2.5.2??去除重复的记录 53
2.5.3??个体ID重新编号 54
2.5.4??生成数据之间的对应表 55
2.5.5??时空插值 58
2.6??本章习题 60
2.6.1??思考题 60
2.6.2??Python基础代码练习 60
2.6.3??pandas基础代码练习 62
第3章 数据可视化基础 64
3.1??可视化的基本原则 64
3.1.1??为什么要可视化 64
3.1.2??可视化的基本原则 65
3.1.3??可视化中需要注意的问题 69
3.2??可视化的颜色选择 69
3.2.1??可视化的配色为什么重要 69
3.2.2??可视化的颜色色相的选择 70
3.2.3??颜色空间 72
3.2.4??Brewer调色板 73
3.3??可视化的图表类型 75
3.3.1??可视化图表的类型与选择思路 75
3.3.2??对比型图表 77
3.3.3??趋势型图表 82
3.3.4??分布型图表 86
3.3.5??构成型图表 95
3.3.6??联系型图表 98
3.4??可视化的技术与工具 101
3.4.1??常用可视化工具简介 101
3.4.2 Web数据可视化技术 102
3.4.3??时空大数据的Web可视化 105
3.5??本章习题 107
第4章 地理信息处理基础 108
4.1??GIS的基本概念 108
4.1.1??什么是GIS 108
4.1.2??互联网+GIS:基于位置的服务LBS 109
4.1.3??常用的GIS工具 110
4.2??空间数据的基本概念 112
4.2.1??空间数据结构 112
4.2.2??空间数据文件 114
4.3??坐标系的基本概念 118
4.3.1??地理坐标系与投影坐标系 118
4.3.2 火星坐标系 123
4.3.3??地理空间数据的坐标系定义与转换 124
4.4??栅格化 126
4.4.1??为什么数据需要栅格化 126
4.4.2??栅格化的基本原理 127
4.5??地图底图 131
4.5.1??瓦片地图:Web地图的加载原理 131
4.5.2 Python中地图底图的加载 132
4.6??本章习题 134
第5章 网络爬虫基础 135
5.1??网络爬虫的基本概念 135
5.1.1??什么是网络爬虫 135
5.1.2??为什么要用爬虫 136
5.1.3??爬虫的注意事项 137
5.2??网络加载、请求与解析 138
5.2.1??网页的加载 138
5.2.2??网页的请求 140
5.2.3??网页的解析 146
5.3??开放平台 150
5.3.1??什么是开放平台 150
5.3.2??什么是API和SDK 150
5.3.3??地图开放平台 151
5.4??常见数据的爬虫思路 152
5.4.1??公交与地铁线网数据 152
5.4.2??行政区划矢量面数据 153
5.4.3??POI数据 154
5.4.4??房价数据 155
5.4.5??路网数据 155
5.4.6??数据爬取的注意事项 156
5.5??本章习题 156
应??用??篇
第6章 出租车GPS数据—时空大数据处理基础 158
6.1??出租车GPS数据简介 158
6.2??出租车GPS数据的读取与数据清洗 159
6.2.1??数据的读取 159
6.2.2??数据异常的清洗 160
6.3??出租车数据的时间完整性评估 166
6.3.1??时空大数据的质量评估 166
6.3.2??出租车GPS数据的时间完整性评估 167
6.4??出租车数据的空间完整性评估 172
6.4.1??出租车GPS数据空间分布栅格图 173
6.4.2??出租车GPS数据空间分布散点图 180
6.4.3??出租车GPS数据空间分布热力图 182
6.4.4??数据分布不同绘制方式的总结 185
6.5??出租车订单出行特征分析 187
6.5.1??出租车出行订单的OD提取 187
6.5.2??出租车出行订单持续时间的统计 191
6.5.3??出租车出行订单的栅格OD可视化 194
6.5.4??出租车出行的OD期望线绘制 199
6.6??本章习题 203
第7章
地铁IC刷卡数据—城市轨道交通客流分析 204
7.1??数据与思路 204
7.1.1??IC刷卡数据简介 204
7.1.2??地铁线路与站点GIS数据简介 205
7.1.3??思路简介 205
7.2??地铁拓扑网络的构建 206
7.2.1??地铁网络构建思路 206
7.2.2??地铁线网数据读取与整理 208
7.2.3??网络的轨道边 209
7.2.4??网络的换乘边 211
7.2.5??网络的构建 213
7.3??地铁出行路径提取 214
7.3.1??IC刷卡数据中的OD提取 215
7.3.2??出行路径提取 217
7.4??轨道断面客流分布可视化 220
7.4.1??断面客流集计 220
7.4.2??断面客流分布绘制 222
7.5??轨道断面客流蛛网图可视化 226
7.5.1??可视化思路 226
7.5.2??断面线型的生成 227
7.5.3??线型平移与可视化绘制 233
7.6??本章习题 236
第8章
共享单车数据—轨道站点衔接需求分析 237
8.1??共享单车数据简介 237
8.2??共享单车的出行链重构 239
8.2.1??出行链重构思路 239
8.2.2??出行链重构的代码实现 240
8.2.3??骑行与停车提取 242
8.3??共享单车使用特征分析 243
8.3.1??骑行距离 244
8.3.2??骑行次数 246
8.3.3??用车时长 248
8.3.4??停车时长与单车利用率 250
8.4??轨道衔接出行识别 252
8.4.1??KDTree空间搜索算法的原理 253
8.4.2??KDTree的代码实现 255
8.4.3??KDTree识别轨道衔接出行 256
8.4.4??轨道衔接单车骑行范围分析 258
8.5??本章习题 262
第9章
公交GPS数据—城市公交运行状况分析 263
9.1??公交GPS数据简介 263
9.2??公交GPS数据的预处理 266
9.2.1??采样间隔 266
9.2.2??地图匹配 269
9.3??公交车辆运行图绘制 274
9.3.1??单辆车的运行图绘制 275
9.3.2??多辆车的运行图绘制 278
9.4??公交到离站信息识别 281
9.4.1??识别思路 281
9.4.2??单辆车到离站识别的代码实现 282
9.4.3??多辆车到离站信息的批量识别 288
9.5??公交运行指标 290
9.5.1??单程耗时与运营速度 290
9.5.2??到站间隔 294
9.6??本章习题 296
第10章
TransBigData—交通时空大数据处理、分析可视化工具 297
10.1??TransBigData简介 297
10.2??TransBigData的方法介绍 298
10.2.1??数据质量分析与数据预处理 298
10.2.2??数据栅格化 299
10.2.3??数据聚合集计 300
10.2.4??数据可视化 300
10.2.5??轨迹数据处理 301
10.2.6??GIS处理方法 301
10.2.7??地图底图加载 302
10.2.8??坐标转换与距离计算 302
10.2.9??数据获取 303
10.3??TransBigData使用示例 303
10.4??本章习题 310
方??法??篇
第11章 聚类 312
11.1??什么是聚类 312
11.2??K-均值聚类 313
11.3??密度聚类DBSCAN 314
11.4??层次聚类Hierarchical 315
11.5??实例:基于sklearn包的聚类算法的实现 318
11.5.1??测试数据集的生成 318
11.5.2??聚类方法的实现 321
11.5.3??聚类结果的比较 322
11.6??
实例:DBSCAN密度聚类算法识别共享单车停车聚集区域 325
11.6.1??共享单车停车存量识别 325
11.6.2??DBSCAN识别共享单车停车聚集区域 327
11.7??本章习题 329
第12章 分类 330
12.1??什么是分类 330
12.2??分类算法的介绍 331
12.2.1??K邻近 331
12.2.2??支持向量机 332
12.2.3??决策树 334
12.2.4??随机森林 338
12.2.5??逻辑回归 338
12.2.6??人工神经网络 339
12.3??分类模型的评价 340
12.3.1??数据集的划分与交叉验证 340
12.3.2??混淆矩阵 341
12.3.3??ROC曲线和AUC值 342
12.4??实例:基于sklearn包的分类算法的实现 344
12.4.1??分类算法实现与决策边界绘制 344
12.4.2??分类模型的代码实现 345
12.4.3??模型评价 347
12.5??本章习题 348
第13章 降维与矩阵分解 349
13.1??什么是降维 349
13.2??主成分分析 350
13.2.1??PCA是什么 350
13.2.2??PCA的原理与求解 352
13.2.3??PCA的代码实现 359
13.3??奇异值分解 366
13.3.1??SVD是什么 366
13.3.2??SVD的求解 368
13.3.3??SVD的代码实现 371
13.4??非负矩阵分解 376
13.4.1??什么是NMF 376
13.4.2??NMF的代码实现 378
13.5??鲁棒主成分分析 382
13.5.1??为什么要有RPCA 382
13.5.2??RPCA的求解 382
13.5.3??RPCA的代码实现 384
13.6??实例:利用SVD分解分析出租车需求模式 386
13.6.1??矩阵分解如何帮助理解时空矩阵 386
13.6.2??利用SVD分解分析出租车需求模式 389
13.6.3??结果分析 397
13.7??本章习题 398
第14章 空间统计 399
14.1??什么是空间统计 399
14.1.1??空间统计简介 399
14.1.2??PySAL:在Python中实现空间统计 400
14.2??空间关系权重 400
14.2.1??空间关系权重的定义 400
14.2.2??空间关系权重的选择 402
14.2.3??Python中空间关系权重的获取 403
14.3??空间自相关与热点分析 407
14.3.1??空间自相关 407
14.3.2??热点分析 410
14.3.3??Python空间自相关与热点分析 412
14.4??地理加权回归 417
14.4.1??线性回归与*小二乘法 417
14.4.2??地理加权回归 419
14.4.3??Python地理加权回归 421
14.5??本章习题 431
第15章 复杂网络与社区发现 432
15.1??什么是复杂网络 432
15.1.1??网络的基本概念 432
15.1.2??复杂网络的特性 433
15.2??社区发现的原理与实现 434
15.2.1??复杂网络中的社区 434
15.2.2??非重叠社区划分算法 435
15.2.3??重叠社区划分算法 436
15.3??实例:基于社区发现的共享单车市场导向分区 438
15.3.1??课题思路 438
15.3.2??数据预处理 440
15.3.3??网络构建 442
16.3.4??社区发现与结果整理 444
16.3.5??结果的可视化 447
15.4??本章习题 450
作者简介
余庆(交通数据小旭学长) 博士,南方科技大学斯发基斯可信自主系统研究院助理研究员,交通时空大数据开源Python库TransBigData作者。B站交通时空大数据相关视频课程总播放量超过80万。2022年博士毕业于同济大学交通运输工程专业,博士期间赴日本东京大学公派联合培养,主要研究方向为交通大数据分析、数据可视化、城市计算,发表SCI论文十余篇。自2020年起在B站上制作交通时空大数据相关课程,涵盖时空数据处理、数据可视化等。 李玮峰 同济大学交通运输工程学院助理研究员,博士。主要研究方向为交通规划、智能交通系统规划和交通大数据分析。参加国家重点研发计划项目1项、国家自然科学基金重点项目2项、面上项目2项,国家科技支撑计划项目2项,同时参加地方政府和科研院所的研究与咨询项目多项。发表期刊及会议论文50余篇,其中SCI收录16篇、EI收录20余篇;完成专著3本;获得发明专利4项,软件著作权3项。
-
铁道之旅:19世纪空间与时间的工业化
¥20.7¥59.0 -
金属材料及热处理
¥46.1¥72.0 -
实用电气计算
¥64.2¥88.0 -
实用精细化学品丛书--陶瓷添加剂:配方·性能·应用(第二版)
¥51.8¥69.0 -
中国传统民俗文化:建筑系列:中国古代桥梁
¥20.9¥58.0 -
嗨印刷工艺(Vol1烫印)(精)
¥147.4¥268.0 -
西门子S7-1200 PLC项目化教程
¥39.4¥54.0 -
气动系统装调与PLC控制
¥29.1¥39.8 -
高聚物粘结及其性能
¥34.8¥120.0 -
液压控制系统
¥12.7¥31.0 -
汽车风云人物
¥20.5¥50.0 -
品牌鞋靴产品策划-从创意到产品
¥26.5¥42.0 -
城市桥梁工程施工与质量验收手册-(含光盘)
¥61.6¥78.0 -
城镇道路工程施工与质量验收规范实施手册
¥16.4¥39.0 -
毛皮加工及质量鉴定
¥1.6¥6.0 -
航空发动机限寿件概率损伤容限评估概述
¥67.8¥88.0 -
天才武器
¥42.0¥60.0 -
中国再制造进展
¥88.5¥118.0 -
中国烹饪工艺学粤菜教程
¥48.4¥59.8 -
欧亚大陆北部的树皮船与兽皮船
¥132.3¥189.0