企业级数据架构:核心要素、架构模型、数据管理与平台搭建
- ISBN:9787111746829
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:325
- 出版时间:2024-02-01
- 条形码:9787111746829 ; 978-7-111-74682-9
本书特色
(1)作者经验丰富:头部保险资管公司深数据架构师,从事数据相关工作10余年,在数据架构、数据治理、数据资产管理等领域积累了丰富的经验。 (2)理论系统全面:系统梳理和阐述了企业架构的基础知识,以及数据架构的组成要素、架构模型、数据治理和数据资产管理的理论知识。 (3)实战案例丰富:用大量案例辅助理论讲解,同时用离线计算和实时计算两大场景的综合案例进行了详细展示。 (4)资深专家推荐:平安集团首席架构师与平安资管总经理等多位专家联袂推荐。
内容简介
这是一部从企业架构视角系统讲解企业级数据架构的著作,包含数据架构的原理、方法和实践。 本书拟分为四个部分共17个章节来系统性的阐述数据架构相关内容; 第1部分 架构基础主要包含1个章节 1.数据架构与企业架构 其主要从宏观的角度阐述企业架构与数据架构的关系以及重要性使读者明白数据架构并不是孤立存在的且与企业架构息息相关 第2部分 数据架构基础主要包含5个章节从理论以及工具层面阐述数据架构的构成 2.数据架构构成 介绍数据架构的主要组成以及框架 3.数据存储 数据架构落地中常见的存储选型以及实用场景 4.数据调度与消息传输 数据架构中调度服务以及消息传输的通用技术选型以及可能出现的关键问题以及优化手段 5.Lambda架构与Kappa架构 系统性的阐述主流的两种数据架构以及使用场景 6.辅助类组件 数据架构中帮助测试以及运维人员精准的定位问题的相关辅助组件,例如日志收集、系统监控以及APM等 第3部分 数据架构实践 基于大量的业务实践,总结数据架构实践中核心组组成以及关键方法进行拆解 7.企业数据区域以及流向 以不同的维度去拆解企业的数据,帮助读者构建数据架构的落地层面的意识,知道为什么拆以及如何去拆 8.模型架构详解 以主流的两种建模方法论为切入点,讨论并对比优劣并让读者拓展模型设计中的工具箱。 9.模型设计 以维度建模为例,详细的介绍不同数据层级、不同类型数据的建模方法,具体案例来源于大量的模型实践 10.元数据 了解什么是元数据及其重要性以及如何管理数据 11.数据质量 基于数据质量去设计数据质量监控体系,做好事前防范、事后治理 12.数据标准 构建数据标准框架以及流程,挖掘具体数据标准落地在企业中的难度。 第4部分 数据资产管理 13.企业数据资产 企业数据资产的构成以及搭建路径以及工具等 14.数据治理 结合元数据、数据质量以及数据标准等,系统的阐述数据治理类型项目的落地 15.大数据平台实践 如何一步一步搭建基于Hadoop大数据平台 16.实时数据仓库搭建 如何构建企业级别的实施数据仓库 17.本书总结 总结写书的感悟以及后续的一些想法等
目录
自序
前言
**部分 架构基础
第1章 企业架构概述 3
1.1 企业架构 4
1.2 Zachman框架 4
1.2.1 Zachman框架的维度 4
1.2.2 Zachman框架的特点 5
1.2.3 Zachman框架的使用 6
1.3 TOGAF 6
1.3.1 TOGAF完善架构过程 7
1.3.2 框架核心:ADM 8
1.4 业务架构 9
1.4.1 业务架构的价值 9
1.4.2 业务架构的关键点 10
1.5 数据架构 11
1.5.1 数据架构设计 12
1.5.2 数据架构核心组成 12
1.6 总结 13
第二部分 数据架构基础
第2章 数据架构构成 18
2.1 数据模型 18
2.2 元数据 19
2.3 数据质量 20
2.4 数据标准 21
2.5 数据治理 21
2.6 数据资产 22
2.6.1 数据管理 22
2.6.2 数据仓库 22
2.6.3 数据湖 23
2.6.4 数据资产内涵 23
2.7 数据生命周期 24
2.7.1 数据创建 25
2.7.2 数据使用 25
2.7.3 数据归档 26
2.7.4 数据销毁 26
2.8 数据分布 27
2.8.1 数据存储 27
2.8.2 数据访问 27
2.9 常见数据架构技术选型 28
2.9.1 Lambda 28
2.9.2 Kappa 29
2.10 数据调度 30
2.11 总结 30
第3章 数据存储 31
3.1 数据存储基础 32
3.1.1 计算机组成基础结构 32
3.1.2 数据存储核心概念 35
3.1.3 OLTP与OLAP场景 37
3.2 集中式数据库 38
3.2.1 常见关系型数据库 38
3.2.2 分库分表 39
3.3 分布式数据库 40
3.3.1 大规模并行处理技术 40
3.3.2 分布式事务 41
3.4 大数据存储 43
3.4.1 HDFS 43
3.4.2 Yarn 44
3.4.3 Hive 44
3.4.4 HBase 45
3.4.5 Spark及Spark Streaming 46
3.5 特定领域存储 46
3.5.1 ClickHouse 46
3.5.2 Elasticsearch 48
3.6 实时计算阶段 49
3.7 总结 49
第4章 数据调度与消息传输 50
4.1 通用技术选型 50
4.2 Airflow调度平台 52
4.2.1 Airflow基础概念 52
4.2.2 Airflow架构 54
4.2.3 Airflow与其他调度平台对比 55
4.3 DataX数据同步工具 56
4.3.1 DataX基础概念 56
4.3.2 DataX数据同步 57
4.3.3 DataX优化 59
4.3.4 DataX与其他数据同步工具对比 60
4.4 Kafka消息中间件 62
4.4.1 Kafka基础概念 62
4.4.2 Kafka架构概述 63
4.4.3 Kafka高性能原理 63
4.4.4 Kafka与其他中间件对比 67
4.5 总结 68
第5章 Lambda架构与Kappa架构 69
5.1 架构演进 69
5.1.1 传统数据仓库架构 70
5.1.2 传统大数据架构 71
5.1.3 流式计算架构 72
5.1.4 Lambda架构 73
5.1.5 Kappa架构 74
5.2 Lambda架构详解 75
5.2.1 架构解析 76
5.2.2 核心组件 78
5.2.3 数据流向 81
5.3 Kappa架构详解 82
5.3.1 架构解析 82
5.3.2 核心组件 85
5.3.3 数据流向 87
5.4 Lambda与Kappa对比 87
5.5 流批一体化 89
5.6 总结 90
第6章 辅助类应用体系介绍 91
6.1 资源管理 91
6.1.1 开源堡垒机JumpServer 92
6.1.2 部署与负载均衡 92
6.1.3 核心概念 94
6.1.4 *佳实践 95
6.2 资源及组件监控 95
6.2.1 开源监控系统Prometheus 96
6.2.2 可视化系统Grafana 98
6.2.3 告警模块AlertManager 100
6.2.4 小结 101
6.3 应用监控 102
6.3.1 应用链路监控Pinpoint 102
6.3.2 原理与组件介绍 103
6.3.3 *佳实践 104
6.3.4 小结 106
6.4 日志监控 107
6.4.1 ELK 107
6.4.2 直连式日志收集架构 107
6.4.3 高并发日志收集架构 108
6.5 总结 109
第三部分 数据架构模型实践
第7章 企业数据区与数据流向 113
7.1 数据区概述 113
7.2 数据区详解 115
7.2.1 操作型数据区 115
7.2.2 集成型数据区 116
7.2.3 分析型数据区 117
7.2.4 历史数据区 118
7.3 企业数据流向 119
7.3.1 操作型数据区数据流向 119
7.3.2 集成型数据区数据流向 120
7.3.3 分析型数据区数据流向 121
7.3.4 历史数据区数据流向 122
7.4 企业数据分层 123
7.5 企业集成型数据区层级 124
7.5.1 数据缓冲层 125
7.5.2 数据贴源层 126
7.5.3 标准模型层 127
7.5.4 整合模型层 127
7.5.5 数据集市层 128
7.6 互联网公司的集成型数据区分层特点 129
7.7 总结 130
第8章 数据模型架构详解 131
8.1 为什么要建模 132
8.2 建模策略 134
8.2.1 数据缓冲层建模策略 135
8.2.2 数据贴源层建模策略 135
8.2.3 标准模型层建模策略 136
作者简介
李杨
资深数据架构师,在数据相关领域有10年以上工作经验。头部保险资管公司科技平台交易系统团队开发组负责人,负责多个应用以及数据平台的建设、优化以及迁移工作。曾担任某数据公司技术合伙人,负责多个金融机构的数据仓库或数据平台相关的工作。
在数据质量管理、数据治理等领域有着非常深厚的积累,熟悉不同行业的数字化转型。此外,他还是一名经验丰富的应用工程师,对大数据、数据库以及主流的技术栈有着非常深入的了解。
2022年被集团评为“优秀架构师”,积极参与行业内部的相关课题研究,是《保险问道
之保险资管数字化探索》一书的执笔人之一,是中资协《金融科技赋能保险资管风险管控的研究》课题核心组成员之一。
-
深度学习的数学
¥43.5¥69.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥22.1¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥83.3¥119.0 -
Visual Basic 语言程序设计基础(第6版)
¥32.0¥45.0 -
贝叶斯推理与机器学习
¥139.3¥199.0