- ISBN:9787111565772
- 装帧:简裝本
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:177
- 出版时间:2017-05-01
- 条形码:9787111565772 ; 978-7-111-56577-2
本书特色
《大数据导论》由畅销的IT书作者(托马斯·埃尔)Thomas Erl与他的团队(瓦吉德·哈塔克、保罗·布勒)编写而成,书中务实、简明地介绍了大数据相关的概念、理论、术语与基础技术,并通过贯穿全书的真实案例(ETI公司大数据技术革新历程),以及简单的图表,帮助读者更清晰地理解大数据技术。 本书首先分析ETl公司面临的商务困境,并提出用大数据技术解决问题,以推动企业组织的进步。随后,重点介绍如何使用大数据的关键分析技术,以及如何搭建大数据解决方案的集成环境,帮助公司提高竞争力并达成战略目标。
内容简介
本书是面向商业和技术专业人员的大数据权威指南,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业“大数据基础”、“大数据道路”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。
目录
致谢
作者简介
**部分 大数据基础
第1章 理解大数据3
1.1 概念与术语4
1.1.1 数据集4
1.1.2 数据分析5
1.1.3 数据分析学5
1.1.4 商务智能11
1.1.5 关键绩效指标11
1.2 大数据特征12
1.2.1 容量12
1.2.2 速率13
1.2.3 多样性13
1.2.4 真实性14
1.2.5 价值14
1.3 不同数据类型15
1.3.1 结构化数据16
1.3.2 非结构化数据17
1.3.3 半结构化数据17
1.3.4 元数据18
1.4 案例学习背景18
1.4.1 历史背景18
1.4.2 技术基础和自动化环境19
1.4.3 商业目标和障碍20
1.5 案例学习21
1.5.1 确定数据特征22
1.5.2 确定数据类型24
第2章 采用大数据的商业动机与驱动25
2.1 市场动态25
2.2 业务架构27
2.3 业务流程管理30
2.4 信息与通信技术31
2.4.1 数据分析与数据科学31
2.4.2 数字化31
2.4.3 开源技术与商用硬件32
2.4.4 社交媒体33
2.4.5 超连通社区与设备33
2.4.6 云计算34
2.5 万物互联网35
2.6 案例学习35
第3章 大数据采用及规划考虑39
3.1 组织的先决条件40
3.2 数据获取40
3.3 隐私性40
3.4 安全性41
3.5 数据来源42
3.6 有限的实时支持43
3.7 不同的性能挑战43
3.8 不同的管理需求43
3.9 不同的方法论44
3.10 云44
3.11 大数据分析的生命周期45
3.11.1 商业案例评估45
3.11.2 数据标识47
3.11.3 数据获取与过滤47
3.11.4 数据提取48
3.11.5 数据验证与清理49
3.11.6 数据聚合与表示50
3.11.7 数据分析52
3.11.8 数据可视化52
3.11.9 分析结果的使用53
3.12 案例学习54
3.12.1 大数据分析的生命周期55
3.12.2 商业案例评估55
3.12.3 数据标识56
3.12.4 数据获取与过滤56
3.12.5 数据提取57
3.12.6 数据验证与清理57
3.12.7 数据聚合与表示57
3.12.8 数据分析57
3.12.9 数据可视化58
3.12.10 分析结果的使用58
第4章 企业级技术与大数据商务智能59
4.1 联机事务处理60
4.2 联机分析处理60
4.3 抽取、转换和加载技术61
4.4 数据仓库61
4.5 数据集市62
4.6 传统商务智能62
4.6.1 即席报表63
4.6.2 仪表板63
4.7 大数据商务智能65
4.7.1 传统数据可视化65
4.7.2 大数据的数据可视化66
4.8 案例学习67
4.8.1 企业技术67
4.8.2 大数据商务智能68
第二部分 存储和分析大数据
第5章 大数据存储的概念71
5.1 集群72
5.2 文件系统和分布式文件系统72
5.3 NoSQL73
5.4 分片74
5.5 复制75
5.5.1 主从式复制76
5.5.2 对等式复制77
5.6 分片和复制80
5.6.1 结合分片和主从式复制80
5.6.2 结合分片和对等式复制81
5.7 CAP定理82
5.8 ACID85
5.9 BASE88
5.10 案例学习91
第6章 大数据处理的概念93
6.1 并行数据处理93
6.2 分布式数据处理94
6.3 Hadoop94
6.4 处理工作量95
6.4.1 批处理型95
6.4.2 事务型95
6.5 集群96
6.6 批处理模式97
6.6.1 MapReduce批处理97
6.6.2 Map和Reduce任务98
6.6.3 MapReduce的简单实例103
6.6.4 理解MapReduce算法104
6.7 实时模式处理107
6.7.1 SCV原则107
6.7.2 事件流处理110
6.7.3 复杂事件处理110
6.7.4 大数据实时处理与SCV110
6.7.5 大数据实时处理与MapReduce111
6.8 案例学习112
6.8.1 处理工作量112
6.8.2 批处理模式处理112
6.8.3 实时模式处理113
第7章 大数据存储技术115
7.1 磁盘存储设备115
7.1.1 分布式文件系统116
7.1.2 RDBMS数据库117
7.1.3 NoSQL数据库119
7.1.4 NewSQL数据库128
7.2 内存存储设备129
7.2.1 内存数据网格131
7.2.2 内存数据库138
7.3 案例学习141
第8章 大数据分析技术143
8.1 定量分析144
8.2 定性分析145
8.3 数据挖掘145
8.4 统计分析146
8.4.1 A/B测试146
8.4.2 相关性分析147
8.4.3 回归性分析149
8.5 机器学习150
8.5.1 分类(有监督的机器学习)151
8.5.2 聚类(无监督的机器学习)152
8.5.3 异常检测152
8.5.4 过滤153
8.6 语义分析154
8.6.1 自然语言处理155
8.6.2 文本分析155
8.6.3 情感分析156
8.7 视觉分析157
8.7.1 热点图157
8.7.2 时间序列图159
8.7.3 网络图160
8.7.4 空间数据制图161
8.8 案例学习162
8.8.1 相关性分析162
8.8.2 回归性分析162
8.8.3 时间序列图163
8.8.4 聚类163
8.8.5 分类163
附录A 案例结论165
索引167
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0