- ISBN:9787121437748
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:500
- 出版时间:2022-07-01
- 条形码:9787121437748 ; 978-7-121-43774-8
本书特色
(1)体系完整,内容丰富。 (2)从零起步,循序渐进。 (3)大量插图,易于理解。 (4)丰富的实战案例。 (5)衔接运维,无须担心大数据集群环境问题。 (6)丰富的大数据架构案例。
内容简介
本书提供了学习大数据技术及架构的一站式解决方案,覆盖了大数据生态圈中的完整技术体系,包含以下内容。 . 一、数据采集日志数据采集工具(Flume 、Logstash、Filebeat )数据库数据采集工具(离线采集工具——Sqoop、DataX,实时数据采集工具——Canal、Maxwell 网页数据采集工具物联网数据采集工具消息队列中间件 . 二、数据存储分布式文件存储之HDFSNoSQL数据库之HBaseNoSQL数据库之Redis . 三、离线数据计算离线计算引擎MapReduce离线计算引擎Spark . 四、实时数据计算实时计算引擎Storm实时计算引擎Spark Streaming新一代实时计算引擎Flink . 五、OLAP数据分析 离线OLAP引擎(Hive、Impala、Kylin)实时OLAP引擎(Druid、ClickHouse、Doris) . 六、全文检索引擎 Lucene SolrElasticsearch . 七、分布式任务调度系统AzkabanOoizeDolphinScheduler . 八、分布式资源管理 YARN的原理、架构YARN中的资源调度器【实战】配置和使用YARN多资源队列 . 九 、大数据平台搭建工具 大数据平台工具HDP大数据平台工具CDH大数据平台工具CDP . 本书还介绍了多个企业级大数据应用案例(包括海量数据采集、“双十一”数据大屏、海量数据全文搜索系统等)和大数据平台架构案例(包括离线数据仓库架构、实时数据仓库架构、批流一体化数据仓库架构、数据中台架构、直播大数据平台架构、电商大数据平台架构等),可以帮助读者从全局角度理解大数据。 . 在本书中,技术内容基本上都是从零讲起的,结合原理和架构,以“图解 实战”的形式帮助读者轻松理解复杂的知识。
目录
作者简介
徐葳 中科院大数据研究院大数据技术专家,曾就职于北京猎豹移动科技有限公司
-
大模型应用开发极简入门 基于GPT-4和ChatGPT
¥41.9¥59.8 -
这就是ChatGPT
¥41.9¥59.8 -
人工智能 现代方法 第4版(全2册)
¥120.8¥198.0 -
电脑组装、选购、操作、维护、维修从入门到精通
¥24.0¥48.0 -
数据结构教程(第6版·微课视频·题库版)
¥45.9¥65.0 -
计算机组成原理实验指导与习题解析
¥34.8¥52.0 -
机器学习
¥47.4¥108.0 -
C程序设计(第五版)
¥18.6¥49.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥36.4¥68.0 -
大数据丛书数据可视化(第2版)
¥163.2¥259.0 -
RFID与智能卡技术实验指导书
¥29.4¥36.0 -
大数据技术导论(第2版)
¥28.9¥41.0 -
UNITY游戏开发经典实例
¥73.0¥128.0 -
软件开发技术基础 第4版
¥65.7¥79.9 -
uni-app移动应用开发 微课版
¥52.0¥69.8 -
软件测试
¥50.0¥68.0 -
AIGC文图学 人类3.0时代的生产力
¥36.0¥48.0 -
AFter Effects 影视后期特效实战教程
¥45.0¥69.8 -
生物特征识别算法研究
¥20.1¥39.0 -
大模型应用开发动手做AIAGENT
¥62.9¥89.8