- ISBN:9787302677154
- 装帧:平装
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:0
- 出版时间:2024-12-01
- 条形码:9787302677154 ; 978-7-302-67715-4
本书特色
本书以Hadoop 及其周边框架为主线,介绍了整个Hadoop 生态系统主流的大数据组件以及平台运维。本书从零开始逐一讲解大数据体系中的各种技术,通过丰富的实战案例阐述重点、难点知识,为初学者进入大数据领域打好基础。书中各个项目设计合理,在每个项目开头设置导读,首先介绍知识点,然后紧跟实践操作,*后在每个项目末尾通过课后练习帮助读者巩固所学知识。
本书既可作为Hadoop 新手入门的指导用书,也可作为职业院校大数据技术、云计算应用技术和人工智能应用技术等计算机类专业的教材,还可供从事计算机相关工作的技术人员参考。
内容简介
" 本书以Hadoop 及其周边框架为主线,介绍了整个Hadoop 生态系统主流的大数据组件以及平台运维。本书从零开始逐一讲解大数据体系中的各种技术,通过丰富的实战案例阐述重点、难点知识,为初学者进入大数据领域打好基础。书中各个项目设计合理,在每个项目开头设置导读,首先介绍知识点,然后紧跟实践操作,*后在每个项目末尾通过课后练习帮助读者巩固所学知识。 本书既可作为Hadoop 新手入门的指导用书,也可作为职业院校大数据技术、云计算应用技术和人工智能应用技术等计算机类专业的教材,还可供从事计算机相关工作的技术人员参考。"
前言
在信息化浪潮席卷全球的今天,大数据已经成为推动社会进步和科技创新的重要
技术。大数据不仅改变了人们的生活方式,而且对各行各业产生了深远的影响。在这
样的背景下,掌握大数据平台的构建技术,已经成了信息科技领域从业者不可或缺的
一项技能。
本书采用项目式编写模式,以大数据生态体系为基础,详细阐述了大数据平台构
建的全过程。全书共分14 个项目,包括大数据及Hadoop 概述、Hadoop 分布式集群
安装及部署、分布式文件系统HDFS、分布式计算框架MapReduce、分布式协调框架
ZooKeeper、Hadoop 高可用集群、分布式存储数据库HBase、数据仓库Hive、数据迁移
工具Sqoop、日志采集工具Flume、分布式消息队列Kafka、内存计算框架Spark、内
目录
项目1 大数据及Hadoop 概述 1
任务1.1 大数据概述 2
任务1.2 Hadoop 概述 5
课后练习 8
项目2 Hadoop 分布式集群安装及部署 10
任务2.1 Linux 系统基础环境安装及配置 11
任务2.2 伪分布式系统安装 22
任务2.3 完全分布系统安装 33
课后练习 47
项目3 分布式文件系统HDFS 49
任务3.1 HDFS 概述 50
任务3.2 HDFS 命令行客户端 54
课后练习 62
项目4 分布式计算框架MapReduce 64
任务4.1 认识MapReduce 65
任务4.2 分布式资源调度平台Yarn 72
课后练习 77
项目5 分布式协调框架ZooKeeper 79
任务5.1 认识ZooKeeper 80
Hadoop 大数据平台构建
Ⅳ
任务5.2 部署ZooKeeper 集群 86
任务5.3 ZooKeeper Shell 93
课后练习 97
项目6 Hadoop 高可用集群 99
任务6.1 认识Hadoop 高可用 100
任务6.2 部署Hadoop HA 集群 103
课后练习 117
项目7 分布式存储数据库HBase 119
任务7.1 初识HBase 120
任务7.2 部署HBase 集群 125
任务7.3 HBase Shell 操作 131
课后练习 138
项目8 数据仓库Hive 140
任务8.1 Hive 简介 141
任务8.2 Hive 安装部署 146
任务8.3 Hive 操作 156
任务8.4 Hive 和HBase 整合 167
课后练习 170
项目9 数据迁移工具Sqoop 172
任务9.1 部署Sqoop 173
任务9.2 Sqoop 应用 178
课后练习 186
项目10 日志采集工具Flume 188
任务10.1 认识Flume 189
任务10.2 Flume 安装部署 193
任务10.3 Flume 多点采集数据 200
课后练习 205
目 录
V
目 录
项目11 分布式消息队列Kafka 207
任务11.1 认识Kafka 208
任务11.2 部署Kafka 集群 212
任务11.3 Kafka 和Flume 整合 219
课后练习 221
项目12 内存计算框架Spark 223
任务12.1 认识Spark 224
任务12.2 部署Spark 228
课后练习 234
项目13 内存计算框架Flink 237
任务13.1 认识Flink 238
任务13.2 部署Flink 243
课后练习 255
项目14 大数据平台的管理与监控 257
任务14.1 大数据平台的管理与监控概述 258
任务14.2 Nagios 监控 259
任务14.3 Ganglia 监控 279
任务14.4 Prometheus 监控 297
课后练习 306
参考文献 308
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥31.2¥48.0 -
胶黏剂与粘接技术基础(第二版)
¥73.5¥98.0 -
当代教育心理学(第3版)(本科教材)
¥35.0¥66.0 -
概率论与数理统计
¥20.9¥35.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥9.0¥25.0 -
新编研究生英语系列教程研究生英语读写教程(提高级)/周红红/新编研究生英语系列教程
¥43.5¥50.0 -
习近平总书记教育重要论述讲义
¥16.0¥35.0 -
新编大学生军事理论与训练教程
¥13.7¥39.8 -
西方经济学(第二版) (上下)
¥31.6¥90.0 -
马克思主义理论研究和建设工程重点教材:管理学(本科教材)
¥27.4¥48.0 -
落洼物语
¥9.4¥28.0 -
言语治疗学·全国中医药行业高等教育“十四五”规划教材
¥49.2¥56.0 -
大学生职业生涯规划与就业指导
¥26.5¥49.0 -
系统解剖学
¥53.7¥85.0 -
中医骨伤科学·全国中医药行业高等教育“十四五”规划教材
¥62.2¥85.0 -
博雅大学堂·历史中国古代简史(第2版)/张帆
¥38.8¥60.0 -
组织学与胚胎学实验指导
¥18.1¥28.0 -
毛泽东思想与中国特色社会主义理论体系概论
¥8.5¥25.0 -
粒子输运数值计算方法及其应用
¥46.8¥58.0 -
农业技术经济学
¥46.9¥51.0