暂无评论
图文详情
- ISBN:9787563565849
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:205页
- 出版时间:2022-01-01
- 条形码:9787563565849 ; 978-7-5635-6584-9
内容简介
本书系统梳理总结ApacheHadoop大数据相关技术, 介绍大数据存储、并行计算、数据处理等内容, 帮助读者形成对大数据知识体系及其应用领域的轮廓性认识, 为读者在大数据领域进行更深入的学习和研究奠定基础、指明方向。共分为9章: 第1章讲解Hadoop的生态系统, 以及在行业中的应用场景 ; 第2章讲解Hadoop分布式文件系统, 包括NameNode和DataNode节点、机架感知策略、HDFSShell命令等 ; 第3章讲解MapReduce并行计算框架等。
目录
第1章 .Hadoop大数台概述 1.1 Hadoop大数台起源 1.1.1 Hadoop发展历程 1.1.2 Hadoop核心组件 1.1.3 Hadoop与云计算的关系 1.2 Hadoop集群搭建和简单应用 1.2.1 集群服务器规划 1.2.2 Hadoop软件安装 1.2.3 Hadoop命令行的基本使用 本章小结第2章 Hadoop分布式文件系统 2.1 HDFS概述 2.1.1 HDFS的概念和特 2.1.2 HDFS的局限 2.1.3 HDFS保证可靠的措施 2.1.4 单点故障(单点失效)问题 2.2 HDFS Shell命令 2.2.1 常见Shell命令 2.2.2 其他HDFS Shell命令 2.3 对HDFS的深入理解 2.3.1 HDFS的优点和缺点 2.3.2 HDFS的辅能 2.4 HDFS读写过程 2.4.1 HDFS写入数据过程 2.4.2 HDFS读取数据过程 2.5 分布式集群中HDFS的各种角色 2.5.1 NameNode的可靠 2.5.2 DataNode的可靠 2.5.3 元数据的CheckPoint 本章小结第3章 MapReduce并行计算框架 3.1 MapReduce概述 3.1.1 为什么需要MapReduce 3.1.2 MapReduce程序运行演示 3.1.3 WordCount.java源码分析 3.i.4编写自己的WordCount程序 3.2 MapReduce的核心运行机制 3.3 MapReduce的多Job串联和全局计数器 3.3.1 MapReduce的多Job串联 3.3.2 全局计数器 3.3.3 计数器该如何使用 3.3.4 MapReduce框架Partitioner分区 3.3.5 MapReduce框架Combiner分区 3.4 YARN的资源调度 本章小结第4章 HBase分布式数据库 4.1 HBase数据库概述 4.1.1 HBase数据库的使用场景 4.1.2 HBase数据库的安装 4.2 HBase数据库物理架构 4.2.1 HBase集群节点类型 4.2.2 HBase数据存储 4.3 HBase数据库r/> 4.3.1 HBase命令行的启动 4.3.2 HBase表的r/> 4.3.3 HBase表中数据的r/> 4.4 HBase数据库的APIr/> 本章小结第5章 Hive数据仓库 5.1 Hive简介 5.1.1 什么是Hire 5.1.2 Hive的数据组织 5.1.3 Hive的表类型 5.2 Hive的安装与使用 5.2.1 Hive的安装配置 5.2.2 Hive的基本使用 5.2.3 Hive的连接方式 5.3 Hive数据结构 5.3.1 Hive数据类型 5.3.2 Hive数据存储格式 5.3.3 数据格式 5.4 Hive数据r/> 5.4.1 管理库 5.4.2 表r/> 5.5 Hive应用案例 5.5.1 统计单月访问次数访问次数 5.5.2 学生课程成绩统计 本章小结第6章 Kafka消息系统 6.1 Kafka消息系统能 6.1.1 Kafka概述 6.1.2 Kafka组件架构 6.1.3 Kafka软件安装 6.1.4 Kafka服务的启动 6.2 Kafka组件术语 6.2.1 主题与日志 6.2.2 Kafka H志处理 6.2.3 消息副本 6.2.4 数据处理场景 6.2.5 生产者 6.2.6 消费者 本章小结第7章 Flume日志处理系统 7.1 F、lume的简介 7.1.1 Flume概述 7.1.2 Flume NG的介绍 7.1.3 Flume的部署类型 7.2 F、lume的安装与配置 7.2.1 Flume的下载与安装 7.2.2 Flume Sources描述 7.3 Flume代理流配置 7.3.1 单配置 7.3.2 单代理多流配置 7.3.3 配置多代理流程 7.3.4 多路复用流 本章小结第8章 ZooKeeper分布式协调系统 8.1 分布式协调技术概述 8.2 ZooKeeper概述 8.3 ZooKeeper监听机制 8.3.1 Watch触发器 8.3.2 监听原理 8.3.3 ZooKeeper应用举例 8.4 ZooKeeper的安装与集群配置 8.4.1 ZooKeeper的安装 8.4.2 使用ZooKeeper命令的简单操作步骤 本章小结第9章 Sqoop数据迁移工具 9.1 Sq00能概述 9.1.1 Sqoop软件介绍 9.1.2 Sqoop软件安装 9.2 Sqoop命令r/> 9.2.1 Sqoop的基本命令 9.2.2 Sqoop的数据导入 9.2.3 将MysQL数据库中的表数据导入Hive 9.2.4 将MysQL数据库中的表数据导入HBar/> 本章小结参考文献
展开全部
本类五星书
浏览历史
本类畅销
-
全图解零基础word excel ppt 应用教程
¥16.3¥48.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥34.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
情感计算
¥71.2¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
大学计算机基础实验教程(MS Office版)——面向数据分析能力培养
¥29.1¥39.8 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥51.8¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥65.6¥89.8 -
LINUX实战——从入门到精通
¥49.0¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
数据存储架构与技术(第2版)
¥62.9¥89.8 -
纹样之美:中国传统经典纹样速查手册
¥81.8¥109.0 -
Java面向对象程序设计基础教程
¥35.9¥59.8 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0