×
暂无评论
图文详情
  • ISBN:9787302524403
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:290
  • 出版时间:2022-09-14
  • 条形码:9787302524403 ; 978-7-302-52440-3

内容简介

  《Hadoop大数据技术原理与应用》围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1、2章主要带领大家认识Hadoop以及学会搭建Hadoop集群;第3~5章讲解分布式文件系统(HDFS)、分布式计算框架MapReduce以及分布式协调服务;第6章讲解Hadoop 2.0新特性,包含YARN和高可用特性;第7~10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop;第11章是一个综合项目——网站流量日志数据分析系统,目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深对Hadoop技术的理解。  《Hadoop大数据技术原理与应用》附有配套视频、源代码、习题、教学设计、教学课件等资源。同时,为了帮助初学者更好地学习书中的内容,还提供了在线答疑,欢迎读者关注。  《Hadoop大数据技术原理与应用》可作为高等院校本、专科计算机相关专业,信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。

目录

第1章 初识Hadoop
1.1 大数据概述
1.1.1 什么是大数据
1.1.2 大数据的特征
1.1.3 研究大数据的意义
1.2 大数据的应用场景
1.2.1 医疗行业的应用
1.2.2 金融行业的应用
1.2.3 零售行业的应用
1.3 Hadoop概述
1.3.1 Hadoop的前世今生
1.3.2 Hadoop的优势
1.3.3 Hadoop的生态体系
1.3.4 Hadoop的版本
1.4 本章小结
1.5 课后习题

第2章 搭建Hadoop集群
2.1 安装准备
2.1.1 虚拟机安装
2.1.2 虚拟机克隆
2.1.3 Linux系统网络配置
2.1.4 SSH服务配置
2.2 Hadoop集群搭建
2.2.1 Hadoop集群部署模式
2.2.2 JDK安装
2.2.3 Hadoop安装
2.2.4 Hadoop集群配置
2.3 Hadoop集群测试
2.3.1 格式化文件系统
2.3.2 启动和关闭Hadoop集群
2.3.3 通过UI查看Hadoop运行状态
2.4 Hadoop集群初体验
2.5 本章小结
2.6 课后习题

第3章 HDFS分布式文件系统
3.1 HDFS的简介
3.1.1 HDFS的演变
3.1.2 HDFS的基本概念
3.1.3 HDFS的特点
3.2 HDFS的架构和原理
3.2.1 HDFS存储架构
3.2.2 HDFS文件读写原理
3.3 HDFS的Shell操作
3.3.1 HDFS Shell介绍
3.3.2 案例-Shell定时采集数据到HDFS
3.4 HDFS的Java API操作
3.4.1 HDFS Java API介绍
3.4.2 案例——使用Java API操作HDFS
3.5 本章小结
3.6 课后习题

第4章 MapReduce分布式计算框架
4.1 MapReduce概述
4.1.1 MapReduce核心思想
4.1.2 MapReduce编程模型
4.1.3 MapReduce编程实例——词频统计
4.2 MapReduce工作原理
4.2.1 MapReduce工作过程
4.2.2 MapTask工作原理
4.2.3 ReduceTask工作原理
4.2.4 Shuffle工作原理
4.3 MapReduce编程组件
4.3.1 InputFormat组件
4.3.2 Mapper组件
4.3.3 Reducer组件
4.3.4 Partitioner组件
4.3.5 Combiner组件
……
第5章 Zookeeper分布式协调服务
第6章 Hadoop 2.0新特性
第7章 Hive数据仓库
第8章 Flume日志采集系统
第9章 工作流管理器(Azkaban)
第10章 Sqoop数据迁移
第11章 综合项目——网站流量日志数据分析系统
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航