×
大数据工程项目开发实践活页试教程

包邮大数据工程项目开发实践活页试教程

1星价 ¥41.8 (6.1折)
2星价¥41.8 定价¥68.0
暂无评论
图文详情
  • ISBN:9787121468001
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:268
  • 出版时间:2024-01-01
  • 条形码:9787121468001 ; 978-7-121-46800-1

本书特色

大数据是由数量巨大、结构复杂、类型众多的数据构成的巨量数据集合。大数据的采集、清洗、存储、查找、传输、分享、分析及可视化等 作都 了现有关系数据库与数据处理软件的承载能力。Google等 企业为存储和计算所需海量互联网资源而开发了分布式文件系统GFS、数据库BigTable和算法MapReduce,并公开成果。Google类似技术替代者的开源软件Hadoop,以及建立其基础上的软件逐渐成为大数据云存储与处理技术的主流。 大数据是由数量巨大、结构复杂、类型众多的数据构成的巨量数据集合。大数据的采集、清洗、存储、查找、传输、分享、分析及可视化等 作都 了现有关系数据库与数据处理软件的承载能力。Google等 企业为存储和计算所需海量互联网资源而开发了分布式文件系统GFS、数据库BigTable和算法MapReduce,并公开成果。Google类似技术替代者的开源软件Hadoop,以及建立其基础上的软件逐渐成为大数据云存储与处理技术的主流。

内容简介

本书的章节设置是为适应大数据开发应用产业对高素质技术技能型人才的职业需求,覆盖大数据行业典型工作流程岗位,包括大数据平台与相关工具配置、数据处理与计算、数据分析与可视化展现等。综合项目章节选取典型的大数据真实业务分析应用场景围绕对Hadoop集群的安装部署、管理及MapReduce计算,并包含大数据处理相关算法应用与软件工具运用,从而激发学生对大数据知识和技术的学习兴趣,提升学生职业素养和职业技能,努力为中国大数据应用产业发展储备及输送新鲜血液。 本书理念先进,内容新颖,并以注重实用、提高技能为目的,通过大量的实例和实训内容,帮助读者提高应用技能,本书基于VMware workstation 14平台和linux Centos 7操作系统为基础搭建hadoop环境,除了讲解案例开发的基础原理,更是以实际项目案例为线索在操作细节,使用交互等方面给与了详细的介绍。

目录

第1章 数据 1 1.1 数据流与大数据 1 1.1.1 数据产生 2 1.1.2 数据采集 3 1.1.3 数据存储和管理 4 1.2 数据平台与技术 5 1.2.1 离线数据平台的相关技术 6 1.2.2 实时数据平台的相关技术 7 习题1 9 上机实验1 大数据架构和组件选型 9 第2章 搭建大数据集群环境 11 2.1 集群环境安装准备 11 2.1.1 学习任务:创建虚拟机 11 2.1.2 启动虚拟机并安装Linux操作系统 15 2.1.3 克隆虚拟机 18 2.1.4 Linux操作系统网络配置 20 2.1.5 SSH操作配置 25 2.2 安装JDK 29 2.3 ZooKeeper集群部署 31 2.3.1 ZooKeeper集群的安装与配置 31 2.3.2 ZooKeeper集群的启动与关闭 33 2.4 Hadoop集群部署 34 2.4.1 Hadoop高可用集群规划 35 2.4.2 安装Hadoop 36 2.4.3 Hadoop高可用集群配置 37 2.4.4 启用Hadoop高可用集群 42 习题2 45 上机实验2 VMware Workstation的安装和使用 46 第3章 Hadoop核心组件原理与实践 47 3.1 分布式文件系统HDFS的认识与操作 47 3.1.1 HDFS体系结构的认识 47 3.1.2 HDFS Shell操作 51 3.1.3 HDFS API操作 56 3.2 分布式计算框架MapReduce的认识与操作 70 3.2.1 MapReduce的认识 71 3.2.2 MapReduce编程模型 72 3.2.3 MapReduce WordCount编程实例 74 3.3 YARN与Hadoop新特性的认识 86 3.3.1 Hadoop2.0的认识 87 3.3.2 YARN体系结构的认识 88 3.3.3 YARN工作流程的认识 90 习题3 91 上机实验3 *高气温统计案例 93 第4章 数据仓库Hive应用实践 94 4.1 离线大数据处理技术Hive
展开全部

作者简介

王倩,天津人,毕业于南开大学。天津职业大学电子信息工程学院,讲师。主要从事大数据并行计算和数据挖掘方向的教学和研究。多次参加 精品课和天津市自然科学基金的建设工作,主持并参与多项教育科研省部级课题建设;公开发表论文20余篇,其中《综合考虑时间和成本的云计算调度优化算法》被SCI检索;参编计算机网络编程类教材4部,均用于一线教学,效果良好。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航