×
暂无评论
图文详情
  • ISBN:9787302501466
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:172
  • 出版时间:2018-10-01
  • 条形码:9787302501466 ; 978-7-302-50146-6

本书特色

本书的章节内容如下:第1-4章,讲述云计算的概念和原理,包括云计算的概论、基础、虚拟化、应用;第5-8章讲述大数据概述及基础,包括大数据概念和发展背景、大数据系统架构概述、分布式通信与协同、大数据存储;第9-14章讲述大数据处理,包括分布式处理、HadoopMapReduce解析、Spark解析、流计算、集群资源管理与调度;第14章讲述综合实践(在OpenStack平台上搭建Hadoop并进行数据分析)。 注重云计算与大数据基本概念的讲解,以案例的方式梳理知识脉络和要点,提供综合云计算实验案例

内容简介

本书在阐述云计算和大数据关系的基础上,介绍了云计算和大数据的基本概念、技术及应用。全书内容如下: 第1~4章讲述云计算的概念和原理,包括云计算的概论、基础、虚拟化、应用; 第5~8章讲述大数据概述及基础,包括大数据概念和发展背景、大数据系统架构概述、分布式通信与协同、大数据存储; 第9~13章讲述大数据处理,包括分布式处理、Hadoop MapReduce解析、Spark解析、流计算、集群资源管理与调度; 第14章讲述综合实践(在OpenStack平台上搭建Hadoop并进行数据分析)。 本书结合实际应用及实践过程来讲解相关概念、原理和技术,实用性较强。适合作为本科院校计算机、云计算、大数据及信息管理等相关专业的教材,也适合计算机爱好者阅读和参考。

目录


目录

第1章云计算概论


1.1什么是云计算


1.2云计算的产生背景


1.3云计算的发展历史


1.4如何学好云计算


习题


第2章云计算基础


2.1分布式计算


2.2云计算的基本概念


2.3云计算的关键技术


2.3.1分布式海量数据存储


2.3.2虚拟化技术


2.3.3云平台技术


2.3.4并行编程技术


2.3.5数据管理技术


2.4云交付模型


2.4.1软件即服务


2.4.2平台即服务


2.4.3基础设施即服务


2.4.4基本云交付模型的比较


2.4.5容器即服务


2.5云部署模式


2.5.1公有云


2.5.2私有云


2.5.3混合云


2.6云计算的优势与挑战


2.7典型云应用


2.7.1云存储


2.7.2云服务


2.7.3云物联


2.8云计算与大数据


习题


第3章虚拟化


3.1虚拟化简介


3.1.1什么是虚拟化


3.1.2虚拟化的发展历史


3.1.3虚拟化带来的好处


3.2虚拟化的分类


3.2.1服务器虚拟化


3.2.2网络虚拟化


3.2.3存储虚拟化


3.2.4应用虚拟化


3.2.5技术比较


3.3系统虚拟化


3.4虚拟化与云计算


3.5开源技术


3.5.1Xen


3.5.2KVM


3.5.3OpenVZ


3.6虚拟化未来发展趋势


习题


第4章云计算的应用


4.1概述


4.2Google公司的云计算平台与应用


4.2.1MapReduce分布式编程环境


4.2.2分布式大规模数据库管理系统BigTable


4.2.3Google的云应用


4.3亚马逊的弹性计算云


4.3.1开放的服务


4.3.2灵活的工作模式


4.3.3总结


4.4IBM蓝云云计算平台


4.4.1蓝云云计算平台中的虚拟化


4.4.2蓝云云计算平台中的存储结构


4.5清华大学透明计算平台


4.6阿里云


4.6.1阿里云简介


4.6.2阿里云的发展过程


4.6.3阿里云的主要产品


4.7Microsoft Azure


4.7.1Microsoft Azure简介


4.7.2Microsoft Azure架构


4.7.3Microsoft Azure服务平台


4.7.4开发步骤


习题


第5章大数据概念和发展背景


5.1什么是大数据


5.2大数据的特点


5.3大数据发展


5.4大数据应用


习题


第6章大数据系统架构概述


6.1总体架构概述


6.1.1总体架构设计原则


6.1.2总体架构参考模型


6.2运行架构概述


6.2.1物理架构


6.2.2集成架构


6.2.3安全架构


6.3主流大数据系统厂商


6.3.1Cloudera


6.3.2Hortonworks


6.3.3Amazon


6.3.4Google


6.3.5微软


6.3.6阿里云数加平台


习题


第7章分布式通信与协同


7.1数据编码传输


7.1.1数据编码概述


7.1.2LZSS算法


7.1.3Snappy压缩库


7.2分布式通信系统


7.2.1远程过程调用


7.2.2消息队列


7.2.3应用层多播通信


7.2.4Hadoop IPC应用


7.3分布式协同系统


7.3.1Chubby锁服务


7.3.2ZooKeeper


7.3.3ZooKeeper在HDFS高可用中使用


习题


第8章大数据存储


8.1大数据存储技术发展


8.2海量数据存储的关键技术


8.2.1数据分片与路由


8.2.2数据复制与一致性


8.3重要数据结构和算法


8.3.1Bloom Filter


8.3.2LSM树


8.3.3Merkle哈希树


8.3.4Cuckoo哈希


8.4分布式文件系统


8.4.1文件存储格式


8.4.2Google文件系统


8.4.3HDFS


8.5分布式数据库NoSQL


8.5.1NoSQL数据库概述


8.5.2KV数据库


8.5.3列式数据库


8.5.4图数据库


8.5.5文档数据库


8.6HBase数据库搭建与使用


8.6.1HBase伪分布式运行


8.6.2HBase分布式运行


8.7大数据存储技术趋势


习题


第9章分布式处理


9.1CPU多核和POSIX Thread


9.2MPI并行计算框架


9.3Hadoop MapReduce


9.4Spark


9.5数据处理技术发展


习题


第10章Hadoop MapReduce解析


10.1Hadoop MapReduce架构


10.2Hadoop MapReduce与高性能计算、网格计算的区别


10.3MapReduce工作机制


10.3.1Map


10.3.2Reduce


10.3.3Combine


10.3.4Shuffle


10.3.5Speculative Task


10.3.6任务容错


10.4应用案例


10.4.1WordCount


10.4.2WordMean


10.4.3Grep


10.5MapReduce的缺陷与不足


习题


第11章Spark解析


11.1Spark RDD


11.2Spark与MapReduce对比


11.3Spark工作机制


11.3.1DAG工作图


11.3.2Partition


11.3.3Lineage容错方法


11.3.4内存管理


11.3.5数据持久化


11.4数据读取


11.4.1HDFS


11.4.2Amazon S3


11.4.3HBase


11.5应用案例


11.5.1日志挖掘


11.5.2判别西瓜好坏


11.6Spark发展趋势


习题


第12章流计算


12.1流计算概述


12.2流计算与批处理系统对比


12.3Storm流计算系统


12.4Samza流计算系统


12.5集群日志文件实时分析


12.6流计算发展趋势


习题


第13章集群资源管理与调度


13.1集群资源统一管理系统


13.1.1集群资源管理概述


13.1.2Apache YARN


13.1.3Apache Mesos


13.1.4Google Omega


13.2资源管理模型


13.2.1基于slot的资源表示模型


13.2.2基于*大、*小公平原则的资源分配模型


13.3资源调度策略


13.3.1调度策略概述


13.3.2Capacity Scheduler调度


13.3.3Fair Scheduler调度


13.4YARN上运行计算框架


13.4.1MapReduce on YARN


13.4.2Spark on YARN


13.4.3YARN程序设计


习题


第14章综合实践: 在OpenStack平台上搭建Hadoop并进行数据分析


14.1OpenStack简介


14.2OpenStack的安装及配置


14.2.1OpenStack安装准备


14.2.2OpenStack在线安装


14.2.3搭建OpenStack中的虚拟机


14.3大数据环境安装


14.3.1Java安装


14.3.2Hadoop安装


14.4大数据分析案例


14.4.1日志分析


14.4.2电商购买记录分析


14.4.3交通流量分析


参考文献


展开全部

节选

第3章虚拟化 本章介绍的是虚拟化技术,将对虚拟化的简介、虚拟化技术的分类、系统虚拟化、虚拟化与云计算、相关开源技术以及虚拟化未来的发展趋势进行讲解,包括虚拟化的发展历史以及虚拟化带来的好处。通过对本章的学习,读者应该能对虚拟化技术有系统的了解以及对相关技术有一定的认识。 3.1虚拟化简介 随着近年多核系统、集群、网格甚至云计算的广泛部署,虚拟化技术在应用上的优势日益体现,通过使用虚拟化,不仅可以降低IT成本,而且可以增强系统的安全性和可靠性,虚拟化的概念逐渐深入到人们日常的工作与生活当中。 3.1.1什么是虚拟化 虚拟化是指计算机软件在虚拟的基础上而不是在真实的、独立的物理硬件基础上运行。例如,CPU的虚拟化技术可以实现单CPU模拟多CPU并行,允许一个平台同时运行多个操作系统,并且应用程序可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。这种以优化资源(把有限的、固定的资源根据不同的需求进行重新规划以达到*大利用率)、简化软件的重新配置过程为目的的解决方案,就是虚拟化技术。 图31展示了虚拟化架构与传统架构的对比。简单来讲,虚拟化架构就是在一个物理硬件机器上同时运行多个不同应用的独立的虚拟系统。这些同时运行的虚拟系统由Hyperviser来控制,虚拟机被称为guest。Hypervisor不仅可以提供虚拟系统资源,进行主机/虚拟机之间的调度,而且可以提供虚拟机间的通信。虚拟化服务器的应用如下。 图31虚拟化架构与传统架构的对比 1. 研发与测试 提到虚拟化服务器的应用,人们首先想到的就是研发测试环境,因为在一般情况下,研发和测试人员需要使用不同的操作系统环境,而如果每一种平台都需要使用物理服务器,这将会对准备测试环境的过程带来相当大的困难,一个小小的测试改变都需要重装若干这样的测试用服务器。如果一个测试过程需要成百上千台服务器进行压力测试时,准备纯物理服务器的测试环境几乎不可能,虚拟化技术无疑是*佳的选择。 通过在一台物理服务器上实现多个操作系统,或者实现成百上千个虚拟的服务器,可以极大地降低研发和测试成本。 2. 服务器合并 很多企业用户都不得不面对这样的尴尬: 每实施一项应用就要买一台服务器,随着应用的增加,一般要购买很多不易变更的资源,在这个过程中,完成不同任务的服务器越来越多,管理变得越来越复杂,同时服务器利用率却很低,仅为15%~20%,将会造成资源的极大浪费。 因此,将各种不同的服务器整合在一起的方案受到了用户的欢迎。但是整合在一起的服务器如何分配资源,并保证每一个应用的正常运行呢?服务器从小变大是一个问题,而将大块计算资源分成小块也是一个问题。虚拟服务器技术的出现轻松地解决了服务器合并的问题,从而受到更多企业用户的青睐。 3. 高级虚拟主机 虚拟主机技术的出现,大大降低了在互联网上建立站点的资金门槛。可以说,正是这样的虚拟技术构筑起了互联网的大厦。但随着互联网的普及,客户常常抱怨虚拟主机做了过多的限制,而且稳定性不好,资源很难保证。现在的虚拟主机用户对虚拟主机服务提出了更高的要求,用户需要更安全、稳定的环境,甚至是对部分资源的控制权。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航