×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
Spark大数据商业实战三部曲:内核解密.商业案例.性能调优(第2版)

Spark大数据商业实战三部曲:内核解密.商业案例.性能调优(第2版)

1星价 ¥151.3 (4.6折)
2星价¥151.3 定价¥329.0

温馨提示:5折以下图书主要为出版社尾货,大部分为全新(有塑封/无塑封),个别图书品相8-9成新、切口有划线标记、光盘等附件不全详细品相说明>>

暂无评论
图文详情
  • ISBN:9787302544531
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:1303
  • 出版时间:2020-06-01
  • 条形码:9787302544531 ; 978-7-302-54453-1

本书特色

本书基于 Spark 2.4.X版本,以 Spark商业案例实战和 Spark在生产环境下几乎所有类型的性能调优为核心,以 Spark内核解密为基石,对企业生产环境下的 Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分 4篇,内核解密篇基于 Spark源码,从一个实战案例入手,循序渐进地全面解析 Spark 2.4.X版本的新特性及 Spark内核源码;商业案例篇选取 Spark开发中*代表性的经典学习案例,在案例中综合介绍 Spark的大数据技术;性能调优篇覆盖 Spark在生产环境下的所有调优技术;Spark AI解密篇讲解深度学习实践、 Spark PyTorch案例实战、Spark TensorFlow实战以及 Spark上的深度学习内核解密。 本书适合所有 Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员,本书也可作为 Spark高手修炼的参考用书。本书还适合作为高等院校的大数据课程教材。

内容简介

本书基于 Spark 2.4.X版本,以 Spark商业案例实战和 Spark在生产环境下几乎所有类型的性能调优为核心,以 Spark内核解密为基石,对企业生产环境下的 Spark商业案例与性能调优抽丝剥茧地进行剖析。全书共分 4篇,内核解密篇基于 Spark源码,从一个实战案例入手,循序渐进地全面解析 Spark 2.4.X版本的新特性及 Spark内核源码;商业案例篇选取 Spark开发中拥有代表性的经典学习案例,在案例中综合介绍 Spark的大数据技术;性能调优篇覆盖 Spark在生产环境下的所有调优技术;Spark+AI解密篇讲解深度学习实践、 Spark+PyTorch案例实战、Spark+TensorFlow实战以及 Spark上的深度学习内核解密。 本书适合所有 Spark学习者和从业人员使用。对于有分布式计算框架应用经验的人员,本书也可作为 Spark高手修炼的参考用书。本书还适合作为高等院校的大数据课程教材。

目录

第1篇 内核解密篇 第1章 电光石火间体验Spark 2.4 开发实战 1.1 通过RDD实战电影点评系统入门及源码阅读 1.1.1 Spark核心概念图解 1.1.2 通过RDD实战电影点评系统案例 1.2 通过DataFrame和DataSet实战电影点评系统 1.2.1 通过DataFrame实战电影点评系统案例 1.2.2 通过DataSet实战电影点评系统案例 1.3 Spark2.4 源码阅读环境搭建及源码阅读体验 第2章 Spark 2.4 技术及原理 2.1 Spark 2.4 综述 2.1.1 连续应用程序 2.1.2 新的API 2.2 Spark 2.4 Core 2.2.1 第二代Tungsten引擎 2.2.2 SparkSession 2.2.3 累加器API 2.3 Spark 2.4 SQL 2.3.1 Spark SQL 2.3.2 DataFrame和Dataset API 2.3.3 Timed Window 2.4 Spark 2.4 Streaming 2.4.1 Structured Streaming 2.4.2 增量输出模式 2.5 Spark 2.4 MLlib 2.5.1 基于DataFrame的Machine Learning API 2.5.2 R的分布式算法 2.6 Spark 2.4 GraphX 第3章 Spark的灵魂:RDD和DataSet 3.1 为什么说RDD和DataSet是Spark的灵魂 3.1.1 RDD的定义及五大特性剖析 3.1.2 DataSet的定义及内部机制剖析 3.2 RDD弹性特性7个方面解析 3.3 RDD依赖关系 3.3.1 窄依赖解析 3.3.2 宽依赖解析 3.4 解析Spark中的DAG逻辑视图 3.4.1 DAG生成的机制 3.4.2 DAG逻辑视图解析 3.5 RDD内部的计算机制 3.5.1 Task解析 3.5.2 计算过程深度解析 3.6 SparkRDD容错原理及其四大核心要点解析 3.6.1 Spark RDD容错原理 3.6.2 RDD容错的四大核心要点 3.7 SparkRDD中Runtime流程解析 3.7.1 Runtime架构图 3.7.2 生命周期 3.8 通过WordCount实战解析Spark RDD内部机制 3.8.1 Spark WordCount动手实践 3.8.2 解析RDD生成的内部机制 3.9 基于DataSet的代码如何转化为RDD 第4章 Spark Driver启动内幕剖析 4.1 Spark Driver Program剖析 4.1.1 Spark Driver Program 4.1.2 SparkContext深度剖析 4.1.3 SparkContext源码解析 4.2 DAGScheduler解析 4.2.1 DAG的定义 4.2.2 DAG的实例化 4.2.3 DAGScheduler划分Stage的原理 4.2.4 DAGScheduler划分Stage的具体算法 4.2.5 Stage内部Task获取*佳位置的算法 4.3 TaskScheduler解析 4.3.1 TaskScheduler原理剖析 4.3.2 TaskScheduler源码解析 4.4 SchedulerBackend解析 4.4.1 SchedulerBackend原理剖析 4.4.2 SchedulerBackend源码解析 4.4.3 Spark程序的注册机制 …… 第2篇 商业案例篇 第3篇 性能调优篇 第4篇 Spark AI解密篇
展开全部

作者简介

王家林,Apache Spark执牛耳者现工作于硅谷的AI实验室,专注于NLP框架超过20本Spark、Al、Android书籍作者Toastmasters International Division Director GRE博士入学考试连续两次满分获得者
  
段智华,就职于中国电信股份有限公司上海分公司,系统架构师,CSDN博客专家,专注于Spark大数据技术研发及推广,跟随Spark核心源码技术的发展,深入研究Spark 2.1.1版本及Spark 2.2.0版本的源码优化,对Spark大数据处理、机器学习等技术有丰富的实战经验和浓厚兴趣。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航