- ISBN:9787519840099
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:552
- 出版时间:2020-03-01
- 条形码:9787519840099 ; 978-7-5198-4009-9
本书特色
通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:
大数据技术和Spark概述。
通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
了解Spark如何在集群上运行。
Spark集群和应用程序的调试、监控、和调优。
学习Spark强大的流处理引擎——结构化流处理。通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:大数据技术和Spark概述。
通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
了解Spark如何在集群上运行。
Spark集群和应用程序的调试、监控、和调优。
学习Spark强大的流处理引擎——结构化流处理。
学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
内容简介
?大数据技术和Spark概述。?通过实例学习DataFrame、SQL、Dataset等Spark的核心API。?了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。?了解Spark如何在集群上运行。?Spark集群和应用程序的调试、监控、和调优。?学习Spark强大的流处理引擎——结构化流处理。?学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
目录
作者简介
Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。
-
认识电竞
¥36.0¥58.0 -
物联网应用路线图
¥8.2¥39.0 -
整理优先:小改进,大回报,整洁代码设计指南
¥37.7¥49.0 -
开启创意之门 AIGC创作一本通
¥70.0¥89.8 -
生物特征识别算法研究
¥22.2¥39.0 -
计算机视觉:从感知到重建
¥108.8¥149.0 -
AI时代程序员开发之道:CHATGPT让程序员插上翅膀
¥60.0¥79.0 -
一本书玩转MIDJOURNEY:人人都可以体验AI绘画的魅力
¥102.9¥139.0 -
和秋叶一起学EXCEL(第3版)
¥76.9¥109.9 -
ARDUINO编程从零开始(第3版)
¥36.9¥49.8 -
矩阵力量:线性代数全彩图解+微课+Python编程
¥206.4¥258.0 -
技术为径:带领公司走向卓越的工程师
¥65.6¥79.0 -
图神经网络:基础、前沿与应用
¥112.6¥178.8 -
这才是服务设计
¥123.9¥199.8 -
全国计算机等级考试一本通 二级MS Office高级应用与设计
¥54.5¥69.9 -
设计机器学习系统
¥103.5¥138.0 -
中望CAD实用教程
¥62.3¥79.9 -
软件性能测试——LoadRunner性能监控与分析实例详解
¥63.2¥79.0 -
走进智能家居
¥35.6¥44.0 -
Autodesk Fusion 360 官方标准教程
¥119.2¥149.0