- ISBN:9787519840099
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:552
- 出版时间:2020-03-01
- 条形码:9787519840099 ; 978-7-5198-4009-9
本书特色
通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:
大数据技术和Spark概述。
通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
了解Spark如何在集群上运行。
Spark集群和应用程序的调试、监控、和调优。
学习Spark强大的流处理引擎——结构化流处理。通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:大数据技术和Spark概述。
通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
了解Spark如何在集群上运行。
Spark集群和应用程序的调试、监控、和调优。
学习Spark强大的流处理引擎——结构化流处理。
学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
内容简介
?大数据技术和Spark概述。?通过实例学习DataFrame、SQL、Dataset等Spark的核心API。?了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。?了解Spark如何在集群上运行。?Spark集群和应用程序的调试、监控、和调优。?学习Spark强大的流处理引擎——结构化流处理。?学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
目录
作者简介
Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。
-
大数据技术导论(第2版)
¥39.0¥41.0 -
机器学习
¥91.8¥108.0 -
微信小程序开发教程
¥37.7¥49.0 -
大模型应用开发极简入门 基于GPT-4和ChatGPT
¥41.9¥59.8 -
这就是ChatGPT
¥41.9¥59.8 -
Python编程从入门到实践(第3版)
¥76.9¥109.8 -
C程序设计(第五版)
¥34.5¥59.9 -
数据结构教程(第6版·微课视频·题库版)
¥56.3¥65.0 -
计算机组成原理实验指导与习题解析
¥34.8¥52.0 -
C程序设计(第五版)
¥22.1¥49.0 -
大数据丛书数据可视化(第2版)
¥163.2¥259.0 -
数据结构基础(C语言版)(第2版)
¥42.6¥49.0 -
工业互联网安全创新技术及应用
¥73.0¥128.0 -
AI办公助手 ChatGPT+Office智能办公从入门到实践 80集视频课
¥64.8¥79.8 -
计算机网络基础(微课版)
¥45.6¥55.0 -
零信任架构
¥68.6¥89.0 -
剪映:即梦AI绘画与视频制作从新手到高手
¥62.3¥89.0 -
红蓝攻防 技术与策略(原书第3版)
¥111.2¥139.0 -
RFID与智能卡技术实验指导书
¥29.4¥36.0 -
人工智能导论(第2版)
¥32.8¥39.8