×
Spark大数据技术实战教程:微课版

包邮Spark大数据技术实战教程:微课版

1星价 ¥41.2 (7.8折)
2星价¥41.2 定价¥52.8
暂无评论
图文详情
  • ISBN:9787568539944
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:26cm
  • 页数:247页
  • 出版时间:2023-01-01
  • 条形码:9787568539944 ; 978-7-5685-3994-4

内容简介

全书共分为10章,包括Spark概述与运行原理、Spark本地实验环境和集群实验环境搭建、基于Python开发Spark应用程序、Spark RDD弹性分布式数据集、Spark SQL结构化数据文件处理、Spark Streaming实时计算框架、Structured Streaming结构化流、Spark MLlib机器学习库、基于Spark的电商网站用户行为统计分析、基于Spark的餐饮平台菜品智能分析推荐系统。本教材的每一章都配有丰富的实践任务,每个实践任务都有详细的实验步骤和实现代码,可以帮助读者快速巩固所学知识,提升自己的实际应用和开发能力,达到学以致用的目的。 本教材适合作为高等院校计算机、数据科学与大数据技术、软件工程等工科专业的大数据技术教材,也可作为编程爱好者的自学参考书。

目录

第1章 Spark概述与运行原理
1.1 Spark概述
1.2 Spark 架构与运行原理
1.3 Spark基础实验环境准备
1.4 实践任务1:Linux虚拟系统安装与配置
1.5 实践任务2:Spark 本地单机基础实验环境Hadoop准备
1.6 实践任务3:Spark 集群基础实验环境Hadoop准备
1.7 小结
1.8 习题
第2章 Spark本地实验环境和集群实验环境搭建
2.1 Spark本地实验环境简介
2.2 Spark集群实验环境简介
2.3 实践任务1:Spark 本地实验环境搭建
2.4 实践任务2:Spark集群实验环境搭建
2.5 小结
2.6 习题
第3章 基于 Python 开发 Spark 应用程序
3.1 基于Python开发Spark方式
3.2 Python编程语言与PySpark
3.3 PySpark的安装
3.4 PySpark的使用
3.5 spark-submit运行程序
3.6 设置Spark日志输出内容控制
3.7 实践任务1:使用Jupyter Notebook 编写Spark应用程序
3.8 实践任务2:搭建PyCharm环境编写Spark应用程序
3.9 小结
3.10 习题
第4章 Spark RDD弹性分布式数据集
4.1 RDD概述
4.2 RDD创建
4.3 RDD处理过程
4.4 RDD持久化机制
4.5 RDD分区
4.6 RDD的依赖关系
4.7 RDD在Spark中的运行流程
4.8 键值对RDD
4.9 实践任务1:词频统计
4.10 实践任务2:计算学生“大数据基础”和“Spark”两门课程的平均成绩
4.11 实践任务3:编写独立应用程序实现求平均值
4.12 小结
4.13 习题
第5章 Spark SQL结构化数据文件处理
5.1 Spark SQL概述
5.2 DataFrame
5.3 实践任务1:Spark SQL基本操作
5.4 实践任务2:编程实现将RDD转换为DataFrame
5.5 实践任务3:编程实现使用DataFrame 读写MySQL 数据
5.6 小结
5.7 习题
第6章 Spark Streaming实时计算框架
6.1 实时计算概述
6.2 Spark Streaming概述
6.3 Spark 流数据加载
6.4 DStream转换算子
6.5 DStream窗口操作
6.6 DStream输出操作
6.7 实践任务1:Spark Streaming基本输入源—文件流的使用
6.8 实践任务2:Spark Streaming基本输入源——套接字流的使用
6.9 实践任务3:Spark Streaming基本输入源——RDD队列流的使用
6.10 实践任务4:词频统计综合案例
6.11 实践任务5:输出操作——把DStream写人MySQL数据库
6.12 小结
6.13 习题
第7章 Structured Streaming结构化流
7.1 Structured Streaming概述
7.2 编程模型
7.3 输入源与输出操作
7.4 容错处理
7.5 创建Streaming DataFrame
7.6 输出Structured Streaming的结果
7.7 实践任务1:词频统计Word Count基本案例
7.8 实践任务2:基于Spark的广告点击流实时统计
7.9 实践任务3:基于Spark的电商成交额实时统计
7.10 小结
7.11 习题
第8章 Spark MLlib机器学习库
8.1 机器学习概述
8.2 Spark机器学习库MLlib简介
8.3 机器学习工作流
8.4 Spark MLlib 基本统计
8.5 分类
8.6 推荐模型
8.7 实践任务:基于Spark的电影推荐系统
8.8 小结
8.9 习题
第9章 基于Spark的电商网站用户行为统计分析
9.1 用户行为统计分析与设计
9.2 数据预处理
9.3 Spark 读取数据集
9.4 使用Spark SQL进行数据分析
9.5 使用Spark ALS进行商品推荐
9.6 使用Spark将数据写入MySQL
9.7 利用PyEcharts进行数据可视化
9.8 小结
第10章 基于Spark的餐饮平台菜品智能分析推荐系统
10.1 案例背景
10.2 智能推荐方案需求分析与设计
10.3 数据预处理
10.4 推荐模型构建
10.5 使用模型进行推荐
10.6 数据分析
10.7 数据可视化
10.8 小结
参考文献
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航