暂无评论
图文详情
- ISBN:9787568539944
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:26cm
- 页数:247页
- 出版时间:2023-01-01
- 条形码:9787568539944 ; 978-7-5685-3994-4
内容简介
全书共分为10章,包括Spark概述与运行原理、Spark本地实验环境和集群实验环境搭建、基于Python开发Spark应用程序、Spark RDD弹性分布式数据集、Spark SQL结构化数据文件处理、Spark Streaming实时计算框架、Structured Streaming结构化流、Spark MLlib机器学习库、基于Spark的电商网站用户行为统计分析、基于Spark的餐饮平台菜品智能分析推荐系统。本教材的每一章都配有丰富的实践任务,每个实践任务都有详细的实验步骤和实现代码,可以帮助读者快速巩固所学知识,提升自己的实际应用和开发能力,达到学以致用的目的。 本教材适合作为高等院校计算机、数据科学与大数据技术、软件工程等工科专业的大数据技术教材,也可作为编程爱好者的自学参考书。
目录
第1章 Spark概述与运行原理
1.1 Spark概述
1.2 Spark 架构与运行原理
1.3 Spark基础实验环境准备
1.4 实践任务1:Linux虚拟系统安装与配置
1.5 实践任务2:Spark 本地单机基础实验环境Hadoop准备
1.6 实践任务3:Spark 集群基础实验环境Hadoop准备
1.7 小结
1.8 习题
第2章 Spark本地实验环境和集群实验环境搭建
2.1 Spark本地实验环境简介
2.2 Spark集群实验环境简介
2.3 实践任务1:Spark 本地实验环境搭建
2.4 实践任务2:Spark集群实验环境搭建
2.5 小结
2.6 习题
第3章 基于 Python 开发 Spark 应用程序
3.1 基于Python开发Spark方式
3.2 Python编程语言与PySpark
3.3 PySpark的安装
3.4 PySpark的使用
3.5 spark-submit运行程序
3.6 设置Spark日志输出内容控制
3.7 实践任务1:使用Jupyter Notebook 编写Spark应用程序
3.8 实践任务2:搭建PyCharm环境编写Spark应用程序
3.9 小结
3.10 习题
第4章 Spark RDD弹性分布式数据集
4.1 RDD概述
4.2 RDD创建
4.3 RDD处理过程
4.4 RDD持久化机制
4.5 RDD分区
4.6 RDD的依赖关系
4.7 RDD在Spark中的运行流程
4.8 键值对RDD
4.9 实践任务1:词频统计
4.10 实践任务2:计算学生“大数据基础”和“Spark”两门课程的平均成绩
4.11 实践任务3:编写独立应用程序实现求平均值
4.12 小结
4.13 习题
第5章 Spark SQL结构化数据文件处理
5.1 Spark SQL概述
5.2 DataFrame
5.3 实践任务1:Spark SQL基本操作
5.4 实践任务2:编程实现将RDD转换为DataFrame
5.5 实践任务3:编程实现使用DataFrame 读写MySQL 数据
5.6 小结
5.7 习题
第6章 Spark Streaming实时计算框架
6.1 实时计算概述
6.2 Spark Streaming概述
6.3 Spark 流数据加载
6.4 DStream转换算子
6.5 DStream窗口操作
6.6 DStream输出操作
6.7 实践任务1:Spark Streaming基本输入源—文件流的使用
6.8 实践任务2:Spark Streaming基本输入源——套接字流的使用
6.9 实践任务3:Spark Streaming基本输入源——RDD队列流的使用
6.10 实践任务4:词频统计综合案例
6.11 实践任务5:输出操作——把DStream写人MySQL数据库
6.12 小结
6.13 习题
第7章 Structured Streaming结构化流
7.1 Structured Streaming概述
7.2 编程模型
7.3 输入源与输出操作
7.4 容错处理
7.5 创建Streaming DataFrame
7.6 输出Structured Streaming的结果
7.7 实践任务1:词频统计Word Count基本案例
7.8 实践任务2:基于Spark的广告点击流实时统计
7.9 实践任务3:基于Spark的电商成交额实时统计
7.10 小结
7.11 习题
第8章 Spark MLlib机器学习库
8.1 机器学习概述
8.2 Spark机器学习库MLlib简介
8.3 机器学习工作流
8.4 Spark MLlib 基本统计
8.5 分类
8.6 推荐模型
8.7 实践任务:基于Spark的电影推荐系统
8.8 小结
8.9 习题
第9章 基于Spark的电商网站用户行为统计分析
9.1 用户行为统计分析与设计
9.2 数据预处理
9.3 Spark 读取数据集
9.4 使用Spark SQL进行数据分析
9.5 使用Spark ALS进行商品推荐
9.6 使用Spark将数据写入MySQL
9.7 利用PyEcharts进行数据可视化
9.8 小结
第10章 基于Spark的餐饮平台菜品智能分析推荐系统
10.1 案例背景
10.2 智能推荐方案需求分析与设计
10.3 数据预处理
10.4 推荐模型构建
10.5 使用模型进行推荐
10.6 数据分析
10.7 数据可视化
10.8 小结
参考文献
1.1 Spark概述
1.2 Spark 架构与运行原理
1.3 Spark基础实验环境准备
1.4 实践任务1:Linux虚拟系统安装与配置
1.5 实践任务2:Spark 本地单机基础实验环境Hadoop准备
1.6 实践任务3:Spark 集群基础实验环境Hadoop准备
1.7 小结
1.8 习题
第2章 Spark本地实验环境和集群实验环境搭建
2.1 Spark本地实验环境简介
2.2 Spark集群实验环境简介
2.3 实践任务1:Spark 本地实验环境搭建
2.4 实践任务2:Spark集群实验环境搭建
2.5 小结
2.6 习题
第3章 基于 Python 开发 Spark 应用程序
3.1 基于Python开发Spark方式
3.2 Python编程语言与PySpark
3.3 PySpark的安装
3.4 PySpark的使用
3.5 spark-submit运行程序
3.6 设置Spark日志输出内容控制
3.7 实践任务1:使用Jupyter Notebook 编写Spark应用程序
3.8 实践任务2:搭建PyCharm环境编写Spark应用程序
3.9 小结
3.10 习题
第4章 Spark RDD弹性分布式数据集
4.1 RDD概述
4.2 RDD创建
4.3 RDD处理过程
4.4 RDD持久化机制
4.5 RDD分区
4.6 RDD的依赖关系
4.7 RDD在Spark中的运行流程
4.8 键值对RDD
4.9 实践任务1:词频统计
4.10 实践任务2:计算学生“大数据基础”和“Spark”两门课程的平均成绩
4.11 实践任务3:编写独立应用程序实现求平均值
4.12 小结
4.13 习题
第5章 Spark SQL结构化数据文件处理
5.1 Spark SQL概述
5.2 DataFrame
5.3 实践任务1:Spark SQL基本操作
5.4 实践任务2:编程实现将RDD转换为DataFrame
5.5 实践任务3:编程实现使用DataFrame 读写MySQL 数据
5.6 小结
5.7 习题
第6章 Spark Streaming实时计算框架
6.1 实时计算概述
6.2 Spark Streaming概述
6.3 Spark 流数据加载
6.4 DStream转换算子
6.5 DStream窗口操作
6.6 DStream输出操作
6.7 实践任务1:Spark Streaming基本输入源—文件流的使用
6.8 实践任务2:Spark Streaming基本输入源——套接字流的使用
6.9 实践任务3:Spark Streaming基本输入源——RDD队列流的使用
6.10 实践任务4:词频统计综合案例
6.11 实践任务5:输出操作——把DStream写人MySQL数据库
6.12 小结
6.13 习题
第7章 Structured Streaming结构化流
7.1 Structured Streaming概述
7.2 编程模型
7.3 输入源与输出操作
7.4 容错处理
7.5 创建Streaming DataFrame
7.6 输出Structured Streaming的结果
7.7 实践任务1:词频统计Word Count基本案例
7.8 实践任务2:基于Spark的广告点击流实时统计
7.9 实践任务3:基于Spark的电商成交额实时统计
7.10 小结
7.11 习题
第8章 Spark MLlib机器学习库
8.1 机器学习概述
8.2 Spark机器学习库MLlib简介
8.3 机器学习工作流
8.4 Spark MLlib 基本统计
8.5 分类
8.6 推荐模型
8.7 实践任务:基于Spark的电影推荐系统
8.8 小结
8.9 习题
第9章 基于Spark的电商网站用户行为统计分析
9.1 用户行为统计分析与设计
9.2 数据预处理
9.3 Spark 读取数据集
9.4 使用Spark SQL进行数据分析
9.5 使用Spark ALS进行商品推荐
9.6 使用Spark将数据写入MySQL
9.7 利用PyEcharts进行数据可视化
9.8 小结
第10章 基于Spark的餐饮平台菜品智能分析推荐系统
10.1 案例背景
10.2 智能推荐方案需求分析与设计
10.3 数据预处理
10.4 推荐模型构建
10.5 使用模型进行推荐
10.6 数据分析
10.7 数据可视化
10.8 小结
参考文献
展开全部
本类五星书
浏览历史
本类畅销
-
硅谷之火-人与计算机的未来
¥13.7¥39.8 -
造神:人工智能神话的起源和破除 (精装)
¥32.7¥88.0 -
软件定义网络(SDN)技术与应用
¥26.9¥39.8 -
数学之美
¥41.0¥69.0 -
谁说菜鸟不会数据分析(入门篇)(第4版)
¥43.8¥69.0 -
自己动手写PYTHON虚拟机
¥31.0¥79.0 -
Photoshop平面设计实用教程
¥14.5¥39.8 -
计算机网络技术
¥24.1¥33.0 -
Excel函数.公式与图表
¥16.4¥48.0 -
.NET安全攻防指南(下册)
¥89.0¥129.0 -
RUST权威指南(第2版)
¥114.2¥168.0 -
.NET安全攻防指南(上册)
¥89.0¥129.0 -
大模型实战:微调、优化与私有化部署
¥63.4¥99.0 -
人工智能的底层逻辑
¥55.3¥79.0 -
多模态数据融合与挖掘技术
¥34.7¥45.0 -
仓颉编程快速上手
¥62.9¥89.8 -
剪映AI
¥62.6¥88.0 -
FINAL CUT短视频剪辑零基础一本通
¥28.9¥39.8 -
FLASK 2+VUE.JS 3实战派――PYTHON WEB开发与运维
¥83.8¥118.0 -
人工智能安全
¥66.4¥109.0