- ISBN:9787302658030
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:200
- 出版时间:2024-03-01
- 条形码:9787302658030 ; 978-7-302-65803-0
本书特色
《Spark 3 x综合项目实战》力求做到每个任务都有可见的结果,给学生以成就感,激发学生继续学习的热情。每个任务的内
容适合一次课程完成。《Spark 3 x综合项目实战》注重实践,突出应用与操作,既可作为高职高专院校、计算机培训学校相关课程的教材
内容简介
《Spark 3 x综合项目实战》分为基础篇、案例篇两部分。在基础篇(第1-2章)中首先介绍了Spark运行环境的搭建、Spark的生态体系、编程模型、Scala基本语法、高阶函数、集合等方面的基础知识;在案例篇(第3-7章)中的5个综合案例详实的介绍了如何使用Spark实现音乐、房地产、气象、电商等领域大数据分析与挖掘的技巧。主要目的是通过Spark综合应用项目,帮助读者食味知髓,领悟Spark项目的精妙而步步渐悟,修炼成Spark高手。同时,本书还提供了详细的实训指导、数据源和程序代码等配套资源。 《Spark 3 x综合项目实战》既可以作为普通高等院校大数据、计算机、人工智能等相关专业的本科生、研究生的实验实训教材,也可以作为大学生竞赛、毕业论文的重要素材和参考读物。同时,也可满足数据分析从业人员及数据挖掘爱好者的需要。
目录
第1 章 Spark 概述 2
1.1 认识Spark 2
1.2 了解Spark 生态系统 3
1.3 Spark 环境安装 4
1.3.1 安装JDK 5
1.3.2 Hadoop 集群搭建 6
1.3.3 Spark 安装及配置 9
1.4 Spark 初体验 12
1.5 掌握Spark 编程模型 14
本章小结 16
本章练习 16
第2 章 Spark 基础 17
2.1 Scala 初识 17
2.1.1 学习使用Scala 解释器 18
2.1.2 Scala 变量定义 18
2.1.3 Scala 数据类型 19
2.1.4 Scala 算术运算符 20
2.1.5 Scala 关系运算符 21
2.1.6 Scala 逻辑运算符 22
2.1.7 Scala 选择结构 22
2.1.8 Scala 循环结构 23
2.1.9 Scala 数组 25
2.1.10 Scala 函数 26
2.1.11 Scala 元组 30
2.1.12 Scala 集合 30
2.2 计算淡旺季飞机票的价格 36
2.3 按班级计算学生平均分 37
2.4 计算城市气温的均值 38
本章小结 38
本章练习 39
案 例 篇
第3 章 流行音乐数据分析 42
3.1 项目背景 42
3.2 分析任务 42
3.3 技术准备 43
3.3.1 实验环境 43
3.3.2 Spark RDD 43
3.3.3 Spark 编程入门 49
3.3.4 Spark 运行架构 53
3.3.5 Spark 运行模式 53
3.4 任务实现 58
3.4.1 数据源 58
3.4.2 架构设计 59
3.4.3 设计思路 60
3.4.4 数据分析 61
3.4.5 可视化展示 68
3.5 部署运行 74
本章小结 77
本章练习 77
第4 章 区域性房屋交易数据分析 79
4.1 项目背景 79
4.2 分析任务 79
4.3 技术准备 80
4.3.1 实验环境 80
4.3.2 Spark SQL 80
4.4 任务实现 88
4.4.1 数据源 88
4.4.2 架构设计 89
4.4.3 设计思路 91
4.4.4 统计分析 91
4.4.5 可视化展示 96
4.5 部署运行 105
本章小结 107
本章练习 107
第5 章 基于数据挖掘的气象分析 109
5.1 项目背景 109
5.2 分析任务 109
5.3 技术准备 109
5.3.1 实验环境 109
5.3.2 HBase 110
5.3.3 Spark MLlib 机器学习 118
5.4 任务实现 122
5.4.1 数据源导入HBase 122
5.4.2 架构设计 124
5.4.3 设计思路 125
5.4.4 数据分析 125
5.4.5 可视化展示 131
5.4.6 气温预测分析 135
5.5 部署运行 140
本章小结 141
本章练习 141
第6 章 基于广告流量数据的实时分析 143
6.1 项目背景 143
6.2 实现任务 143
6.3 技术准备 144
6.3.1 实验环境 144
6.3.2 Kafka 144
6.3.3 Spark Streaming 149
6.3.4 Spark Streaming 整合Kafka 操作 151
6.4 任务实现 152
6.4.1 数据源 152
6.4.2 架构设计 153
6.4.3 设计思路 154
6.4.4 数据实时发送 154
6.4.5 实时分析 158
6.4.6 可视化展示 165
6.5 部署运行 169
本章小结 170
本章练习 171
第7 章 基于多元分析的电影智能推荐系统 172
7.1 项目背景 172
7.2 实现任务 172
7.3 技术准备 172
7.3.1 实验环境 172
7.3.2 交替*小二乘推荐算法 173
7.4 过程实现 175
7.4.1 架构设计 175
7.4.2 设计思路 176
7.4.3 电影数据分析 176
7.4.4 电影智能推荐 181
7.5 部署与运行 187
本章小结 188
本章练习 188
参考文献 190
作者简介
马卫花,西安五润信息技术有限公司项目经理,高级工程师。主持参与银行、旅游、交通等多个大型企业项目和大数据项目的研发,主要研究方向为大数据、移动开发、项目管理等,承担众多985和211学校的大数据和人工智能的实践课程的实习实训。 张文胜,西安欧亚学院教师,副教授。主要研究方向为移动应用开发,大数据等,主持多项省部级项目,主编教材10余部。 段毅,西安电子科技大学教师,副教授,软件工程硕士,具有二十余年软件工程实践教学工作经验,主要研究方向为软件工程,大数据,指导学生参加ACM-ICPC等程序设计类竞赛获得国际国内金银奖多项。
-
全图解零基础word excel ppt 应用教程
¥15.6¥48.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
机器学习
¥59.4¥108.0 -
情感计算
¥66.8¥89.0 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥48.3¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
LINUX实战——从入门到精通
¥48.3¥69.0 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥38.7¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0