Spark大数据分析技术(Python版·微课版)
- ISBN:9787302625520
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:260
- 出版时间:2023-03-01
- 条形码:9787302625520 ; 978-7-302-62552-0
本书特色
内容系统全面:全面介绍Spark3.2.0的生态组件。 原理浅显易懂:理论实践结合案例丰富注释详尽。 大数据可视化:WordCloud、PyeCharts、Plotly。 算法代码实现:使用Python实现书中所有算法。 配套资源丰富:配有教学课件、数据集和源代码。
内容简介
本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、Spark RDD编程、Spark SQL结构化数据处理、HBase分布式数据库、Spark Streaming流计算、Spark MLlib机器学习、数据可视化。 本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程、数据科学与大数据技术、人工智能等专业的大数据课程教材,也可供从事大数据开发和研究工作的工程师和科技工作者参考。
目录
第1章 大数据技术概述
1.1 大数据的基本概念
1.1.1 大数据的定义
1.1.2 大数据的特征
1.1.3 大数据思维
1.2 代表性大数据技术
1.2.1 Hadoop
1.2.2 Spark
1.2.3 Flink
1.3 大数据编程语言
1.4 在线资源
1.5 拓展阅读——三次信息化浪潮的启示
1.6 习题
第2章 Spark大数据处理框架
2.1 Spark概述
2.1.1 Spark的产生背景
2.1.2 Spark的优点
2.1.3 Spark的应用场景
2.1.4 Spark的生态系统
2.2 Spark运行机制
2.2.1 Spark基本概念
2.2.2 Spark运行架构
2.3 在VirtualBox上安装Linux集群
2.3.1 Master节点的安装
2.3.2 虚拟机克隆安装Slavel节点
2.4 Hadoop安装前的准备工作
2.4.1 创建hadoop用户和更新APT
2.4.2 安装SSH、配置SSH无密码登录
2.4.3 安装Java环境
2.4.4 Linux系统下Scala版本的Eclipse的安装与配置
2.4.5 Eclipse环境下Java程序开发实例
2.5 Hadoop的安装与配置
2.5.1 下载Hadoop安装文件
2.5.2 Hadoop单机模式配置
2.5.3 Hadoop伪分布式模式配置
2.5.4 Hadoop分布式模式配置
2.6 Spark的安装与配置
2.6.1 下载Spark安装文件
2.6.2 单机模式配置
2.6.3 伪分布式模式配置
2.7 使用PySpark编写Python代码
2.8 安装pip工具和常用的数据分析库
2.9 安装Anaconda和配置Jupyter Notebook
2.9.1 安装Anaconda
2.9.2 配置Jupyter Notebook
2.9.3 运行Jupyter Notebook
2.9.4 配置Jupyter Notebook实现和PySpark交互
2.9.5 为Anaconda安装扩展库
2.10 拓展阅读——Spark诞生的启示
2.11 习题
……
第3章 Spark RDD编程
第4章 Spark SQL结构化数据处理
第5章 HBase分布式数据库
第6章 Spark Streaming流计算
第7章 Spark MLlib机器学习
第8章 数据可视化
参考文献
作者简介
曹洁,博士,毕业于同济大学计算机软件与理论专业;研究方向为大数据技术、并行分布式处理等。在《软件学报》《电子学报》《计算机研究与发展》《通信学报》等核心期刊上发表学术论文十余篇;主讲Python语言程序设计、大数据技术、大数据分析等课程;主编出版7《Python语言程序设计》《Python数据挖掘技术及应用》《Hadoop+Spark大数据技术》等多本省部级规划教材。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0