
包邮大数据分析及应用项目教程(SPARK SQL)

- ISBN:9787121463631
- 装帧:平塑
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:224
- 出版时间:2023-09-01
- 条形码:9787121463631 ; 978-7-121-46363-1
内容简介
本书以项目任务为载体串联知识与技能,介绍基于 Spark SQL 技术的大数据分析方法,培养 学习者使用 Spark SQL 技术解决实际数据分析问题的能力,主要内容有大数据分析概述、实践环 境准备、学生信息处理分析、房产大数据分析与探索、电商大数据分析与探索、Zepplin 数据可视 化。在实现任务的过程中详细阐述了 Scala 语言基础、Spark SQL 编程分析、Spark SQL 数据分 析与探索、数据可视化等知识。本书适合作为高等职业院校计算机、大数据、人工智能及相关专业的教材或参考书,也可以 作为数据分析人员的参考书。
目录
任务 1.1 关于大数据分析............................................................................................. 1
情境导入 ........................................................................................................ 1
学习目标和要求 ............................................................................................ 1
1.1.1 什么是大数据分析 ............................................................................ 2
1.1.2 大数据分析工具 ................................................................................ 5
1.1.3 大数据分析可视化 ............................................................................ 8
任务 1.2 认识 Spark SQL ............................................................................................. 8
情境导入 ........................................................................................................ 8
学习目标和要求 ............................................................................................ 8
1.2.1 Spark SQL 的背景简介 ..................................................................... 9
1.2.2 Spark SQL 的运行原理 ................................................................... 10
脑图小结......................................................................................................................... 14
章节练习......................................................................................................................... 16
第 2 章 实践环境准备 ...........................................................................................17
任务 2.1 Hadoop 集群环境搭建 ................................................................................. 17
情境导入 ...................................................................................................... 17
学习目标和要求 .......................................................................................... 18
2.1.1 环境准备 .......................................................................................... 18
2.1.2 安装 Hadoop..................................................................................... 35
2.1.3 启动 Hadoop 集群............................................................................ 45
2.1.4 运行经典案例 wordcount ................................................................ 48
任务 2.2 Spark 集群部署与使用 ................................................................................ 50
情境导入 ...................................................................................................... 50
学习目标和要求 .......................................................................................... 50
2.2.1 安装 Spark ........................................................................................ 50
2.2.2 启动 Spark ........................................................................................ 54
2.2.3 Spark 集群测试 ................................................................................ 56
任务 2.3 安装 Scala ..................................................................................................... 60
情境导入 ...................................................................................................... 60
学习目标和要求 .......................................................................................... 60
2.3.1 下载 Scala 安装包............................................................................ 61
2.3.2 Scala 安装配置................................................................................. 61
脑图小结......................................................................................................................... 62
章节练习......................................................................................................................... 63
第 3 章 学生信息处理分析 ....................................................................................65
任务 3.1 班级基本情况分析....................................................................................... 66
情境导入 ...................................................................................................... 66
学习目标和要求 .......................................................................................... 66
3.1.1 学生所属班级和男女生数量 .......................................................... 67
3.1.2 以班级为单位整理学生信息 .......................................................... 84
任务 3.2 学生基本情况分析....................................................................................... 96
情境导入 ...................................................................................................... 96
学习目标和要求 .......................................................................................... 96
3.2.1 学生特长情况分析 .......................................................................... 96
3.2.2 学生成绩情况分析 ........................................................................ 102
脑图小结....................................................................................................................... 105
章节练习....................................................................................................................... 106
第 4 章 房产大数据分析与探索 ...........................................................................108
任务 4.1 某房产公司销售人员业绩分析............................................................... 108
情境导入 .................................................................................................... 108
学习目标和要求 ........................................................................................ 110
4.1.1 数据集处理 .................................................................................... 110
4.1.2 数据操作分析 ................................................................................ 116
任务 4.2 某城市近年房产销售状况分析................................................................. 131
情境导入 .................................................................................................... 131
学习目标和要求 ........................................................................................ 132
4.2.1 数据准备 ........................................................................................ 132
4.2.2 数据探索与分析 ............................................................................ 134
4.2.3 总结分析 ........................................................................................ 139
脑图小结....................................................................................................................... 139
章节练习....................................................................................................................... 140
第 5 章 电商大数据分析与探索 ...........................................................................141
任务 5.1 “女装电子商务评论”数据分析........................................................ 141
情境导入 .................................................................................................... 141
学习目标和要求 ........................................................................................ 142
5.1.1 数据准备 ..................................................................................... 142
5.1.2 数据清洗 ..................................................................................... 152
5.1.3 数据转换 ..................................................................................... 157
5.
作者简介
许慧(1991.10—),女,浙江大学空天信息技术硕士,衢州职业技术学院专职教师,从事大数据技术教学和科研工作。2022年主持"浙江省高等学校课程思政示范课程项目”《大数据集群环境搭建实训》课程建设项目。主持"衢州职业技术学院课程思政示范课程项目”《大数据挖掘与分析》课程建设。主持2019年衢州市指导性科技计划项目"基于大数据的衢州电商客户数据信息安全技术研究”。
-
北大人文课(平装)
¥12.7¥45.0 -
落洼物语
¥11.0¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥31.2¥48.0 -
中医基础理论
¥51.7¥59.0 -
马克思主义基本原理(2023年版)
¥14.1¥23.0 -
“十三五”普通高等教育本科部委级规划教材西方服装史(第3版)
¥16.9¥49.8 -
剧本写作教程
¥21.6¥45.0 -
精读韩国新闻,学地道韩语韩国新闻导读教程
¥13.6¥36.0 -
欧美卷-外国文学史-第五版
¥14.3¥39.0 -
犯罪学
¥14.3¥39.0 -
房屋建筑学(第六版)(赠教师课件,含数字资源)
¥41.3¥62.0 -
新能源汽车综合故障诊断
¥32.8¥49.0 -
政策科学——公共政策分析导论(第二版)
¥47.8¥78.0 -
马克思恩格斯列宁哲学经典著作导读(第2版马克思主义理论研究和建设工程重点教材)
¥37.6¥61.0 -
全国中医药行业高等教育经典老课本中药学新世纪第2版
¥45.9¥69.0 -
博雅大学堂·历史中国古代简史(第2版)/张帆
¥38.8¥60.0 -
普通心理学学习手册
¥20.8¥36.0 -
马克思主义理论研究和建设工程重点教材:管理学(本科教材)
¥19.2¥48.0 -
高绩效教练(原书第5版)
¥50.0¥79.0 -
大学生心理健康
¥14.0¥48.0