数据分析与可视化 9787111710233 张涛 新形态立体化教材
- ISBN:9787111710233
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:222
- 出版时间:2022-08-01
- 条形码:9787111710233 ; 978-7-111-71023-3
本书特色
适读人群 :高职院校大数据、人工智能等专业学生1.课证融合,紧贴实际 2.项目教学,融会贯通 3.注解详细,一目了然 4.课后习题,加强巩固 5.配套丰富,方便教学
内容简介
《数据分析与可视化》主要介绍目前非常流行的数据分析和数据可视化工具,首先介绍数据分析“三剑客”,即NumPy、Matplotlib和Pandas。NumPy侧重于科学计算,Matplotlib侧重于数据可视化,Pandas侧重于数据分析。然后介绍微软推出的交互式数据分析和可视化工具Power BI。 《数据分析与可视化》分为上篇和下篇,上篇介绍使用Python实现数据的分析和可视化,通过4个项目介绍NumPy、Matplotlib和Pandas的使用。下篇共4个项目,介绍使用微软的Power BI Desktop实现数据的分析和可视化。 《数据分析与可视化》适合作为高职院校大数据、人工智能等专业数据分析和可视化课程的教材,也可作为《人工智能数据处理》1+X证书的学习用书,同时也适合数据分析初学者、数据分析爱好者、数据分析工程师以及相关培训机构学员学习。
目录
前言
上篇 Python数据分析与可视化
项目1 使用NumPy分析空气质量状况
任务1.1 项目需求分析
任务1.2 环境搭建
1.2.1 开发环境介绍
1.2.2 Anaconda下载和安装
1.2.3 PyCharm集成开发环境下载和安装
任务1.3 数据获取
1.3.1 通过网络爬虫爬取
1.3.2 直接从网站下载
任务1.4 数据预处理
1.4.1 读取数据
1.4.2 合并多个数据集
1.4.3 ndarray数据结构
1.4.4 去除冗余数据
1.4.5 数据持久化存储
任务1.5 科学计算
1.5.1 获取任意范围的样本数据
1.5.2 计算特征的*小值、*大值和平均值
1.5.3 统计不同空气质量等级的天数
1.5.4 预测空气质量
小结
课后习题
项目2 使用Matplotlib实现空气质量数据可视化
任务2.1 项目需求分析
任务2.2 折线图:展现AQI走势
2.2.1 实现AQI走势折线图
2.2.2 图形的优化和美化
2.2.3 添加注释
任务2.3 条形图:展现PM2.5走势
2.3.1 条形图:某月PM2.5的走势情况
2.3.2 堆叠条形图:相邻月份PM2.5值的比较
2.3.3 并排条形图:PM2.5和PM10的比较
任务2.4 散点图:展现内在相关性
任务2.5 子图:展现图表的多样性
任务2.6 饼图:展现部分和整体的关系
小结
课后习题
项目3 使用Pandas分析股票交易数据
任务3.1 项目需求分析
任务3.2 数据获取和存储
3.2.1 数据获取
3.2.2 数据存储
任务3.3 数据读取
3.3.1 读取CSV文件中的数据
3.3.2 读取Excel文件中的数据
3.3.3 获取MySQL数据库中的数据
任务3.4 数据简单处理
3.4.1 常用属性
3.4.2 查找数据
3.4.3 组装数据
3.4.4 添加数据
3.4.5 修改数据
3.4.6 删除数据
任务3.5 数据深度处理
3.5.1 数据去重
3.5.2 缺失值处理
3.5.3 数据转换
任务3.6 统计分析
3.6.1 汇总统计
3.6.2 groupby:数据分组聚合
3.6.3 agg:数据聚合
3.6.4 apply:数据聚合
3.6.5 transform:数据转换
小结
课后习题
项目4 使用Pandas实现股票交易数据可视化
任务4.1 项目需求分析
任务4.2 折线图:展现股价走势
任务4.3 散点图:展现股价影响因素
任务4.4 条形图:展现同比成交量
任务4.5 饼图:展现成交量占比关系
任务4.6 K线图:展现股价走势
小结
课后习题
下篇 Power BI数据分析与可视化
项目5 空气质量状况分析
任务5.1 项目需求分析
任务5.2 环境搭建
5.2.1 Power BI介绍
5.2.2 Power BI Desktop的下载和安装
5.2.3 Power BI Desktop操作界面介绍
任务5.3 数据预处理
5.3.1 导入数据
5.3.2 筛选数据
5.3.3 添加列
5.3.4 合并列
任务5.4 数据分析和可视化
5.4.1 折线图:空气质量走势
5.4.2 数据钻取
5.4.3 条形图:空气质量走势比较
5.4.4 饼图:空气质量优良占比
5.4.5 关键影响者图:影响AQI的因素
5.4.6 编辑交互
5.4.7 筛选器
5.4.8 切片器
小结
课后习题
项目6 企业财务报表数据分析
任务6.1 项目需求分析
任务6.2 数据获取
任务6.3 数据预处理
6.3.1 导入数据
6.3.2 删除数据
6.3.3 处理缺失值
6.3.4 逆透视数据表
6.3.5 转换数据
6.3.6 处理股票交易数据
任务6.4 数据建模
6.4.1 新建项目名称表
6.4.2 使用DAX新建日期表
6.4.3 创建表之间的关联
任务6.5 数据分析和可视化
6.5.1 度量值:计算关键指标
6.5.2 卡片图:展示关键指标数据
6.5.3 矩阵图:罗列关键数据
6.5.4 瀑布图:分析营业总成本
6.5.5 K线图:展现走势与趋势
小结
课后习题
项目7 银行客户营销分析
任务7.1 项目需求分析
任务7.2 数据预处理
任务7.3 数据分析和可视化
7.3.1 仪表盘:订阅率
7.3.2 折线和堆积柱形图:影响订阅率的因素
7.3.3 簇状柱形图:是否回头客因素对订阅率的影响
7.3.4 关键影响者图:影响订阅率的因素
7.3.5 问答系统
小结
课后习题
项目8 电商App用户购物行为分析
任务8.1 项目需求分析
任务8.2 下载并安装MySQL数据库服务器
任务8.3 将数据导入到MySQL数据库中
任务8.4 数据获取
任务8.5 数据预处理
任务8.6 数据分析和可视化
8.6.1 多行卡:关键指标数据
8.6.2 漏斗图:从浏览到购买的转化率
8.6.3 折线图:不同时段的浏览量和购买量
8.6.4 环形图:RFM模型
小结
课后习题
附录
附录A NumPy常用属性和函数
附录B Pandas常用属性和函数
附录C DAX常用函数
作者简介
张涛,男,中国科学技术大学软件工程硕士,安徽信息工程学院特聘讲师,主持参与高等院校人工智能课程改革,课程研发任务。著有《从零开始学Scrapy网络爬虫》一书。拥有6年外企证券行业软件开发和管理经验、5年计算机相关教学改革和教学实施经验、3年人工智能领域教育教学设计和实施经验。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0