- ISBN:9787301289495
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:352
- 出版时间:2020-09-01
- 条形码:9787301289495 ; 978-7-301-28949-5
本书特色
内容全面:借助5大Python工具库,实现数据分析从获取到建模全流程覆盖; 贴合实际:不空讲Python语法,清晰简明地介绍如何用Python来处理、分析数据; 热点案例:覆盖6大热点应用领域,可直接参考研发,实现数据变现; 学习资源:提供所有案例源代码和数据,供读者操作练习,快速上手
内容简介
本书主要围绕整个数据分析方法论的常规流程,介绍了Python常用的工具包,包括科学计算库Numpy、数据分析库Pandas、数据挖掘库Scikit-Learn,以及数据可视化库Matplotlib和Seaborn的基本知识,并从数据分析挖掘的实际业务应用出发,讲解了互联网、金融及零售等行业的真实案例,比如客户分群、产品精准营销、房价预测、特征降维等,深入浅出、循序渐进地介绍了Python数据分析的全过程。 本书内容精炼、重点突出、案例丰富,适合在企业中从事数据分析、数据挖掘、机器学习等工作的人员学习使用,同样适合想从事数据分析挖掘工作的各大中专院校的学生与教师,以及其他对数据分析挖掘技术领域有兴趣爱好的各类人员。
目录
11.1 什么是数据分析2
1.2 数据分析标准流程2
1.3 数据清洗7
1.4 数据探索8
1.5 模型开发10
1.6 模型应用11
第二章 初识Python12
2.1 Python基本概述13
2.2 Python编程语法基础14
2.3 数据分析常用Python库22
2.4 第三方Python库介绍23
第三章 NumPy数组与矩阵25
3.1 Ndarray对象26
3.2 数据类型27
3.3 数组属性28
3.4 创建数组30
3.5 数据索引与切片34
3.6 数组操作37
3.7 数组排序51
3.8 函数54
3.9 矩阵62
第四章 Pandas数据分析65
4.1 系列(Series)66
4.2 数据帧(DataFrame)68
4.3 基本功能介绍70
4.4 读取和写入数据78
4.5 索引和选择数据84
4.6 数据合并87
4.7 累计与分组91
4.8 时间序列处理96
4.9 缺失数据处理101
4.10 函数107
4.11 描述性统计115
4.12 绘制图形118
第五章 Scikit-Learn数据挖掘126
5.1 机器学习问题127
5.2 机器学习的基本流程127
5.3 数据处理128
5.4 特征选择131
5.5 模型调用135
5.6 模型参数说明138
5.7 交叉验证148
5.8 模型部署151
第六章 数据可视化153
6.1 Matplotlib绘制图形154
6.2 Seaborn绘制图形163
6.3 重要类型图形的绘制184
第七章 数据导入与导出192
7.1 连接数据库193
7.2 读取外部数据194
7.3 导出数据201
第八章 数据预处理203
8.1 数据去重204
8.2 缺失值处理205
8.3 变量操作210
8.4 样本选择217
8.5 数据集操作220
第九章 数据探索226
9.1 集中趋势227
9.2 离散程度230
9.3 分布状态234
9.4 相关分析236
第十章 线性回归分析241
10.1 线性回归模型242
10.2 *小二乘估计243
10.3 显著性检验244
10.4 预测245
10.5 相关性246
10.6 共线性247
10.7 案例分析——波士顿地区房价预测247
第十一章 Logistic回归分析260
11.1 逻辑回归模型介绍261
11.2 案例分析——泰坦尼克生存预测262
第十二章 决策树275
12.1 决策树介绍276
12.2 案例分析——金融产品推荐277
第十三章 主成分分析292
13.1 主成分分析的数学模型293
13.2 PCA函数说明294
13.3 案例分析——数据降维295
第十四章 聚类分析304
14.1 距离305
14.2 聚类方法306
14.3 确定聚类数309
14.4 聚类的分析步骤311
14.5 案例分析——客户群聚类分析312
第十五章 时间序列分析323
15.1 时间序列的组成部分324
15.2 确定性的时间序列模型325
15.3 随机时间序列模型325
15.4 ARMA模型的识别327
15.5 时间序列的分析步骤329
15.6 模型参数的估计329
15.7 案例分析——大气二氧化碳浓度预测331
作者简介
尚涛,毕业于上海交通大学数学系,拥有数学硕士学位,研究方向为数据挖掘及机器学习领域,曾任职于平安科技、易方达基金。现任职于南方基金,专注于信用风险评分、精准营销、推荐系统等领域的数据挖掘项目的研发工作,拥有超过10年的数据挖掘和优化建模经验,以及多年使用Python、SAS、R等软件的经验。在从业经历中,为所在公司的业务方成功实施了众多深受好评的数据挖掘项目,取得了较好的业务价值。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0