Python数据挖掘 入门、进阶与实用案例分析
- ISBN:9787111730101
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:336
- 出版时间:2023-07-01
- 条形码:9787111730101 ; 978-7-111-73010-1
本书特色
(1)作者背景资深:作者是泰迪科技董事长,在大数据、数据挖掘、数据科学、人工智能领域有20余年数据挖掘教学、科研和项目实战经验。(2)以实战为导向:不似传统入门书“理论 实践”的风格,而是用11个综合案例为驱动,将数据挖掘的技术、流程、方法融入实战案例中。(3)源于经典赛事:本书11个案例精选自数据挖掘领域知名赛事“泰迪杯”,该赛事已举办10届,1500余所高校的10余万师生参赛。(4)配套资源丰富:本书提供建模平台、视频讲解、习题及答案、作者答疑、数据文件、程序代码、教学课件、模型服务、教学平台、就业推荐等10项超值服务。
内容简介
这是一本以项目实战案例为驱动的数据挖掘著作,它能帮助接近没有Python编程基础和数据挖掘基础的读者快速掌握Python数据挖掘的技术、流程与方法。在写作方式上,本书与传统的“理论与实践结合”的入门书不同,它以数据挖掘领域的知名赛事“泰迪杯”数据挖掘挑战赛(已举办10届)和“泰迪杯”数据分析技能赛(已举办5届)(累计1500余所高校的10余万师生参赛)为依托,精选了11个经典赛题,将Python编程知识、数据挖掘知识和行业知识三者融合,让读者在实践中快速掌握电商、教育、交通、传媒、电力、旅游、制造等7大行业的数据挖掘方法。本书不仅适用于零基础的读者自学,还适用于教师教学,为了帮助读者更加高效地掌握本书的内容,本书提供了以下10项附加价值:(1)建模平台:提供一站式大数据挖掘建模平台,免配置,包含大量案例工程,边练边学,告别纸上谈兵(2)视频讲解:提供不少于600分钟Python编程和数据挖掘相关教学视频,边看边学,快速收获经验值(3)精选习题:精心挑选不少于60道数据挖掘练习题,并提供详细解答,边学边练,检查知识盲区(4)作者答疑:学习过程中有任何问题,通过“树洞”小程序,纸书拍照,一键发给作者,边问边学,事半功倍(5)数据文件:提供各个案例配套的数据文件,与工程实践结合,开箱即用,增强实操性(6)程序代码:提供书中代码的电子文件及相关工具的安装包,代码导入平台即可运行,学习效果立竿见影(7)教学课件:提供配套的PPT课件,使用本书作为教材的老师可以申请,节省备课时间(8)模型服务:提供不少于10个数据挖掘模型,模型提供完整的案例实现过程,助力提升数据挖掘实践能力(9)教学平台:泰迪科技为本书提供的附加资源提供一站式数据化教学平台,附有详细操作指南,边看边学边练,节省时间(10)就业推荐:提供大量就业推荐机会,与1500+企业合作,包含华为、京东、美的等知名企业通过学习本书,读者可以理解数据挖掘的原理,迅速掌握大数据技术的相关操作,为后续数据分析、数据挖掘、深度学习的实践及竞赛打下良好的技术基础。
目录
前 言
**篇 基础篇
第1章 数据挖掘概述 2
1.1 数据挖掘简介 2
1.2 数据挖掘的通用流程 4
1.2.1 目标分析 4
1.2.2 数据抽取 4
1.2.3 数据探索 5
1.2.4 数据预处理 5
1.2.5 分析与建模 5
1.2.6 模型评价 6
1.3 常用数据挖掘工具 6
1.4 Python数据挖掘环境配置 7
1.5 小结 9
第2章 Python数据挖掘编程基础 10
2.1 Python使用入门 10
2.1.1 基本命令 10
2.1.2 判断与循环 14
2.1.3 函数 15
2.1.4 库的导入与添加 17
2.2 Python数据分析及预处理
常用库 19
2.2.1 NumPy 19
2.2.2 pandas 20
2.2.3 Matplotlib 20
2.3 Python数据挖掘建模常用框架
和库 20
2.3.1 scikit-learn 21
2.3.2 深度学习 21
2.3.3 其他 23
2.4 小结 25
第二篇 入门篇
第3章 电商平台手机销售数据采集与
分析 28
3.1 背景与目标 28
3.1.1 背景 29
3.1.2 数据说明 29
3.1.3 目标分析 30
3.2 数据采集 31
3.2.1 手机销售数据采集 31
3.2.2 手机售后数据采集 32
3.3 数据探索与预处理 34
3.3.1 数据信息探索 34
3.3.2 缺失值处理 36
3.3.3 文本处理 37
3.4 数据可视化分析 38
3.4.1 手机的销售因素分析 38
3.4.2 用户的消费习惯分析 45
3.4.3 用户的售后评论分析 49
3.5 制定营销策略 50
3.6 小结 51
第4章 自动售货机销售数据分析与
应用 52
4.1 背景与目标 52
4.1.1 背景 52
4.1.2 数据说明 53
4.1.3 目标分析 53
4.2 数据读取与预处理 54
4.2.1 数据读取 54
4.2.2 数据清洗 55
4.2.3 数据规约 57
4.3 销售数据可视化分析 59
4.3.1 销售额和自动售货机数量的
关系 59
4.3.2 订单数量和自动售货机数量的
关系 60
4.3.3 畅销和滞销商品 63
4.3.4 自动售货机的销售情况 64
4.3.5 订单支付方式占比 67
4.3.6 各消费时段的订单用户
占比 68
4.4 销售额预测 69
4.4.1 统计周销售额 69
4.4.2 平稳性检验 70
4.4.3 差分处理 72
4.4.4 模型定阶 74
4.4.5 模型预测 74
4.5 小结 75
第5章 教育平台的线上课程推荐
策略 76
5.1 背景与目标 76
5.1.1 背景 77
5.1.2 数据说明 77
5.1.3 目标分析 78
5.2 数据探索 78
5.2.1 数据质量分析 79
5.2.2 课程单价分布分析 81
5.3 数据预处理 82
5.4 平台的运营状况分析 83
5.4.1 用户留存率 83
5.4.2 用户活跃时间 88
5.4.3 课程受欢迎程度 90
5.5 Apriori模型的构建 92
5.5.1 Apriori算法 93
5.5.2 构建Apriori模型 94
5.5.3 模型应用 97
5.6 制定课程推荐策略 98
5.7 小结 99
第三篇 进阶篇
第6章 电视产品的营销推荐 102
6.1 背景与目标 102
6.1.1 背景 103
6.1.2 数据说明 103
6.1.3 目标分析 104
6.2 数据预处理 105
6.2.1 数据清洗 105
6.2.2 数据探索 109
6.2.3 属性构建 115
6.3 分析与建模 118
6.3.1 基于物品的协同过滤推荐
模型 119
6.3.2 基于流行度的推荐算法
模型 121
6.4 模型评价 122
6.5 小结 124
第7章 运输车辆安全驾驶行为
分析 125
7.1 背景与目标 125
7.1.1 背景 126
7.1.2 数据说明 126
7.1.3 目标分析 126
7.2 构建车辆驾驶行为指标 127
7.3 数据探索分析 129
7.3.1 分布分析 129
7.3.2 相关性分析 131
7.3.3 异常值检测 132
7.4 驾驶行为聚类分析 133
7.4.1 K-Means聚类 133
7.4.2 层次聚类 135
7.4.3 高斯混合模型聚类 136
7.4.4 谱聚类 137
7.5 构建驾驶行为预测模型 139
7.5.1 构建LDA模型 139
7.5.2 构建朴素贝叶斯模型 140
7.5.3 构建神经网络模型 142
7.6 驾驶行为安全分析总结 143
7.7 小结 143
第8章 基于非侵入式负荷监测与
分解的电力数据挖掘 144
8.1 背景与目标 144
8.1.1 背景 144
8.1.2 数据说明 146
8.1.3 目标分析 148
8.2
作者简介
张良均,资深大数据专家,高级信息系统项目管理 师,广东泰迪智能科技股份有限公司董事长。 中国信访大数据学术与应用研究联盟副理事 长,中国信息协会医疗卫生和健康产业分会医 学人工智能学组常委,广东省工业与应用数学 学会常务理事,“泰迪杯”数据挖掘挑战赛发 起人。 华南师范大学、中南财经政法大学、广东 工业大学、西安理工大学、广西科技大学、重 庆交通大学、桂林电子科技大学、五邑大学等 30余所高校兼职教授或硕导。 入选国家科技专家库、广东省综合评标专 家库、广州市大数据/人工智能专家库、广东省 创新基金专家库、广州市科技专家库、广州市 节能专家库、广州公共资源交易中心专家库、 广东省科技咨询专家库。 在国内外重要学术刊物上发表论文12篇 (其中作为**作者的论文有7篇);主导编 写图书70余部,其中入选“十三五”职业教育 国家规划教材一部;承担国家级项目1项,省 部级项目4项。获得SAS、SPSS数据挖掘认 证及Hadoop开发工程师证书,具有信访、电 力、电信、银行、制造企业、电子商务、电子 政务的项目经验和行业背景,并荣获中国产学 研合作促进奖、中国南方电网公司发明专利一 等奖、广东省农业技术推广二等奖、广州市荔 湾区科学技术进步奖。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0