PYTHON数据分析与挖掘(微课视频版)
- ISBN:9787302631873
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:280
- 出版时间:2023-05-01
- 条形码:9787302631873 ; 978-7-302-63187-3
本书特色
1.本书由浅入深地讲解Python编程知识,理论与实践结合,由浅入深。
2.以综合实战项目贯穿课程始终,使读者真抓实干,提高分析解决问题的能力。
3.在科学计算库和深度学习中又设置了具体案例,激发学生的学习兴趣。
4.编写了10个精彩案例和100个微课视频,帮助学生资助学习。
5.可作为计算机科学与技术、人工智能、数据科学与大数据技术、软件工程专业的学习用书
内容简介
本书在介绍Python语言基本知识的基础上,着重介绍了Python语言在数据获取、数据分析与数据挖掘等方面的应用。本书设置一个实战项目贯穿全书内容,每章引导读者综合运用本章知识点解决或改进本项目的某些任务,从数据的获取、处理、分析、可视化到知识的挖掘,逐步完成一个数据分析与挖掘项目。这是一本适应新工科、应用型人才培养的数据分析与挖掘的案例式图书。 本书共9章,包括Python语言概述、Python编程基础、Python爬虫技术、科学计算库(Numpy)、数据分析处理库(Pandas)、数据展示库(Matplotlib)、数据挖掘基础、Scikitlearn数据挖掘实战、初识深度学习等内容。本书体系完整,重点突出,资源丰富。 本书适合计算机科学与技术、数据科学与大数据技术、人工智能以及相关理工专业的本科生、研究生使用,也适合从事数据咨询、研究或分析等人士参考使用。
目录
1.1Python简介1
1.1.1Python语言的特点2
1.1.2Python语言的应用2
1.2Python开发工具3
1.2.1Python代码编辑器3
1.2.2Python集成开发环境3
1.3Python编程规范4
1.4使用Spyder创建 Python 程序5
1.4.1Anaconda5
1.4.2标准库、扩展库的安装和升级7
1.4.3标准库、扩展库对象的导入7
1.4.4编写个Python程序8
1.5综合实战项目介绍10
1.6本章知识要点11
1.7习题11
第2章Python编程基础12
2.1变量及数据类型14
2.1.1数字14
2.1.2字符串14
2.1.3列表、元组、字典、集合15
2.2运算符、表达式和内置函数16
2.3列表20
2.3.1列表的创建20
2.3.2列表的基本操作21
2.3.3切片操作24
2.3.4列表推导式24
2.4元组26
2.4.1元组的创建26
2.4.2元组的基本操作26
2.4.3序列解包27
2.4.4生成器表达式27
2.5字典28
2.5.1字典的创建28
2.5.2字典的基本操作28
2.5.3字典推导式30
2.6集合31
2.6.1集合的创建31
2.6.2集合的基本操作31
2.6.3集合的运算32
2.6.4集合推导式33
2.7字符串34
2.7.1字符串的格式化34
2.7.2字符串的常用方法36
2.8选择结构、循环结构39
2.8.1选择结构39
2.8.2循环结构41
2.9函数43
2.9.1函数的定义与调用44
2.9.2函数的参数传递45
2.9.3lambda表达式47
2.10本章知识要点48
2.11习题48
第3章Python爬虫技术50
3.1案例导入51
3.2认识爬虫51
3.2.1爬虫的基本概念51
3.2.2爬虫的工作流程53
3.2.3爬虫的合法性与robots协议53
3.3网页下载器54
3.3.1HTTP的请求信息54
3.3.2Requests库的安装56
3.3.3Requests库的请求和响应56
3.4网页解析器59
3.4.1lxml库的安装59
3.4.2XPath常用语法60
3.4.3lxml库应用实例62
3.5案例实现63
3.6多线程数据获取70
3.7本章知识要点72
3.8习题73
第4章科学计算库(Numpy)74
4.1数组对象ndarray75
4.1.1数组的创建75
4.1.2数组的属性77
4.1.3索引与切片77
4.2ndarray数组的操作78
4.2.1数组元素的修改78
4.2.2数组形状的修改79
4.2.3数组的排序80
4.2.4数组的合并与分割81
4.3ndarray数组的运算82
4.3.1数组与标量的运算82
4.3.2数组与数组的运算83
4.3.3统计函数84
4.3.4布尔运算85
4.3.5分段函数85
4.3.6数组的集合运算86
4.4矩阵的常用操作87
4.4.1矩阵的生成87
4.4.2矩阵的统计方法87
4.4.3矩阵的转置88
4.4.4计算逆矩阵89
4.4.5计算方差、协方差及相关系数矩阵89
4.5Numpy应用案例90
4.5.1案例说明90
4.5.2案例分析91
4.5.3线性插值91
4.5.4实现代码91
4.6本章知识要点93
4.7习题93
第5章数据分析处理库(Pandas)95
5.1案例导入97
5.2Pandas常用数据类型97
5.2.1Series类型97
5.2.2DataFrame类型101
5.3读写外部数据102
5.3.1CSV文件的读取102
5.3.2CSV文件的写入104
5.4数据查看与筛选105
5.5统计分析109
5.6数据预处理111
5.6.1重复值处理112
5.6.2缺失值处理113
5.6.3异常值处理117
5.6.4类型转换120
5.6.5标准化数据121
5.6.6数据合并与连接122
5.7排序与分组125
5.7.1排序125
5.7.2分组与汇总127
5.8透视表与交叉表129
5.8.1透视表129
5.8.2交叉表130
5.9案例实现131
5.10本章知识要点136
5.11习题136
第6章数据展示库(Matplotlib)138
6.1案例导入139
6.2Matplotlib简介140
6.3使用Matplotlib库绘制各种图形140
6.3.1绘制折线图140
6.3.2绘制柱状图142
6.3.3绘制散点图143
6.3.4绘制饼图144
6.3.5绘制箱线图146
6.3.6绘制六边形分箱图148
6.4切分绘图区域149
6.5设置图例样式151
6.6保存绘图结果153
6.7词云图154
6.8案例实现156
6.9本章知识要点158
6.10习题159
第7章数据挖掘基础160
7.1数据挖掘的基本概念161
7.1.1数据挖掘的常用术语162
7.1.2数据挖掘的流程164
7.2Scikitlearn简介165
7.2.1Scikitlearn常用方法165
7.2.2Scikitlearn常用数据集170
7.3本章知识要点172
7.4习题173
第8章Scikitlearn数据挖掘实战174
8.1构建并评估回归模型175
8.1.1案例导入——房屋租金回归分析175
8.1.2线性回归算法原理176
8.1.3线性回归算法评估177
8.1.4Scikitlearn实现线性回归177
8.1.5案例实现180
8.2构建并评估分类模型186
8.2.1案例导入——鸢尾花分类186
8.2.2KNN算法原理187
8.2.3决策树算法原理188
8.2.4分类算法评估190
8.2.5Scikitlearn实现KNN和决策树分类191
8.2.6案例实现194
8.3构建并评估聚类模型198
8.3.1案例导入——客户聚类198
8.3.2Kmeans聚类算法原理199
8.3.3DBSCAN算法原理200
8.3.4聚类算法评估201
8.3.5Scikitlearn实现Kmeans和DBSCAN聚类201
8.3.6案例实现207
8.4构建并评估关联规则模型212
8.4.1案例导入——超市购物篮分析212
8.4.2Apriori算法原理213
8.4.3关联规则的评价指标215
8.4.4案例实现216
8.5本章知识要点222
8.6习题223
第9章初识深度学习225
9.1案例导入226
9.2卷积神经网络228
9.2.1人工神经网络228
9.2.2卷积230
9.2.3池化231
9.2.4激活函数231
9.2.5损失函数233
9.3经典卷积神经网络模型234
9.3.1LeNet234
9.3.2AlexNet235
9.3.3VGGNet235
9.3.4GoogLeNet236
9.3.5ResNet237
9.3.6DenseNet239
9.4Keras框架及其应用示例240
9.4.1TensorFlow的安装240
9.4.2Keras的安装243
9.4.3Keras常用模块及应用示例244
9.5案例实现250
9.6本章知识要点256
9.7习题257
附录A常用Python标准库和扩展库及其方法258
附录B综合实训项目参考265
参考文献267
作者简介
王丽丽,副教授,博士,硕士生导师。主要从事计算机领域的教学与科学研究,讲授计算机专业课程10余门,主编或参编多部教材。主持国家自然科学基金项目1项,参与国家级或省级项目5项,发表SCI、El等学术论文10余篇。近年来致力于交叉学科研究,将Pvthon数据分析与挖掘应用于天文数据中,探寻数据中的宇宙。
-
机器学习
¥59.4¥108.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥46.3¥79.8 -
企业AI之旅
¥43.5¥79.0 -
ANSYS WORKBENCH中文版超级学习手册
¥69.9¥99.8 -
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥11.2¥32.0 -
C Primer Plus 第6版 中文版
¥68.0¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
基于深度学习的人体行为识别算法研究
¥37.2¥62.0 -
粒子群算法在优化选取问题中的应用研究
¥40.8¥68.0 -
智能优化算法MATLAB仿真实例
¥54.0¥90.0 -
Web前端开发基础
¥36.5¥57.0 -
智能算法优化及其应用
¥49.0¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
网络工程师教程(第6版)(全国计算机技术与软件专业技术资格(水平)考试用书)
¥62.3¥89.0 -
SNS信息传播分析
¥48.3¥69.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
HARMONYOS NEXT启程:零基础构建纯血鸿蒙应用
¥81.0¥108.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0