- ISBN:9787302616177
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:229
- 出版时间:2022-09-01
- 条形码:9787302616177 ; 978-7-302-61617-7
本书特色
本书通过机器学习与可视化组件相结合的方式,系统介绍机器学习与可视化分析相关技术,并通过实战项目讲解机器学习中*常用的数据挖掘相关知识,例如聚类、线性回归、逻辑回归以及决策树算法。特别是为了满足部分读者的需求,本书还详细介绍了深度学习的两个基础算法——文本分类与图像识别算法。
内容简介
使用机器学习进行数据可视化分析是近年来研究的热点内容之一。本书使用**的Python作为机器学习的基本语言和工具,从搭建环境开始,逐步深入到理论、代码、应用实践中去,从而使初学者能够独立使用机器学习完成数据分析。本书配套示例代码、PPT课件和答疑服务。 本书分为10章,内容包括:机器学习与Python开发环境、用于数据处理及可视化展示的Python类库、NBA赛季数据可视化分析、聚类算法与可视化实战、线性回归与可视化实战、逻辑回归与可视化实战、决策树算法与可视化实战、基于深度学习的酒店评论情感分类实战、基于深度学习的手写体图像识别实战、TensorFlow Datasets和TensorBoard训练可视化。 本书内容详尽、示例丰富,是机器学习初学者的入门书和推荐的参考书,也可作为高等院校计算机及大数据相关专业的教材使用。
目录
第1章 机器学习与Python开发环境 1
1.1 机器学习概述 1
1.1.1 机器学习的前世今生 1
1.1.2 机器学习的研究现状与方向 3
1.1.3 机器学习之美——数据的可视化 4
1.2 Python的基本安装和用法 5
1.2.1 Anaconda的下载与安装 6
1.2.2 Python编译器PyCharm的安装 8
1.2.3 使用Python实现softmax函数计算 11
1.3 Python常用类库中的threading 12
1.3.1 threading模块中的Thread类 13
1.3.2 threading中Lock类 14
1.3.3 threading中Join类 15
1.4 本章小结 16
第2章 用于数据处理及可视化展示的 Python类库 17
2.1 从小例子起步——NumPy的初步使用 17
2.1.1 数据的矩阵化 17
2.1.2 数据分析 19
2.1.3 基于统计分析的数据处理 20
2.2 图形化数据处理——Matplotlib包的使用 21
2.2.1 差异的可视化 21
2.2.2 坐标图的展示 22
2.2.3 大数据的可视化展示 23
2.3 常用的统计分析方法——相似度计算 26
2.3.1 欧几里得相似度计算 26
2.3.2 余弦相似度计算 27
2.3.3 欧几里得相似度与余弦相似度的比较 28
2.4 数据的统计学可视化展示 28
2.4.1 数据的四分位数 28
2.4.2 数据的四分位数示例 29
2.4.3 数据的标准化 32
2.4.4 数据的平行化处理 34
2.4.5 热力图——属性相关性检测 35
2.5 Python分析某地降雨量变化规律 36
2.5.1 不同年份的相同月份统计 36
2.5.2 不同月份之间的增减程度比较 38
2.5.3 每月降雨是否相关 39
2.6 本章小结 40
第3章 NBA赛季数据可视化分析 41
3.1 基于球员薪资的数据分析 41
3.1.1 关于球员薪资的一些基本分析 41
3.1.2 关于球员RPM相关性的分析 44
3.1.3 关于球员RPM数据的分析 45
3.2 Seaborn常用的数据可视化方法 46
3.2.1 关于RPM、薪资和年龄的一元可视化分析 46
3.2.2 关于RPM、薪资、年龄的二元可视化分析 47
3.2.3 关于衍生变量的可视化分析 49
3.2.4 NBA球队数据的分析结果 51
3.3 NBA赛季数据分析 53
3.3.1 关于赛季发展的一些基本分析 53
3.3.2 群星璀璨的NBA 57
3.3.3 关于球员高级数据的一些基本分析 65
3.4 本章小结 66
第4章 聚类算法与可视化实战 67
4.1 聚类的定义 67
4.1.1 衡量距离的方法 68
4.1.2 聚类算法介绍 72
4.2 经典K-means聚类算法实战 76
4.2.1 经典K-means算法的Python实现 76
4.2.2 基于Iris数据集的可视化分析 78
4.2.3 投某音还是投某宝?基于K-means的广告效果聚类分析 81
4.3 基于密度的聚类算法DBSCAN 88
4.3.1 DBSCAN算法原理与Python实现 89
4.3.2 基于sklearn的DBSCAN实战 93
4.3.3 DBSCAN的优缺点比较 95
4.4 基于层次的聚类算法 96
4.4.1 基于层次算法的原理 96
4.4.2 Agglomerative算法与示例 98
4.5 本章小结 101
第5章 线性回归与可视化实战 102
5.1 线性回归的基本内容与Python实现 102
5.1.1 什么是线性回归 102
5.1.2 *小二乘法详解 103
5.1.3 道士下山的故事——随机梯度下降算法 105
5.1.4 基于一元线性回归的比萨饼价格计算 107
5.1.5 线性回归的评价指标 109
5.1.6 线性回归应用 110
5.2 多元线性回归实战 111
5.2.1 多元线性回归的基本内容 112
5.2.2 多元线性回归的Python实现 113
5.2.3 基于多元线性回归的房价预测实战 115
5.3 本章小结 122
第6章 逻辑回归与可视化实战 123
6.1 逻辑回归的基本内容与Python实现 123
6.1.1 逻辑回归是一个分类任务 124
6.1.2 逻辑回归的基本内容 124
6.1.3 链式求导法则 126
6.1.4 逻辑回归中的Sigmoid函数 131
6.2 基于逻辑回归的鸢尾花(Iris)分类 132
6.2.1 鸢尾花数据集简介与基础可视化分析 132
6.2.2 鸢尾花数据集进阶可视化分析 135
6.2.3 基于鸢尾花数据集的数据挖掘 137
6.2.4 基于线性回归与K-means的鸢尾花数据集分类 140
6.2.5 基于逻辑回归的鸢尾花数据集分类 143
6.3 本章小结 147
第7章 决策树算法与可视化实战 148
7.1 水晶球的秘密 148
7.1.1 决策树 149
7.1.2 决策树的算法基础——信息熵 149
7.1.3 决策树的算法基础——ID3算法 151
7.2 决策树背后的信息——信息熵与交叉熵 152
7.2.1 交叉熵基本原理详解 152
7.2.2 交叉熵的表述 154
7.3 决策树实战——分类与回归树 156
7.3.1 分类树与回归树的区别 156
7.3.2 基于分类树的鸢尾花分类实战 157
7.3.2 基于回归树的波士顿房价预测 158
7.4 基于随机森林的信用卡违约实战 159
7.4.1 随机森林的基本内容 159
7.4.2 随机森林与决策树的可视化比较 161
7.4.3 基于随机森林的信用卡违约检测 164
7.5 本章小结 175
第8章 基于深度学习的酒店评论情感分类实战 176
8.1 深度学习 176
8.1.1 何为深度学习 176
8.1.2 与传统的“浅层学习”的区别 178
8.2 酒店评论情感分类——深度学习入门 178
8.3 深度学习的流程、应用场景和模型分类 182
8.3.1 深度学习的流程与应用场景 182
8.3.2 深度学习的模型分类 183
8.3 本章小结 184
第9章 基于深度学习的手写体图像识别实战 185
9.1 卷积运算的基本概念 185
9.1.1 卷积运算 186
9.1.2 TensorFlow中卷积函数的实现 187
9.1.3 池化运算 189
9.1.4 softmax激活函数 190
9.1.5 卷积神经网络原理 191
9.2 MNIST手写体识别 193
9.2.1 MNIST数据集 193
9.2.2 MNIST数据集特征和标签 195
9.2.3 卷积神经网络编程实战:MNIST数据集 197
9.3 基于多层感知机的手写体识别 200
9.3.1 多层感知机的原理与实现 201
9.3.2 多层感知机的激活函数 203
9.4 消除过拟合——正则化与dropout 205
9.4.1 正则化与dropout概述 205
9.4.2 使用防过拟合处理的多层感知机 206
9.4.3 Keras创建多层感知机的细节问题 207
9.5 本章小结 208
第10章 TensorFlow Datasets和TensorBoard 训练可视化 210
10.1 TensorFlow Datasets简介 210
10.1.1 TensorFlow Datasets的安装 212
10.1.2 TensorFlow Datasets的使用 212
10.2 TensorFlow Datasets数据集的使用——FashionMNIST 214
10.2.1 FashionMNIST数据集的下载与展示 215
10.2.2 模型的建立与训练 216
10.3 使用Keras对FashionMNIST数据集进行处理 218
10.3.1 获取数据集 218
10.3.2 数据集的调整 218
10.3.3 使用Python类函数建立模型 219
10.3.4 Model的查看和参数打印 220
10.3.5 模型的训练和评估 221
10.4 使用TensorBoard可视化训练过程 223
10.4.1 TensorBoard的文件夹的设置 223
10.4.2 TensorBoard的显式调用 224
10.4.3 TensorBoard的使用 225
10.5 本章小结 229
作者简介
王晓华,计算机专业讲师,长期讲授面向对象程序设计、数据结构、Hadoop程序设计等研究生和本科生相关课程;主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立科研项目获省级成果认定,发表过多篇论文,拥有一项国家专利。著有《Spark MLlib机器学习实践》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow 2.0卷积神经网络实战》《TensorFlow+Keras自然语言处理实战》等图书。
-
乡村振兴新技术:新时代农村短视频编辑技术基础入门
¥12.8¥32.0 -
AI绘画+AI摄影+AI短视频从入门到精通
¥45.5¥79.8 -
企业AI之旅
¥43.5¥79.0 -
机器学习
¥59.4¥108.0 -
基于知识蒸馏的图像去雾技术
¥61.6¥88.0 -
软件设计的哲学(第2版)
¥51.0¥69.8 -
智能算法优化及其应用
¥52.4¥68.0 -
Photoshop图像处理
¥25.5¥49.0 -
R语言医学数据分析实践
¥72.3¥99.0 -
大模型推荐系统:算法原理、代码实战与案例分析
¥62.3¥89.0 -
剪映 从入门到精通
¥25.7¥59.8 -
游戏造梦师----游戏场景开发与设计
¥67.6¥98.0 -
SAR图像处理与检测
¥35.4¥49.8 -
人工智能
¥29.4¥42.0 -
中文版PHOTOSHOP 2024+AI修图入门教程
¥59.3¥79.0 -
WPS办公软件应用
¥25.2¥36.0 -
格拉斯曼流行学习及其在图像集分类中的应用
¥13.7¥28.0 -
轻松上手AIGC:如何更好地向CHATGPT提问
¥40.3¥62.0 -
元宇宙的理想与现实:数字科技大成的赋能与治理逻辑
¥61.6¥88.0 -
云原生安全:攻防与运营实战
¥66.8¥89.0