机器学习(全彩图解 + 微课 + Python编程)(鸢尾花数学大系:从加减乘除到机器学习)
- ISBN:9787302666769
- 装帧:软精装
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:556
- 出版时间:2024-07-01
- 条形码:9787302666769 ; 978-7-302-66676-9
本书特色
这是一本前所未见的数据可视化入门书,颜值极高。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走入缤纷的AI宇宙。
内容简介
《机器学习 : 全彩图解 微课 Python编程》是“鸢尾花数学大系:从加减乘除到机器学习”丛书的*后一册,前六本解决了编程、可视化、数学、 数据方面的诸多问题,而《机器学习 : 全彩图解 微课 Python编程》将开启机器学习经典算法的学习之旅。
《机器学习 : 全彩图解 微课 Python编程》设置了 24 个话题,对应四大类机器学习经典算法(回归、分类、降维、聚类),覆盖算法包括: 回归分析、多元线性回归、非线性回归、正则化回归、贝叶斯回归、高斯过程、k *近邻分类、朴素贝叶 斯分类、高斯判别分析、支持向量机、核技巧、决策树、主成分分析、截断奇异值分解、主成分分析进阶、 主成分分析与回归、核主成分分析、典型相关分析、 k 均值聚类、高斯混合模型、*大期望算法、层次聚类、 密度聚类、谱聚类。
《机器学习 : 全彩图解 微课 Python编程》选取算法模型的目标是覆盖 Scikit-Learn 库的常用机器学习算法函数,让读者充分理解算法理论, 又能联系实际应用。因此,在学习《机器学习 : 全彩图解 微课 Python编程》时,特别希望调用 Scikit-Learn 各种函数来解决问题之余,更要理解 算法背后的数学工具。因此,《机器学习 : 全彩图解 微课 Python编程》给出适度的数学推导以及扩展阅读。《机器学习 : 全彩图解 微课 Python编程》是“鸢尾花数学大系:从加减乘除到机器学习”丛书的*后一册,前六本解决了编程、可视化、数学、 数据方面的诸多问题,而《机器学习 : 全彩图解 微课 Python编程》将开启机器学习经典算法的学习之旅。
《机器学习 : 全彩图解 微课 Python编程》设置了 24 个话题,对应四大类机器学习经典算法(回归、分类、降维、聚类),覆盖算法包括: 回归分析、多元线性回归、非线性回归、正则化回归、贝叶斯回归、高斯过程、k *近邻分类、朴素贝叶 斯分类、高斯判别分析、支持向量机、核技巧、决策树、主成分分析、截断奇异值分解、主成分分析进阶、 主成分分析与回归、核主成分分析、典型相关分析、 k 均值聚类、高斯混合模型、*大期望算法、层次聚类、 密度聚类、谱聚类。
《机器学习 : 全彩图解 微课 Python编程》选取算法模型的目标是覆盖 Scikit-Learn 库的常用机器学习算法函数,让读者充分理解算法理论, 又能联系实际应用。因此,在学习《机器学习 : 全彩图解 微课 Python编程》时,特别希望调用 Scikit-Learn 各种函数来解决问题之余,更要理解 算法背后的数学工具。因此,《机器学习 : 全彩图解 微课 Python编程》给出适度的数学推导以及扩展阅读。
《机器学习 : 全彩图解 微课 Python编程》提供代码示例和视频讲解,“鸢尾花书”强调在 JupyterLab 自主探究学习才能提高编程技能。本 书配套微课也主要以配套 Jupyter Notebooks 为核心,希望读者边看视频,边动手练习。
《机器学习 : 全彩图解 微课 Python编程》读者群包括所有试图用机器学习解决问题的朋友,尤其适用于机器学习入门、初级程序员转型、 高级数据分析师、机器学习进阶。
目录
目录 绪论 1
第 1章 机器学习 7
1.1 什么是机器学习? 8
1.2 回归:找到自变量与因变量关系 10
1.3 分类:针对有标签数据 14
1.4 降维:降低数据维度,提取主要特征 16
1.5 聚类:针对无标签数据 20
1.6 机器学习流程 21
1.7 下一步学什么? 24
第 2章 回归分析 27
2.1 线性回归:一个表格、一条直线 29
2.2 方差分析 (ANOVA) 32
2.3 总离差平方和 (SST) 35
2.4 回归平方和 (SSR) 37
2.5 残差平方和 (SSE) 38
2.6 几何视角:勾股定理 40
2.7 拟合优度:评价拟合程度 42
2.8 F 检验:模型参数不全为 0 44
2.9 t 检验:某个回归系数是否为 0 46
2.10 置信区间:因变量均值的区间 50
2.11 预测区间:因变量特定值的区间 51
2.12 对数似然函数:用在*大似然估计 (MLE) 51
2.13 信息准则:选择模型的标准 52
2.14 残差分析:假设残差服从均值为 0 的正态分布 53
2.15 自相关检测:Durbin-Watson 54
2.16 条件数:多重共线性 55 第 3章 多元线性回归 57
3.1 多元线性回归 58
3.2 优化问题:OLS 60
3.3 几何解释:投影 63
3.4 二元线性回归实例 65
3.5 多元线性回归实例 68
3.6 正交关系 72
3.7 三个平方和 75
3.8 t 检验 77
3.9 多重共线性 78
3.10 条件概率视角看多元线性回归 80 第4章 非线性回归 85
4.1 线性回归 86
4.2 线性对数模型 88
4.3 非线性回归 90
4.4 多项式回归 92
4.5 逻辑回归 97
4.6 逻辑函数完成分类问题 102 第 5章 正则化回归 109
5.1 正则化:抑制过拟合 110
5.2 岭回归 113
5.3 几何角度看岭回归 119
5.4 套索回归 121
5.5 几何角度看套索回归 123
5.6 弹性网络回归 127 第 6章 贝叶斯回归 133
6.1 回顾贝叶斯推断 134
6.2 贝叶斯回归:无信息先验 137
6.3 使用 PyMC 完成贝叶斯回归 137
6.4 贝叶斯视角理解岭正则化 142
6.5 贝叶斯视角理解套索正则化 144 第 7章 高斯过程 149
7.1 高斯过程原理 150
7.2 解决回归问题 156
7.3 解决分类问题 157
第8章 k*近邻分类 163
8.1 k *近邻分类原理:近朱者赤,近墨者黑 164
8.2 二分类:非红,即蓝 166
8.3 三分类:非红,要么蓝,要么灰 168
8.4 近邻数量 k 影响投票结果 170
8.5 投票权重:越近,影响力越高 173
8.6 *近质心分类:分类边界为中垂线 174
8.7 k-NN 回归:非参数回归 177 第 9章 朴素贝叶斯分类 181
9.1 重逢贝叶斯 182
9.2 朴素贝叶斯的“朴素 ”之处 186
9.3 高斯,你好 198 第 10章 高斯判别分析 213
10.1 又见高斯 214
10.2 六类协方差矩阵 217
10.3 决策边界解析解 219
10.4 **类 221
10.5 第二类 224
10.6 第三类 226
10.7 第四类 227
10.8 第五类 228
10.9 第六类 229
10.10 线性和二次判别分析 230 第 11章 支持向量机 235
11.1 支持向量机 236
11.2 硬间隔:处理线性可分 240
11.3 构造优化问题 245
11.4 支持向量机处理二分类问题 248
11.5 软间隔:处理线性不可分 252 第 12章 核技巧 257
12.1 映射函数:实现升维 258
12.2 核技巧 SVM 优化问题 261
12.3 线性核:*基本的核函数 266
12.4 多项式核 268
12.5 二次核:二次曲面 271
12.6 三次核:三次曲面 273
12.7 高斯核:基于径向基函数 275
12.8 Sigmoid 核 280 第 13章 决策树 285
13.1 决策树:可以分类,也可以回归 286
13.2 信息熵:不确定性度量 288
13.3 信息增益:通过划分,提高确定度 290
13.4 基尼指数:指数越大,不确定性越高 292
13.5 *大叶节点:影响决策边界 293
13.6 *大深度:控制树形大小 297
第 14章 主成分分析 303
14.1 主成分分析 304
14.2 原始数据 307
14.3 特征值分解 310
14.4 正交空间 312
14.5 投影结果 316
14.6 还原 320
14.7 双标图 323
14.8 陡坡图 327
第 15章 截断奇异值分解 331
15.1 几何视角看奇异值分解 332
15.2 四种 SVD 分解 334
15.3 几何视角看截断型 SVD 336
15.4 优化视角看截断型 SVD 339
15.5 分析鸢尾花照片 343 第 16章 主成分分析进阶 351
16.1 从“六条技术路线 ”说起 352
16.2 协方差矩阵:中心化数据 355
16.3 格拉姆矩阵:原始数据 363
16.4 相关性系数矩阵:标准化数据 368 第 17章 主成分分析与回归 375
17.1 正交回归 376
17.2 一元正交回归 378
17.3 几何角度看正交回归 382
17.4 二元正交回归 385
17.5 多元正交回归 389
17.6 主元回归 393
17.7 偏*小二乘回归 405 第 18章 核主成分分析 413
18.1 核主成分分析 414
18.2 从主成分分析说起 415
18.3 用核技巧完成核主成分分析 418 第 19章 典型相关分析 427
19.1 典型相关分析原理 428
19.2 从一个协方差矩阵考虑 432
19.3 以鸢尾花数据为例 434
第 20章 K均值聚类 443
20.1 K 均值聚类 444
20.2 优化问题 445
20.3 迭代过程 448
20.4 肘部法则:选定聚类簇值 450
20.5 轮廓图:选定聚类簇值 452
20.6 沃罗诺伊图 454 第 21章 高斯混合模型 457
21.1 高斯混合模型 458
21.2 四类协方差矩阵 464
21.3 分量数量 469
21.4 硬聚类和软聚类 471 第 22章 *大期望算法 475
22.1 *大期望 476
22.2 E 步:*大化期望 477
22.3 M 步:*大化似然概率 480
22.4 迭代过程 482
22.5 多元 GMM 迭代 486 第 23章 层次聚类 495
23.1 层次聚类 496
23.2 树形图 497
23.3 簇间距离 503
23.4 亲近度层次聚类 509 第 24章 密度聚类 511
24.1 DBSCAN 聚类 512
24.2 调节参数 515 第 25章 谱聚类 519
25.1 谱聚类 520
25.2 距离矩阵 521
25.3 相似度 524
25.4 无向图 525
25.5 拉普拉斯矩阵 527
25.6 特征值分解 530
参考文献 535
作者简介
姜伟生 博士 FRM。
勤奋的小镇做题家,热爱知识可视化和开源分享。自2022年8月开始,在GitHub上开源“鸢尾花书”学习资源,截至2024年5月,已经分享5000多页PDF、5000多幅矢量图、约3000个代码文件,全球读者数以万计,GitHub全球排名TOP100。
-
全图解零基础word excel ppt 应用教程
¥16.3¥48.0 -
C Primer Plus 第6版 中文版
¥62.6¥108.0 -
零信任网络:在不可信网络中构建安全系统
¥34.2¥59.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥12.7¥39.8 -
情感计算
¥66.8¥89.0 -
大模型RAG实战 RAG原理、应用与系统构建
¥74.3¥99.0 -
大学计算机基础实验教程(MS Office版)——面向数据分析能力培养
¥29.1¥39.8 -
LINUX企业运维实战(REDIS+ZABBIX+NGINX+PROMETHEUS+GRAFANA+LNMP)
¥51.8¥69.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥70.0¥89.8 -
LINUX实战——从入门到精通
¥52.4¥69.0 -
剪映AI
¥52.8¥88.0 -
快速部署大模型:LLM策略与实践(基于ChatGPT等大语言模型)
¥56.9¥79.0 -
数据驱动的工业人工智能:建模方法与应用
¥68.3¥99.0 -
数据存储架构与技术(第2版)
¥62.9¥89.8 -
纹样之美:中国传统经典纹样速查手册
¥76.3¥109.0 -
Java面向对象程序设计基础教程
¥35.9¥59.8 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
UN NX 12.0多轴数控编程案例教程
¥24.3¥38.0