×
数据有道 数据分析+图论与网络+微课+Python编程

数据有道 数据分析+图论与网络+微课+Python编程

1星价 ¥190.4 (8.0折)
2星价¥190.4 定价¥238.0
暂无评论
图文详情
  • ISBN:9787302671572
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:568
  • 出版时间:2024-10-01
  • 条形码:9787302671572 ; 978-7-302-67157-2

本书特色

这是一本前所未见的数据入门书,颜值极高。姜伟生博士自谦“小镇做题家”,实际上他是国际著名金融企业的金融科技专家。很难想象一位以“术数”为业的金融家具备如此彻底的分享动机,同时,姜博士有着卓越的艺术品位和设计能力,不仅承担了这套书的精深内容,更承担了全系图书的整体设计。希望读者从枯燥的常规数学书中解脱出来,赏心悦目地慢慢走入缤纷的AI宇宙。

内容简介

本书是“鸢尾花数学大系——从加减乘除到机器学习”丛书的第三板块(实践板块)中的一本关于数据科学的分册。“实践”这个板块,我们将会把学到的编程、可视化,特别是数学工具应用到具体的数据科学、机器学习算法中,并在实践中加深对这些工具的理解。
本书可以归纳为7大板块——数据说、数据处理、时间数据、图论基础、图的分析、图与矩阵、图论实践。这7个板块(共25章内容)都紧紧围绕一个主题——数据!
本书以数据为名,以好奇心和疑问为驱动,主动使用“编程+可视化+数学”工具进行探索。本书将会回顾鸢尾花书前五本主要的工具,让大家对很多概念从似懂非懂变成如数家珍;同时,我们还会掌握更多工具,用来扩展大家的知识网络。
依照惯例,本书提供代码和视频教学。
本书读者群包括数据科学从业者、大数据从业者、高级数据分析师、机器学习开发者、计算机图形学研究者等。

目录

绪论 1 **板块 综述5 第 1章 万物皆数 7 1.1 万物皆数:从矩阵说起 8 1.2 数据分类:定量 ( 连续、离散 ) 、定性 ( 定类、定序 ) 14 1.3 机器学习:四大类算法 17 1.4 特征工程:提取、转换、构建数据 21 第2板块 数据处理23 第 2章 缺失值 25 2.1 是不是缺了几个数? 26 2.2 可视化缺失值位置 30 2.3 处理缺失值:删除 34 2.4 单变量插补 37 2.5 k 近邻插补 39 2.6 多变量插补 41 第 3章 离群值 43 3.1 这几个数有点不合群? 44 3.2 直方图:单一特征分布 46 3.3 散点图:成对特征分布 49 3.4 QQ 图:分位数 - 分位数 51 3.5 箱型图:上界、下界之外样本 54 3.6 Z 分数:样本数据标准化 55 3.7 马氏距离和其他方法 57 第4章 数据转换 63 4.1 数据转换 64 4.2 中心化:去均值 65 4.3 标准化:Z 分数 69 4.4 归一化:取值在 0 和 1 之间 71 4.5 广义幂转换 72 4.6 经验累积分布函数 74 4.7 插值 79 第 5章 数据距离 91 5.1 怎么又聊距离? 92 5.2 欧氏距离:*常见的距离 94 5.3 标准化欧氏距离:考虑标准差 96 5.4 马氏距离:考虑标准差和相关性 99 5.5 城市街区距离:L1 范数 101 5.6 切比雪夫距离:L ∞范数 102 5.7 闵氏距离:Lp 范数 103 5.8 距离与亲近度 104 5.9 成对距离、成对亲近度 108 5.10 协方差矩阵,为什么无处不在? 110 第3板块 时间数据127 第6 时间数据 129 6.1 时间序列数据 130 6.2 处理时间序列缺失值 133 6.3 从时间数据中发现趋势 135 6.4 时间序列分解 138 6.5 时间数据讲故事 143 第 7章 移动窗口 157 7.1 移动窗口 158 7.2 移动波动率 162 7.3 相关性 165 7.4 回归系数 166 7.5 指数加权移动平均 167 7.6 EWMA 波动率 169 第 8章 随机过程入门 175 8.1 布朗运动:来自花粉颗粒无规则运动 176 8.2 无漂移布朗运动 180 8.3 漂移布朗运动:确定 随机 182 8.4 具有一定相关性的布朗运动 185 8.5 几何布朗运动 188 8.6 股价模拟 190 8.7 相关股价模拟 193 第 9章 高斯过程 197 9.1 高斯过程原理 198 9.2 协方差矩阵 202 9.3 分块协方差矩阵 206 9.4 后验 206 9.5 噪声 210 9.6 核函数 211 第4板块 图论基础223 第 10章 图论入门 225 10.1 什么是图? 226 10.2 图和几何 233 10.3 图和矩阵 234 10.4 图和机器学习 236 10.5 NetworkX 241 第 11章 无向图 243 11.1 无向图:边没有方向 244 11.2 自环:节点到自身的边 248 11.3 同构:具有等价关系的图 250 11.4 多图:同一对节点存在不止一条边 253 11.5 子图:图的一部分 254 11.6 有权图:边自带权重 256 第 12章 有向图 261 12.1 有向图:边有方向 262 12.2 出度、入度 265 12.3 邻居:上家、下家 266 12.4 有向多图:平行边 267 12.5 三元组:三个节点的 16 种关系 269 12.6 NetworkX 创建图 273 第 13章 图的可视化 281 13.1 节点位置 282 13.2 节点装饰 286 13.3 边装饰 289 13.4 分别绘制节点和边 291 第5板块 图的分析299 第 14章 常见图 301 14.1 常见图类型 302 14.2 完全图 303 14.3 二分图 307 14.4 正则图 310 14.5 树 311 14.6 柏拉图图 315 第 15章 从路径说起 321 15.1 通道、迹、路径、回路、环 322 15.2 常见路径问题 333 15.3 *短路径问题 334 15.4 欧拉路径 339 15.5 哈密尔顿路径 339 15.6 推销员问题 340 第 16章 连通性 343 16.1 连通性 344 16.2 连通分量 349 16.3 强连通、弱连通:有向图 352 16.4 桥 353 第 17章 图的分析 357 17.1 度分析 358 17.2 距离度量 363 17.3 中心性 372 17.4 图的社区 380 第6板块 图与矩阵 383 第 18章 从图到矩阵 385 18.1 无向图到邻接矩阵 386 18.2 有向图到邻接矩阵 397 18.3 传球问题 399 18.4 邻接矩阵的矩阵乘法 406 18.5 特征向量中心性 409 第 19章 成对度量矩阵 413 19.1 成对距离矩阵 414 19.2 亲近度矩阵:高斯核函数 420 19.3 相关性系数矩阵 424 第 20章 转移矩阵 429 20.1 再看邻接矩阵 430 20.2 转移矩阵:可能性 435 20.3 有向图 436 20.4 马尔可夫链 442 第 21章 其他矩阵 449 21.1 图中常见矩阵 450 21.2 关联矩阵 450 21.3 度矩阵 462 21.4 拉普拉斯矩阵 464 第7板块 图论实践 475 第 22章 树 477 22.1 树 478 22.2 *近共同祖先 484 22.3 *小生成树 485 22.4 决策树:分类算法 487 22.5 层次聚类 490 22.6 树形图:聚类算法 496 第 23章 数据聚类 499 23.1 数据聚类 500 23.2 距离矩阵 502 23.3 相似度 504 23.4 无向图 506 23.5 拉普拉斯矩阵 507 23.6 特征值分解 509 第 24章 PageRank算法 513 24.1 PageRank 算法 514 24.2 线性方程组 522 24.3 幂迭代 526 第 25章 社交网络分析 533 25.1 社交网络分析 534 25.2 度分析 536 25.3 图距离 538 25.4 中心性 542 25.5 社区结构 547
展开全部

作者简介

姜伟生 博士 FRM。 勤奋的小镇做题家,热爱知识可视化和开源分享。自2022年8月开始,在GitHub上开源“鸢尾花书”学习资源,截至2024年5月,已经分享5000多页PDF、5000多幅矢量图、约3000个代码文件,全球读者数以万计,GitHub全球排名TOP100。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航