人工智能的数学基础——数据之本
- ISBN:9787302627357
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:0
- 出版时间:2024-08-01
- 条形码:9787302627357 ; 978-7-302-62735-7
本书特色
在人工智能和大数据的时代,统计学和计算机科学应该结合。这部书从数学角度帮助读者从经典统计学顺利过渡到人工智能这个新兴领域,值得阅读。
内容简介
"统计学是在概率论基础上发展起来的一门应用数学的学问。在自然科学、工程学、社会学、人文学、军事学等诸多应用领域,凡是涉及数据的收集、处理、分析、可视化和解释等方面的问题,都是统计学大显身手的舞台。 统计学既是应用数学的一个分支,又是一门推断的艺术,其中不乏有哲学思辩和信念差异。来自不同学派的观点相互碰撞,使得统计学在二十世纪飞速发展。今天,借助计算机的帮助,人们可以从各个角度探索数据的本质。然而,我们仍需时刻提醒自己,在算力之上,精巧的算法永远重要。 本书延续了《随机之美》的写作风格,以二十世纪*伟大的两位统计学家罗纳德·艾尔默·费舍尔和耶泽·内曼为故事的主角,介绍了现代统计学的一些主要成果。这两位统计学大师同属频率派,均为贝叶斯主义的反对者,然而二人之间也有过很多饶有趣味的学术之争,至今对我们仍有启发。 二十一世纪是人工智能和大数据的时代,统计学和计算机科学应该如何结合才能互惠互利?如何站在人工智能的角度看待数据和数据分析?还有很多统计应用的问题值得我们深思。作者希望通过此书唤起普通读者对统计学的兴趣,用它去推动人工智能、大数据分析的发展。这本书也是统计机器学习的入门,帮助读者从经典统计学顺利过渡到这个新兴领域。"
目录
第 1 章 费舍尔和内曼的学术成就 3
1.1 费舍尔生平 11
1.1.1 费舍尔的主要著作 13
1.1.2 费舍尔的统计思想 16
1.2 内曼生平 22
1.2.1 内曼的置信区间与假设检验 24
1.2.2 内曼的归纳行为 .26
第 2 章 数理统计学简史 31
2.1 20 世纪前的统计学 .33
2.2 20 世纪上半叶的统计学 35
2.3 20 世纪下半叶的统计学 36
2.4 21 世纪的统计学 38
2.5 推荐读物 42
第二部分 经典统计学
第 3 章 统计学的一些基本概念 45
3.1 样本的特征 49
3.1.1 次序统计量 55
3.1.2 经验分布及其性质 60
3.1.3 样本矩及其极限分布 67
3.2 样本统计量及其性质 69
3.2.1 统计量的抽样分布 71
3.2.2 重抽样和自助法. 76
3.2.3 统计量的充分性 .79
第 4 章 参数估计理论 84
4.1 点估计及其优良性 92
4.1.1 相合性与渐近正态性 96
4.1.2 有效性 100
4.1.3 折刀法 105
4.1.4 点估计之矩方法和*大似然法 107
4.2 内曼置信区间估计 120
4.2.1 基于马尔可夫不等式的区间估计 122
4.2.2 枢轴量法 124
4.2.3 大样本区间估计 128
4.2.4 费舍尔的信任估计 132
第 5 章 假设检验 137
5.1 内曼-皮尔逊假设检验理论 .145
5.1.1 功效函数与两类错误的概率 151
5.1.2 内曼-皮尔逊基本引理与似然比检验 157
5.1.3 广义似然比检验 163
5.1.4 假设检验与置信区间估计的关系 169
5.2 大样本检验 173
5.2.1 拟合优度检验 177
5.2.2 独立性的列联表检验 184
第 6 章 回归分析与方差分析 188
6.1 线性回归模型 193
6.1.1 *小二乘估计 194
6.1.2 线性回归的若干性质 200
6.1.3 回归模型的假设检验 203
6.1.4 正交多项式回归 205
6.1.5 贝叶斯线性回归 211
6.1.6 对数率回归 214
6.2 方差分析模型 219
6.2.1 单因素方差分析 223
6.2.2 两因素方差分析 225
第三部分 现代统计学
第 7 章 多元统计分析简介 235
7.1 核方法及其在回归上的应用 243
7.1.1 核函数的性质 246
7.1.2 基于*优化的核线性回归 247
7.1.3 贝叶斯核线性回归 252
7.2 特征工程 255
7.2.1 主成分分析 260
7.2.2 因子分析 270
7.2.3 独立成分分析 278
7.2.4 多维缩放与等距映射 284
7.2.5 局部嵌入的降维 288
7.2.6 塔克分解 294
7.3 聚类 301
7.3.1 层级聚类 303
7.3.2 k-均值聚类 307
7.4 分类 310
7.4.1 近邻法 323
7.4.2 决策树 327
7.4.3 费舍尔线性判别分析 339
7.4.4 支持向量机 344
7.4.5 基于高斯过程的分类 348
7.4.6 人工神经网络 350
第 8 章 期望*大化算法 362
8.1 完全数据与*大似然估计 366
8.1.1 EM 算法及其收敛速度 367
8.1.2 指数族的 EM 算法 370
8.2 期望*大化算法的应用 373
8.2.1 分支个数已知的高斯混合模型 375
8.2.2 针对删失数据的 EM 算法 378
8.2.3 概率潜在语义分析 381
8.3 数据增扩算法与缺失数据分析 385
8.3.1 经典的数据增扩算法 386
8.3.2 穷人的数据增扩算法 392
第 9 章 时间序列分析初步 397
9.1 时间序列模型 405
9.1.1 ARMA 模型 408
9.1.2 样本(偏)自相关函数. 419
9.1.3 经典分解模型 422
9.2 预测与估计 428
9.2.1 指数平滑 433
9.2.2 *佳线性预测 435
9.2.3 ARMA 模型的估计 441
9.3 隐马尔可夫模型及算法 445
9.3.1 隐马尔可夫模型 449
9.3.2 概率有限状态转换器 452
9.3.3 观测序列的概率:向前算法与向后算法 456
9.3.4 状态序列的概率:维特比算法 460
9.3.5 模型参数的估计:鲍姆-韦尔奇算法 462
9.4 状态空间模型与卡尔曼滤波 466
9.4.1 状态的*佳线性估计 471
9.4.2 参数估计 477
第四部分 附 录
附录 A 软件 R、Maxima 和 GnuPlot 简介 483
A.1 R:*好的统计软件 483
A.2 Maxima:符号计算的未来之路 485
A.3 GnuPlot:强大的函数绘图工具 .490
附录 B 一些常用的*优化方法 491
B.1 梯度下降法. 494
B.2 高斯-牛顿法 495
B.3 拉格朗日乘子法 497
B.4 非线性优化方法 500
B.5 随机*优化 502
附录 C 核密度估计 504
附录 D 再生核希尔伯特空间 508
D.1 希尔伯特空间 511
D.2 内积矩阵与距离矩阵 514
D.3 核函数的判定条件 515
附录 E 张量分析浅尝 520
E.1 张量的定义. 523
E.2 张量的代数运算 526
E.3 张量场 528
E.4 曲线坐标 531
附录 F 参考文献 536
附录 G 符号表 544
附录 H 名词索引 546
H.1 术语索引 546
H.2 人名索引 557
作者简介
于江生,应用数学博士,曾在北京大学、堪萨斯大学、韦恩州立大学工作多年。主要研究方向是人工智能、统计机器学习、贝叶斯数据分析、计算语言学、图像处理、生物信息学等。曾任华为2012泊松实验室主任、人工智能与机器学习首席科学家,现任 Futurewei 首席科学家。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥31.9¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0