×
统计机器学习

包邮统计机器学习

1星价 ¥95.9 (6.9折)
2星价¥95.9 定价¥139.0
暂无评论
图文详情
  • ISBN:9787111772255
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:暂无
  • 出版时间:2025-03-01
  • 条形码:9787111772255 ; 978-7-111-77225-5

本书特色

近年来,新型机器学习架构的种类和复杂性迅速增加,这就要求开发出更好的方法来设计、分析、评估和理解机器学习技术。本书为学生、工程师和科学家提供了数理统计和非线性优化理论方面的工具,帮助他们成为机器学习领域的专家。特别需要指出的是,本书的内容适用于传统的、新发展的以及未来的非线性高维机器学习算法的数学分析和设计。本书内容自成体系,读者仅需掌握线性代数和概率论相关基础知识即可理解。读者对象包括统计学、计算机科学、电子工程以及应用数学领域的研究生或学习积极性较高的本科生。此外,专业工程师和科研人员在验证确定性和随机机器学习优化算法的收敛性,以及表征算法的采样误差和泛化性能时,也可参考本书。本书特色:?所涵盖的统一经验风险*小化框架可用于对广泛使用的监督机器学习算法、无监督机器学习算法和强化学习算法进行严格的数学分析。?所涵盖的矩阵微积分方法可用于机器学习分析和设计。?给出了保证*小化单峰与多峰目标函数的适应性学习算法、批量学习算法、小批量学习算法,以及MCEM和MCMC学习算法收敛的准确条件。?表征了可能存在模型误判的情况下的M估计渐近条件与模型选择准则,如AIC和BIC。

内容简介

本书主要介绍由一组核心定理支撑的统计机器学习框架,书中通过相关机器学习案例帮助学生理解框架中的核心定理。对于实践型的专业工程师和科学家来说,本书可以帮助他们验证确保许多常用的确定性和随机机器学习优化算法收敛的充分条件,以及正确使用常用的统计工具来表征抽样误差和泛化性能。此外,由于本书包含大量示例,机器学习课程的教师以及从事机器学习应用的研究人员也会发现本书非常有用。本书的读者需要具备统计学、计算机科学、电子工程或应用数学方面的基本知识。全书共分为四部分:?**部分包含第1~3章,通过实例介绍机器学习算法概念和描述算法的数学工具;?第二部分包含第4~7章,讨论确定性学习机的渐近行为;?第三部分包含第8~12章,讨论随机推理机和随机学习机的渐近行为;?第四部分包含第13~16章,关注机器学习算法的泛化性能表征问题。

前言

前  言

统计机器学习是一个多学科领域,涵盖了机器学习、数理统计和数值优化理论。它涉及统计不确定性环境中机器推理能力的提升与评估问题。近来,随着机器学习架构在新颖性、多样性和复杂度方面的快速发展,人们迫切需要研究和创新能够对机器学习进行分析、设计、评估以及理解的技术方法。本书的主要目的是为学生、工程师和科学家提供一套针对基于数理统计和非线性优化理论的机器学习算法的实用精准工具,以对各种各样、不断发展的机器学习算法进行分析和设计。

目录

目  录
译者序
前言**部分 推理机与学习机第1章 统计机器学习框架2
 1.1 统计机器学习:概述2
 1.2 机器学习环境3
1.2.1 特征向量3
1.2.2 平稳统计环境5
1.2.3 机器学习算法的训练
策略6
1.2.4 先验知识6
 1.3 经验风险*小化框架8
1.3.1 ANN图形符号8
1.3.2 风险函数9
1.3.3 正则化项10
1.3.4 优化方法11
 1.4 基于理论的系统分析和设计13
1.4.1 **阶段:系统规范13
1.4.2 第二阶段:理论分析14
1.4.3 第三阶段:具体实施14
1.4.4 第四阶段:系统行为
评估14
 1.5 监督学习机16
1.5.1 差异函数16
1.5.2 基函数与隐单元18
1.5.3 循环神经网络22
 1.6 无监督学习机25
 1.7 强化学习机34
1.7.1 强化学习概述35
1.7.2 值函数被动式强化学习37
1.7.3 策略梯度反应式强化
学习39
 1.8 扩展阅读43第2章 概念建模的集合论46
 2.1 集合论与逻辑学48
 2.2 关系49
2.2.1 关系类型49
2.2.2 有向图50
2.2.3 无向图51
 2.3 函数52
 2.4 度量空间53
 2.5 扩展阅读57第3章 形式化机器学习算法58
 3.1 环境模型58
3.1.1 时间环境58
3.1.2 事件环境59
 3.2 学习机模型60
3.2.1 动态系统60
3.2.2 迭代映射61
3.2.3 向量场63
 3.3 智能机模型64
 3.4 扩展阅读67第二部分 确定性学习机第4章 机器学习的线性代数70
 4.1 矩阵符号与运算符70
 4.2 线性子空间投影定理75
 4.3 线性方程组解定理79
 4.4 扩展阅读82第5章 机器学习的矩阵
微积分83
 5.1 收敛性和连续性83
5.1.1 确定性收敛83
5.1.2 连续函数87
 5.2 向量导数91
5.2.1 向量导数的定义91
5.2.2 矩阵导数计算定理92
5.2.3 深度学习的有效导数
计算94
5.2.4 深度学习的梯度反向
传播98
 5.3 目标函数分析101
5.3.1 泰勒级数展开101
5.3.2 梯度下降型算法102
5.3.3 临界点分类104
5.3.4 拉格朗日乘数110
 5.4 扩展阅读120第6章 时不变动态系统
收敛性122
 6.1 动态系统存在性定理122
 6.2 不变集124
 6.3 李雅普诺夫收敛定理126
6.3.1 李雅普诺夫函数126
6.3.2 不变集定理127
 6.4 扩展阅读134第7章 批量学习算法收敛性135
 7.1 搜索方向和步长选择135
7.1.1 搜索方向选择135
7.1.2 步长选择137
 7.2 下降算法收敛性分析141
 7.3 下降策略145
7.3.1 梯度和*速下降145
7.3.2 牛顿式下降146
7.3.3 L-BFGS与共轭梯度
下降法149
 7.4 扩展阅读151第三部分 随机学习机第8章 随机向量与随机函数154
 8.1 概率空间155
8.1.1 σ域155
8.1.2 测度156
 8.2 随机向量158
8.2.1 可测函数158
8.2.2 离散随机向量、连续随机
向量与混合随机向量161
 8.3 Radon-Nikodm密度存在性
(选读)164
8.3.1 勒贝格积分164
8.3.2 Radon-Nikodm密度
函数166
8.3.3 向量支集规范测度166
 8.4 期望运算168
8.4.1 随机函数170
8.4.2 随机函数的期望170
8.4.3 条件期望和独立性172
 8.5 浓度不等式174
 8.6 扩展阅读176第9章 随机序列177
 9.1 随机序列的类型177
 9.2 部分可观测随机序列179
 9.3 随机收敛181
9.3.1 以概率1收敛182
9.3.2 均方收敛184
9.3.3 依概率收敛185
9.3.4 依分布收敛185
9.3.5 随机收敛关系186
 9.4 随机序列的组合与变换188
 9.5 扩展阅读190第10章 数据生成概率模型192
 10.1 概率模型的可学习性192
10.1.1 正确模型和误判
模型192
10.1.2 平滑参数概率模型195
10.1.3 局部概率模型195
10.1.4 缺失数据概率模型196
 10.2 吉布斯概率模型197
 10.3 贝叶斯网络201
10.3.1 链式因式分解202
10.3.2 贝叶斯网络因式
分解202
 10.4 马尔可夫随机场205
10.4.1 马尔可夫随机场
概念206
10.4.2 吉布斯分布的马尔可夫
随机场含义208
 10.5 扩展阅读216第11章 蒙特卡罗马尔可夫链算法
收敛性217
 11.1 MCMC算法218
11.1.1 有限状态空间上的可数
无限一阶链218
11.1.2 MCMC收敛性分析220
11.1.3 混合MCMC算法221
11.1.4 寻找全局极小值点及
计算期望223
11.1.5 MCMC收敛性能的
评估与改进224
 11.2 Metropolis-Hastings MCMC
算法227
11.2.1 Metropolis-Hastings
算法定义227
11.2.2 Metropolis-Hastings
算法的收敛性分析229
11.2.3 Metropolis-Hastings
算法的重要特例230
11.2.4 Metropolis-Hastings
算法在机器学习中的
应用232
 11.3 扩展阅读235第12章 适应性学习算法的
收敛性236
 12.1 随机逼近理论236
12.1.1 被动式统计环境与
反应式统计环境236
12.1.2 平均下降237
12.1.3 退火策略238
12.1.4 主随机逼近定理239
12.1.5 随机逼近算法收敛性
评估244
 12.2 基于随机逼近的被动式统计
环境学习246
12.2.1 不同优化策略应用246
12.2.2 提高泛化性能250
 12.3 基于随机逼近的反应式统计
环境学习254
12.3.1 策略梯度强化学习254
12.3.2 随机逼近期望
*大化257
12.3.3 马尔可夫随机场学习
(对比散度)259
12.3.4 生成式对抗网络
学习260
 12.4 扩展阅读261第四部分 泛化性能第13章 统计学习目标函数
设计264
 13.1 经验风险函数265
 13.2 *大似然估计法271
13.2.1 *大似然估计:概率论
解释271
13.2.2 *大似然估计:信息论
解释276
13.2.3 交叉熵全局极小值点
性质280
13.2.4 伪似然经验风险
函数282
13.2.5 缺失数据似然经验风险
函数283
 13.3 *大后验估计方法285
13.3.1 参数先验与超参数286
13.3.2 *大后验风险函数287
13.3.3 *大后验估计的贝叶斯
风险解释289
 13.4 扩展阅读291第14章 泛化评估模拟方法293
 14.1 采样分布概念295
14.1.1 K折交叉验证295
14.1.2 无穷数据的采样分布
估计296
 14.2 采样分布模拟的bootstrap
方法297
14.2.1 采样分布的bootstrap
近似298
14.2.2 蒙特卡罗bootstrap
采样分布估计299
 14.3 扩展阅读305第15章 评估泛化的解析公式306
 15.1 渐近分析假设306
 15.2 理论采样分布分析311
 15.3 置信区间317
 15.4 模型比较决策的假设检验321
15.4.1 经典假设检验321
15.4.2 贝叶斯假设检验324
 15.5 扩展阅读326第16章 模型选择与评估328
 16.1 交叉验证风险MSC329
 16.2 贝叶斯风险MSC334
16.2.1 贝叶斯模型选择
问题334
16.2.2 多维积分的拉普拉斯
逼近法335
16.2.3 贝叶斯信息准则336
 16.3 误判检测MSC340
16.3.1 评估模型误判的嵌套
模型方法340
16.3.2 信息矩阵差异MSC341
 16.4 扩展阅读344参考文献346
展开全部

作者简介

Richard M. Golden是得克萨斯大学达拉斯分校认知科学教授,并兼任该校电子工程系教授。在过去三十年间,戈尔登教授在统计学与机器学习领域发表了大量学术论文,并在国际学术会议上就广泛议题发表演讲。他的长期研究兴趣包括:确立确定性及随机性机器学习算法的收敛条件,以及探究存在概率模型误设情况下的估计与推断问题。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航