包邮人工智能科学与技术丛书统计学习理论与方法——R语言版

1星价 ¥62.6 (7.9折)

2星价￥62.6 定价￥79.0

作者：左飞

出版社：清华大学出版社

本类榜单：计算机/网络

分类：计算机/网络 > 数据库 > 数据库理论

暂无评论

图文详情

ISBN：9787302530886
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：其他
页数：396
出版时间：2020-06-01
条形码：9787302530886 ; 978-7-302-53088-6

本书特色

从统计学观点出发，以数理统计为基础，全面系统地介绍了机器学习的主要方法。根据全新设计的学习路线图编写，注重夯实理论基础，更便于深化对知识点的理解，建立系统性的全局观。对机器学习所涉及的数学基础进行了完整的解释和必要的铺垫，更便于读者对深化相关知识的理解。

内容简介

本书从统计学观点出发，以数理统计为基础，全面系统地介绍了统计机器学习的主要方法。内容涉及回归（线性回归、多项式回归、非线性回归、岭回归，以及LASSO等）、分类（感知机、逻辑回归、朴素贝叶斯、决策树、支持向量机、人工神经网络等）、聚类（K均值、EM算法、密度聚类等）、蒙特卡洛采样（拒绝采样、自适应拒绝采样、重要性采样、吉布斯采样和马尔科夫链蒙特卡洛等）、降维与流形学习（SVD、PCA和MDS等），以及概率图模型基础等话题。此外，为方便读者自学，本书还扼要地介绍了机器学习中所推荐的数学知识（包括概率论与数理统计、凸优化及泛函分析基础等）。本书是统计机器学习及相关课程的教学参考书，适用于高等院校人工智能、机器学习或数据挖掘等相关专业的师生研习之用，也可供从事计算机应用，特别是数据科学相关专业的研发人员参考。

节选

第3章采样方法上一章介绍了采样的概念。例如，想知道一所大学里所有男生的平均身高。但是因为学校里的男生可能有上万人之多，所以为每个人都测量一下身高存在很大困难，于是从每个学院随机挑选出100名男生来作为样本，这个过程就是采样。然而，本章将要讨论的采样则有另外一层含义。现实中的很多问题可能求解起来是相当困难的。这时就可能会想到利用计算机模拟的方法来帮助求解。在使用计算机进行模拟时，所说的采样，是指从一个概率分布中生成观察值的方法。而这个分布通常是由其概率密度函数来表示的。但即使在已知概率密度函数的情况下，让计算机自动生成观测值也不是一件容易的事情。 3.1蒙特卡洛法求定积分蒙特卡洛(Monte Carlo)法是一类随机算法的统称。它是20世纪40年代中期由于科学技术的发展，尤其是电子计算机的发明，而被提出并发扬光大的一种以概率统计理论为基础的数值计算方法。它的核心思想就是使用随机数(或更准确地说是伪随机数)来解决一些复杂的计算问题。现今，蒙特卡洛法已经在诸多领域展现出了超强的能力。本节，我们将通过蒙特卡洛法*为常见的一种应用——求解定积分，来演示这类算法的核心思想。 3.1.1无意识统计学家法则作为一个预备知识，先来介绍一下无意识统计学家法则(Law of the Unconscious Statistician，LOTUS)。在概率论与统计学中，如果知道随机变量X的概率分布，但是并不显式地知道函数g(X)的分布，那么LOTUS就是一个可以用来计算关于随机变量X的函数g(X)之期望的定理。该法则的具体形式依赖于随机变量X之概率分布的描述形式。如果随机变量X的分布是离散的，而且我们知道它的PMF是fX，但不知道fg(X)，那么g(X)的期望是 E［g(X)］=∑xg(x)fX(x) 其中和式是在取遍X的所有可能之值x后求得。如果随机变量X的分布是连续的，而且我们知道它的PDF是fX，但不知道fg(X)，那么g(X)的期望是 E［g(X)］=∫∞-∞g(x)fX(x) 简而言之，已知随机变量X的概率分布，但不知道g(X)的分布，此时用LOTUS公式能计算出函数g(X)的数学期望。其实就是在计算期望时，用已知的X的PDF(或PMF)代替未知的g(X)的PDF(或PMF)。 3.1.2投点法图31投点法求定积分投点法是讲解蒙特卡洛法基本思想的一个*基础也*直观的实例。这个方法也常常被用来求圆周率π。现在我们用它来求函数的定积分。如图31所示，有一个函数f(x)，若要求它从a到b的定积分，其实就是求曲线下方的面积。可以用一个比较容易算得面积的矩型罩在函数的积分区间上(假设其面积为Area)。然后随机地向这个矩形框里面投点，其中落在函数f(x)下方的点为菱形，其他点为三角形。然后统计菱形点的数量占所有点(菱形+三角形)数量的比例为r，那么就可以据此估算出函数f(x)从a到b的定积分为Area×r。注意由蒙特卡洛法得出的值并不是一个精确值，而是一个近似值。而且当投点的数量越来越大时，这个近似值也越接近真实值。 3.1.3期望法下面来重点介绍利用蒙特卡洛法求定积分的第二种方法——期望法，有时也称为平均值法。任取一组相互独立、同分布的随机变量{Xi}，Xi在［a，b］上服从分布律fX，也就是说fX是随机变量X的PDF(或PMF)。令g*(x)=g(x)fX(x)，则g*(Xi)也是一组独立同分布的随机变量，而且因为g*(x)是关于x的函数，所以根据LOTUS可得 E［g*(Xi)］=∫bag*(x)fX(x)dx=∫bag(x)dx=I 由强大数定理 PrlimN→∞1N∑Ni=1g*(Xi)=I=1 若选 =1N∑Ni=1g*(Xi) 则依概率1收敛到I。平均值法就用作为I的近似值。假设要计算的积分有如下形式 I=∫bag(x)dx 其中，被积函数g(x)在区间［a，b］上可积。任意选择一个有简便办法可以进行抽样的概率密度函数fX(x)，使其满足下列条件： (1) 当g(x)≠0时，fX(x)≠0，a≤x≤b； (2) ∫bafX(x)dx=1。如果记 g*(x)=g(x)fX(x) ，fX(x)≠0 0，fX(x)=0 那么原积分式可以写成 I=∫bag*(x)fX(x)dx 因而求积分的步骤是： (1) 产生服从分布律fX的随机变量Xi，i=1，2，…，N； (2) 计算均值 =1N∑Ni=1g*(Xi) 并用它作为I的近似值，即I≈。如果a，b为有限值，那么fX可取作为均匀分布 fX(x)=1b-a，a≤x≤b 0，其他此时原来的积分式变为 I=(b-a)∫bag(x)1b-adx 因而求积分的步骤是： (1) 产生［a，b］上的均匀分布随机变量Xi，i=1，2，…，N； (2) 计算均值 =b-aN ∑Ni=1g(Xi) 并用它作为I的近似值，即I≈。 *后来看一下平均值法的直观解释。注意积分的几何意义就是［a，b］区间曲线下方的面积，如图32所示。当在［a，b］随机取一点x时，它对应的函数值就是f(x)，然后便可以用f(x)·(b-a)来粗略估计曲线下方的面积(也就是积分)，如图33所示，当然这种估计(或近似)是非常粗略的。图32积分的几何意义图33对积分值进行粗略估计于是我们想到在［a，b］随机取一系列点xi时(xi满足均匀分布)，然后把估算出来的面积取平均来作为积分估计的一个更好的近似值，如图34所示。可以想象，如果这样的采样点越来越多，那么对于这个积分的估计也就越来越接近。图34对积分值进行估计按照上面这个思路，得到积分公式为 =(b-a)1N ∑N-1i=0f(Xi)=1N ∑N-1i=0f(Xi)1b-a 其中，1b-a 就是均匀分布的PMF。这跟之前推导出来的蒙特卡洛积分公式是一致的。

作者简介

左飞博士，技术作家、译者。著作涉及人工智能、图像处理和编程语言等多个领域，其中两部作品的繁体版在中国台湾地区发行。同时，他还翻译出版了包括《编码》在内的多部经典著作。曾荣获“*受读者喜爱的IT图书作译者奖”。他撰写的技术博客（https://baimafujinji.blog.csdn.net/）非常受欢迎，累计拥有近500万的访问量。

本类五星书

更多>>

浏览历史

本类畅销

×

包邮人工智能科学与技术丛书统计学习理论与方法——R语言版

本书特色

内容简介

目录

节选

作者简介

预估到手价 ×