暂无评论
图文详情
- ISBN:9787300326894
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:280
- 出版时间:2024-07-01
- 条形码:9787300326894 ; 978-7-300-32689-4
内容简介
本书介绍了大数据挖掘与统计机器学习领域中*常用的模型和算法,包括*基础的线性回归与分类方法,以及模型评价与选择的概念和方法,进而介绍了非线性回归与分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。此外,介绍了无监督学习中的聚类方法,并给出了一个大数据分析的实例。除了方法的理论讲解之外,我们还给出了每种方法的Python实现。
目录
第1章 概述
1.1 名词演化
1.2 基本内容
1.3 数据智慧
第2章 线性回归与分类
2.1 Lasso回归
2.1.1 多元线性回归模型
2.1.2 岭回归
2.1.3 Lasso回归
2.1.4 一张图看懂岭回归和Lasso回归
2.1.5 从贝叶斯角度再看岭回归和Lasso回归
2.2 Lasso模型的求解
2.2.1 坐标下降法
2.2.2 小角回归
2.2.3 ADMM算法
2.2.4 附录
2.3 损失函数加罚的建模框架
2.3.1 损失函数的概念
2.3.2 小一乘回归与分位回归
2.3.3 其他罚函数
2.4 分类问题综述与评价准则
2.4.1 分类问题
2.4.2 分类问题评价准则
2.5 Logistic回归
2.5.1 基本模型
2.5.2 参数估计
2.5.3 正则化的Logistic回归
第3章 模型评价与选择
3.1 基本概念
3.1.1 各种误差的定义
3.1.2 偏差-方差分解
3.2 理论方法
3.2.1 Cp统计量
3.2.2 AIC准则
3.2.3 BIC准则
3.3 交叉验证法
第4章 决策树与组合方法
4.1 决策树
4.1.1 决策树的基本知识
4.1.2 决策树的建模过程
4.1.3 需要说明的一些问题
4.2 Bagging和随机森林
4.2.1 Bagging算法
4.2.2 随机森林
4.3 Boosting
4.3.1 AdaBoost算法
4.3.2 分类问题的不同损失函数
4.3.3 梯度下降Boosting算法
4.3.4 XGBoost
4.3.5 讨论
展开全部
作者简介
吕晓玲,中国人民大学统计学院教授,副院长。本科与硕士毕业于南开大学数学系概率统计专业,博士毕业于香港城市大学管理科学系。曾经是奥地利约翰开普勒大学应用统计系以及美国加州大学伯克利分校统计系访问学者。一直从事数据挖掘和统计机器学习领域的理论研究,及其在消费者行为方面的应用研究。 宋捷,首都经济贸易大学统计学院副教授。
本类五星书
浏览历史
本类畅销
-
唐诗经典研读
¥20.7¥58.0 -
思想道德与法治(2021年版)
¥6.8¥18.0 -
落洼物语
¥10.9¥28.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
中医基础理论
¥51.7¥59.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥36.0¥48.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥10.3¥25.0 -
法理学(第二版)
¥31.0¥50.0 -
客户经理(八品)
¥11.8¥42.0 -
无人机低空基站组网与优化
¥70.6¥98.0 -
当代中国政府与政治 第二版
¥58.8¥68.0 -
发展心理学(第3版普通高等教育国家级规划教材)
¥49.1¥58.0 -
刑法学 上下
¥114.4¥208.0 -
马克思主义基本原理2021年版
¥8.4¥23.0 -
智能控制
¥40.2¥56.0 -
素描基础教程
¥26.4¥59.0 -
心理学导论/张厚粲
¥28.6¥53.0 -
水利工程监理
¥28.3¥42.0 -
北京师范大学出版社历史学基础课系列教材中国古代史(下)(第4版)/宁欣
¥23.4¥52.0 -
水电站
¥24.4¥36.0