“十四五”规划教材:从数据到结论(第五版)
1星价
¥34.1
(7.1折)
2星价¥34.1
定价¥48.0
暂无评论
图文详情
- ISBN:9787503797057
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:241
- 出版时间:2021-11-01
- 条形码:9787503797057 ; 978-7-5037-9705-7
内容简介
本书由浅入深地讲授统计学基础知识,并提供了统计方法的两种软件,既R和Python的使用方法,让读者可以边学习边着手用统计软件处理数据。全书涉及统计学基本概念、数据的收集、数据的描述、概率和分布、变量之间的关系(回归和分类、多元分析)、时间序列分析、生存分析简介和基本软件使用方法的介绍等。本书前面的章节是对统计基本概念的介绍,后半部分则介绍了更有针对性的一些统计模型、方法和应用。
目录
前言
第1章 一些基本概念
1.1 统计:作为数据科学
1.2 现实中的随机性和规律性,概率和机会
1.3 变量和数据
1.4 变量之间的关系
1.4.1 定性变量间的关系
1.4.2 定性和定量变量间的混合关系
1.5 统计、计算机与统计软件
1.6 本章的Python代码
1.7 习题
第2章 数据的收集
2.1 数据是怎样得到的
2.2 个体、总体和样本
2.3 参考资料:抽样调查和一些常用的方法
2.3.1 概述
2.3.2 概率抽样例子
2.3.3 非概率抽样例子
2.3.4 收集数据时的误差
2.3.5 问卷调查的问题
2.4 习题
第3章 数据的描述
3.1 如何用图来表示数据
3.1.1 定量变量的图表示:直方图、盒形图、茎叶图和散点图
3.1.2 定性变量的图表示:饼图和条形图
3.1.3 其他图描述法
3.2 如何用少量数字来概括数据
3.2.1 数据的“位置”
3.2.2 数据的“尺度”
3.2.3 数据的标准得分
3.3 本章的Python代码
3 3.1 直方图
3.3.2 盒形图
3.3.3 茎叶图
3.3.4 散点图
3.3.5 饼图
3.3.6 条形图
3.3.7 数据的标准得分
3.4 习题
第4章 机会的度量:概率和分布
4.1 得到概率的几种途径
4.2 概率的运算
4.3 变量的分布
4.3.1 离散随机变量
4.3.2 离散分布例子:二项分布
4.3.3 离散分布例子:多项分布
4.3.4 离散分布例子:Poisson分布
4.3.5 离散分布例子:超几何分布
4.3.6 连续随机变量
4.3.7 累积分布函数
4.3.8 连续分布例子:正态分布
4.3.9 通过正态分布说明连续分布的概率
4.3.10 连续分布例子:均匀分布
4.3.11 实际数据中变量的经验分布
4.4 抽样分布
4.4.1 什么是抽样分布
4.4.2 中心极限定理
4.5 本章的Python代码
4.5.1 二项分布
4.5.2 Poisson分布
4.5.3 连续随机变量的分布
4.5.4 正态分布
4.5.5 均匀分布
4.5.6 经验分布
4.5.7 抽样分布
4.6 习题
第5章 有监督学习——回归和分类
5.1 问题的提出
5.1.1 多变量相互作用的真实世界
5.1.2 数据科学的核心是有监督学习的预测
5.2 通过数据案例理解有监督学习:分类问题
5.2.1 例5.1欺诈竞标数据
5.2.2 探索性数据分析
5.2.3 建立一个决策树分类模型
5.2.4 如何选择分类决策树的拆分变量
5.2.5 预测精度的交叉验证
5.2.6 例5.1欺诈竞标数据决策树分类的变量重要性
5.3 通过数据案例理解有监督学习:回归问题
5.3.1 例5.2混凝土强度数据
5.3.2 探索性数据分析
5.3.3 建立一个决策树回归模型
5.3.4 如何选择回归决策树的拆分变量
5.3.5 回归中的交叉验证预测精度与残差的区别
5.3.6 例5.2 混凝土强度数据回归预测精度的交叉验证
5.3.7 例5.2 混凝土强度数据决策树回归的变量重要性
5.4 若干有监督学习模型
5.4.1 更多的例子
5.4.2 两类模型的概述及交叉验证
5.4.3 bagging分类和回归
5.4.4 adaboost分类
5.4.5 随机森林分类和回归
5.4.6 SVM分类和回归
5.4.7 *小二乘线性回归
5.4.8 用于二分类的logistic回归
5.4.9 线性判别分析分类
5.5 本章自编R函数和一些作图代码
5.5.1 平衡分类因变量各水平的分折函数
5.5.2 单独模型的分类交叉验证函数(只用于本章的模型)
5.5.3 单独模型的回归交叉验证函数(只用于本章的模型)
5.5.4 课文中一些图的代码
5.6 本章的Python代码
5.6.1 -些需要的模块
5.6.2 通过数据案例理解有监督学习:分类问题
5.6.3 通过数据案例理解有监督学习:回归问题
5.6.4 模型的概述及交叉验证
5.6.5 bagging分类和回归
5.6.6 adaboost分类
5 6 7 随机森林分类和回归
5.6.8 SVM分类和回归
5.6.9 *小二乘线性回归
5.6.10 Iogistic回归二分类
5.6.11 线性判别分析做多分类
5.6.12 本章要用的一些Python自编函数
5.7 参考资料
5.7.1 线性判别分析的一些数学细节
5.7.2 支持向量机的一些数学细节
5.8 习题
第6章 无监督学习——多元分析
6.1 寻找多个变量的代表:主成分分析和因子分析
6.1.1 主成分分析
6.1.2 因子分析
6.1.3 因子分析和主成分分析的一些注意事项
6.2 把对象分类:聚类分析
6.2.1 如何度量距离远近?
6.2.2 事先要确定分多少类:k均值聚类
6.2.3 事先不用确定分多少类:分层聚类
6.2.4 聚类要注意的问题
6.3 两组变量之间的相关:典型相关分析
6.3.1 两组变量的相关问题
6.3.2 典型相关分析
6.4 列联表行变量和列变量的关系:对应分析
6.5 参考资料:一些概括及公式
6.5.1 主成分分析和因子分析
6.5.2 聚类分析
6.5.3 典型相关分析
6.5.4 对应分析
6.6 本章的Python代码
6.6.1 主成分分析
6.6.2 因子分析
6.6.3 聚类分析
6.6.4 典型相关分析
6.6.5 对应分析
6.7 习题
……
第7章 随时间变化的对象:时间序列分析
第8章 生存分析简介
第9章 基本软件:R和Python
第10章 附录:统计显著性:假设检验和区间估计
参考文献
第1章 一些基本概念
1.1 统计:作为数据科学
1.2 现实中的随机性和规律性,概率和机会
1.3 变量和数据
1.4 变量之间的关系
1.4.1 定性变量间的关系
1.4.2 定性和定量变量间的混合关系
1.5 统计、计算机与统计软件
1.6 本章的Python代码
1.7 习题
第2章 数据的收集
2.1 数据是怎样得到的
2.2 个体、总体和样本
2.3 参考资料:抽样调查和一些常用的方法
2.3.1 概述
2.3.2 概率抽样例子
2.3.3 非概率抽样例子
2.3.4 收集数据时的误差
2.3.5 问卷调查的问题
2.4 习题
第3章 数据的描述
3.1 如何用图来表示数据
3.1.1 定量变量的图表示:直方图、盒形图、茎叶图和散点图
3.1.2 定性变量的图表示:饼图和条形图
3.1.3 其他图描述法
3.2 如何用少量数字来概括数据
3.2.1 数据的“位置”
3.2.2 数据的“尺度”
3.2.3 数据的标准得分
3.3 本章的Python代码
3 3.1 直方图
3.3.2 盒形图
3.3.3 茎叶图
3.3.4 散点图
3.3.5 饼图
3.3.6 条形图
3.3.7 数据的标准得分
3.4 习题
第4章 机会的度量:概率和分布
4.1 得到概率的几种途径
4.2 概率的运算
4.3 变量的分布
4.3.1 离散随机变量
4.3.2 离散分布例子:二项分布
4.3.3 离散分布例子:多项分布
4.3.4 离散分布例子:Poisson分布
4.3.5 离散分布例子:超几何分布
4.3.6 连续随机变量
4.3.7 累积分布函数
4.3.8 连续分布例子:正态分布
4.3.9 通过正态分布说明连续分布的概率
4.3.10 连续分布例子:均匀分布
4.3.11 实际数据中变量的经验分布
4.4 抽样分布
4.4.1 什么是抽样分布
4.4.2 中心极限定理
4.5 本章的Python代码
4.5.1 二项分布
4.5.2 Poisson分布
4.5.3 连续随机变量的分布
4.5.4 正态分布
4.5.5 均匀分布
4.5.6 经验分布
4.5.7 抽样分布
4.6 习题
第5章 有监督学习——回归和分类
5.1 问题的提出
5.1.1 多变量相互作用的真实世界
5.1.2 数据科学的核心是有监督学习的预测
5.2 通过数据案例理解有监督学习:分类问题
5.2.1 例5.1欺诈竞标数据
5.2.2 探索性数据分析
5.2.3 建立一个决策树分类模型
5.2.4 如何选择分类决策树的拆分变量
5.2.5 预测精度的交叉验证
5.2.6 例5.1欺诈竞标数据决策树分类的变量重要性
5.3 通过数据案例理解有监督学习:回归问题
5.3.1 例5.2混凝土强度数据
5.3.2 探索性数据分析
5.3.3 建立一个决策树回归模型
5.3.4 如何选择回归决策树的拆分变量
5.3.5 回归中的交叉验证预测精度与残差的区别
5.3.6 例5.2 混凝土强度数据回归预测精度的交叉验证
5.3.7 例5.2 混凝土强度数据决策树回归的变量重要性
5.4 若干有监督学习模型
5.4.1 更多的例子
5.4.2 两类模型的概述及交叉验证
5.4.3 bagging分类和回归
5.4.4 adaboost分类
5.4.5 随机森林分类和回归
5.4.6 SVM分类和回归
5.4.7 *小二乘线性回归
5.4.8 用于二分类的logistic回归
5.4.9 线性判别分析分类
5.5 本章自编R函数和一些作图代码
5.5.1 平衡分类因变量各水平的分折函数
5.5.2 单独模型的分类交叉验证函数(只用于本章的模型)
5.5.3 单独模型的回归交叉验证函数(只用于本章的模型)
5.5.4 课文中一些图的代码
5.6 本章的Python代码
5.6.1 -些需要的模块
5.6.2 通过数据案例理解有监督学习:分类问题
5.6.3 通过数据案例理解有监督学习:回归问题
5.6.4 模型的概述及交叉验证
5.6.5 bagging分类和回归
5.6.6 adaboost分类
5 6 7 随机森林分类和回归
5.6.8 SVM分类和回归
5.6.9 *小二乘线性回归
5.6.10 Iogistic回归二分类
5.6.11 线性判别分析做多分类
5.6.12 本章要用的一些Python自编函数
5.7 参考资料
5.7.1 线性判别分析的一些数学细节
5.7.2 支持向量机的一些数学细节
5.8 习题
第6章 无监督学习——多元分析
6.1 寻找多个变量的代表:主成分分析和因子分析
6.1.1 主成分分析
6.1.2 因子分析
6.1.3 因子分析和主成分分析的一些注意事项
6.2 把对象分类:聚类分析
6.2.1 如何度量距离远近?
6.2.2 事先要确定分多少类:k均值聚类
6.2.3 事先不用确定分多少类:分层聚类
6.2.4 聚类要注意的问题
6.3 两组变量之间的相关:典型相关分析
6.3.1 两组变量的相关问题
6.3.2 典型相关分析
6.4 列联表行变量和列变量的关系:对应分析
6.5 参考资料:一些概括及公式
6.5.1 主成分分析和因子分析
6.5.2 聚类分析
6.5.3 典型相关分析
6.5.4 对应分析
6.6 本章的Python代码
6.6.1 主成分分析
6.6.2 因子分析
6.6.3 聚类分析
6.6.4 典型相关分析
6.6.5 对应分析
6.7 习题
……
第7章 随时间变化的对象:时间序列分析
第8章 生存分析简介
第9章 基本软件:R和Python
第10章 附录:统计显著性:假设检验和区间估计
参考文献
展开全部
本类五星书
本类畅销
-
蛤蟆先生去看心理医生
¥26.6¥38.0 -
咬文嚼字二百问
¥15.4¥32.0 -
世界尽头的咖啡馆
¥18.0¥45.0 -
字海探源
¥25.0¥78.0 -
乡土中国
¥14.6¥26.0 -
从零开始的女性主义
¥30.3¥52.0 -
与内心的恐惧对话:摆脱来自亲人的负能量
¥34.1¥48.0 -
《标点符号用法》解读
¥6.2¥15.0 -
中国人的精神
¥9.9¥29.0 -
社会学:原来这么有趣有用
¥9.1¥36.0 -
你能写出好故事-写作的诀窍.大脑的奥秘.认知的陷阱
¥16.4¥32.8 -
焦虑心理学:不畏惧、不逃避,和压力做朋友
¥11.4¥38.0 -
乌合之众:大众心理研究
¥12.1¥36.8 -
理解生命
¥10.5¥32.8 -
从白大褂到病号服:探索医疗中的人性落差
¥19.9¥39.8 -
非暴力沟通心理学 : 用非暴力沟通化解冲突
¥13.0¥36.0 -
上大演讲录(1922-1927卷)(九品)
¥14.0¥52.0 -
那时的大学
¥14.6¥28.0 -
乌合之众:群体心理研究
¥11.9¥39.8 -
始于极限:女性主义往复书简(八品)
¥40.7¥59.0