×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
Python机器学习原理与算法实现

Python机器学习原理与算法实现

1星价 ¥86.1 (7.3折)
2星价¥86.1 定价¥118.0
暂无评论
图文详情
  • ISBN:9787302626114
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:427
  • 出版时间:2023-02-01
  • 条形码:9787302626114 ; 978-7-302-62611-4

本书特色

清晰解释Python运行代码,深入浅出讲解机器学习原理,精选商业建模实践案例,演绎常用机器学习算法,精准解读运行结果。

内容简介

数字化转型背景下,Python作为一门简单、易学、速度快、免费、开源的主流编程语言,广泛应用于大数据处理、人工智能、云计算等各个领域,是众多高等院校学生的必修基础课程,也是堪与Office办公软件应用比肩的职场人士的推荐技能。同时随着数据存储、数据处理等大数据技术的快速进步,机器学习的各种算法在各行各业得以广泛应用,同样成为高校师生、职场人士迎接数字化浪潮、与时俱进提升专业技能的必修课程。本书将“Python课程学习”与“机器学习课程学习”有机结合,推动数字化人才的培养,提升人才的实践应用能力。 全书内容共17章。第1、2章介绍Python的入门知识和进阶知识;第3章介绍机器学习的概念及各种术语及评价标准;第4~10章介绍相对简单的监督式学习方法,包括线性回归算法、二元Logistic回归算法、多元Logistic回归算法、判别分析算法、朴素贝叶斯算法、高维数据惩罚回归算法、K近邻算法;第11、12章介绍主成分分析算法、聚类分析算法两种非监督式学习算法;第13~15章介绍相对复杂的监督式学习算法,包括决策树算法和随机森林算法、提升法两种集成学习算法;第16、17章介绍支持向量机算法、神经网络算法两种高级监督式学习算法。 本书可以作为经济学、管理学、统计学、金融学、社会学、医学、电子商务等相关专业的学生学习Python或机器学习应用的专业教材、参考书;也可以作为企事业单位数字化人才培养的教科书、工具书,还可以作为职场人士自学掌握Python机器学习应用、提升数据挖掘分析能力进而提高工作效能和改善绩效水平的工具书。

目录

第1章 Python入门知识 1

1.1 Python简介与本书的教学理念 1

1.2 Python的下载与安装 2

1.2.1 下载Python(Anaconda平台) 2

1.2.2 安装Python(Anaconda平台) 4

1.2.3 Anaconda Prompt(Anaconda3) 6

1.2.4 Spyder(Anaconda3)的介绍及偏好设置 7

1.2.5 Spyder(Anaconda3)窗口介绍 10

1.3 Python注释、基本输入与输出 16

1.3.1 Python的注释 16

1.3.2 print函数 17

1.3.3 input函数 17

1.4 Python变量和数据类型 18

1.4.1 Python的保留字与标识符 18

1.4.2 Python的变量 19

1.4.3 Python的基本数据类型 20

1.4.4 Python的数据运算符 23

1.5 Python序列 25

1.5.1 索引(Indexing) 26

1.5.2 切片(Slicing) 26

1.5.3 相加(Adding) 27

1.5.4 相乘(Multiplying) 28

1.5.5 元素检查 28

1.5.6 与序列相关的内置函数 28

1.6 Python列表 30

1.6.1 列表的基本操作 30

1.6.2 列表元素的基本操作 32

1.6.3 列表推导式 33

1.7 Python元组 34

1.7.1 元组的基本操作 34

1.7.2 元组元素的基本操作 35

1.7.3 元组推导式 36

1.8 Python字典 37

1.8.1 字典的基本操作 37

1.8.2 字典元素的基本操作 39

1.8.3 字典推导式 40

1.9 Python集合 41

1.10 Python字符串 42

1.11 习题 46

第2章 Python进阶知识 48

2.1 Python流程控制语句 48

2.1.1 选择语句 48

2.1.2 循环语句 50

2.1.3 跳转语句 52

2.2 Python函数 53

2.2.1 函数的创建和调用 53

2.2.2 参数的相关概念与操作 53

2.2.3 变量的作用域 56

2.3 Python模块和包 58

2.3.1 模块的创建和导入 58

2.3.2 包的创建和使用 61

2.4 Python numpy模块中的数组 63

2.4.1 数组的创建 63

2.4.2 数组的计算 65

2.4.3 使用数组开展矩阵运算 66

2.4.4 数组的排序、索引和切片 66

2.5 Python pandas模块中的序列与数据框 67

2.5.1 序列的相关操作 67

2.5.2 数据框的相关操作 69

2.6 Python对象与类 74

2.6.1 类的定义 74

2.6.2 定义适用于类对象的方法 75

2.6.3 子类从父类继承 76

2.7 Python数据读取 76

2.7.1 读取文本文件(CSV或者TXT文件) 77

2.7.2 读取EXCEL数据 80

2.7.3 读取SPSS数据 81

2.7.4 读取Stata数据 82

2.8 Python数据检索 83

2.9 Python数据缺失值处理 84

2.9.1 查看数据集中的缺失值 84

2.9.2 填充数据集中的缺失值 86

2.9.3 删除数据集中的缺失值 89

2.10 Python数据重复值处理 91

2.10.1 查看数据集中的重复值 91

2.10.2 删除数据集中的重复值 92

2.11 Python数据行列处理 94

2.11.1 删除变量列、样本行 94

2.11.2 更改变量列名称、调整变量列顺序 95

2.11.3 改变列的数据格式 96

2.11.4 多列转换 96

2.11.5 数据百分比格式转换 97

2.12 习题 98

第3章 机器学习介绍 99

3.1 机器学习概述 99

3.2 机器学习术语 100

3.3 机器学习分类 101

3.4 误差、泛化、过拟合与欠拟合 102

3.5 偏差、方差与噪声 103

3.5.1 偏差 103

3.5.2 方差 103

3.5.3 噪声 103

3.5.4 误差与偏差、方差、噪声的关系 104

3.5.5 偏差与方差的权衡 104

3.6 性能量度 105

3.6.1 “回归问题监督式学习”的性能量度 105

3.6.2 “分类问题监督式学习”的性能量度 106

3.7 模型评估 111

3.7.1 验证集法 111

3.7.2 K折交叉验证 112

3.7.3 自助法 113

3.8 机器学习项目流程 114

3.9 习题 118

第4章 线性回归算法 119

4.1 线性回归算法的基本原理 119

4.1.1 线性回归算法的概念及数学解释 119

4.1.2 线性回归算法的优缺点 120

4.2 数据准备 121

4.2.1 导入分析所需要的模块和函数 121

4.2.2 数据读取及观察 122

4.3 描述性分析 123

4.4 图形绘制 125

4.4.1 直方图 125

4.4.2 密度图 127

4.4.3 箱图 128

4.4.4 小提琴图 128

4.4.5 正态QQ图 129

4.4.6 散点图和线图 130

4.4.7 热力图 131

4.4.8 回归拟合图 132

4.4.9 联合分布图 132

4.5 正态性检验 133

4.5.1 Shapiro-Wilk test检验 133

4.5.2 kstest检验 134

4.6 相关性分析 135

4.7 使用statsmodels进行线性回归 137

4.7.1 使用 smf 进行线性回归 137

4.7.2 多重共线性检验 139

4.7.3 解决多重共线性问题 140

4.7.4 绘制拟合回归平面 141

4.8 使用sklearn进行线性回归 142

4.8.1 使用验证集法进行模型拟合 142

4.8.2 更换随机数种子,使用验证集法进行模型拟合 143

4.8.3 使用10折交叉验证法进行模型拟合 143

4.8.4 使用10折重复10次交叉验证法进行模型拟合 144

4.8.5 使用留一交叉验证法进行模型拟合 144

4.9 习题 145

第5章 二元Logistic回归算法 147

5.1 二元Logistic回归算法的基本原理 147

5.2 数据准备 148

5.2.1 导入分析所需要的模块和函数 149

5.2.2 数据读取及观察 150

5.3 描述性分析 152

5.4 数据处理 154

5.4.1 区分分类特征和连续特征并进行处理 154

5.4.2 将样本全集分割为训练样本和测试样本 154

5.5 建立二元Logistic回归算法模型 155

5.5.1 使用statsmodels建立二元Logistic回归算法模型 155

5.5.2 使用sklearn建立二元Logistic回归算法模型 159

5.5.3 特征变量重要性水平分析 162

5.5.4 绘制ROC曲线,计算AUC值 165

5.5.5 计算科恩kappa得分 166

5.6 习题 167

第6章 多元Logistic回归算法 169

6.1 多元Logistic回归算法的基本原理 169

6.2 数据准备 170

6.2.1 导入分析所需要的模块和函数 170

6.2.2 数据读取及观察 171

6.3 描述性分析及图形绘制 172

6.3.1 描述性分析 172

6.3.2 绘制直方图 173

6.3.3 绘制箱图 173

6.4 数据处理 175

6.4.1 区分分类特征和连续特征并进行处理 175

6.4.2 将样本全集分割为训练样本和测试样本 175

6.5 建立多元Logistic回归算法模型 175

6.5.1 模型估计 176

6.5.2 模型性能分析 176

6.6 习题 179

第7章 判别分析算法 180

7.1 判别分析算法的基本原理 180

7.1.1 线性判别分析的基本原理 180

7.1.2 线性判别分析的算法过程 181

7.1.3 二次判别分析的基本原理 182

7.2 数据准备 183

7.2.1 导入分析所需要的模块和函数 184

7.2.2 线性判别分析降维优势展示 185

7.2.3 数据读取及观察 187

7.3 特征变量相关性分析 188

7.4 使用样本全集开展线性判别分析 189

7.4.1 模型估计及性能分析 189

7.4.2 运用两个特征变量绘制LDA决策边界图 192

7.5 使用分割样本开展线性判别分析 193

7.6 使用分割样本开展二次判别分析 195

7.6.1 模型估计 195

7.6.2 运用两个特征变量绘制QDA决策边界图 196

7.7 习题 197

第8章 朴素贝叶斯算法 198

8.1 朴素贝叶斯算法的基本原理 198

8.1.1 贝叶斯方法的基本原理 198

8.1.2 贝叶斯定理 199

8.1.3 朴素贝叶斯算法的基本原理 201

8.1.4 拉普拉斯修正 202

8.1.5 朴素贝叶斯算法分类及适用条件 202

8.2 数据准备 203

8.2.1 案例数据说明 203

8.2.2 导入分析所需要的模块和函数 205

8.3 高斯朴素贝叶斯算法示例 205

8.3.1 数据读取及观察 206

8.3.2 将样本全集分割为训练样本和测试样本 207

8.3.3 高斯朴素贝叶斯算法拟合 207

8.3.4 绘制ROC曲线 207

8.3.5 运用两个特征变量绘制高斯朴素贝叶斯决策边界图 208

8.4 多项式、补集、二项式朴素贝叶斯算法示例 208

8.4.1 数据读取及观察 209

8.4.2 将样本全集分割为训练样本和测试样本 209

8.4.3 多项式、补集、二项式朴素贝叶斯算法拟合 210

8.4.4 寻求二项式朴素贝叶斯算法拟合的*优参数 210

8.4.5 *优二项式朴素贝叶斯算法模型性能评价 213

8.5 习题 214

第9章 高维数据惩罚回归算法 216

9.1 高维数据惩罚回归算法简介 216

9.1.1 高维数据惩罚回归算法的基本原理 216

9.1.2 岭回归 217

9.1.3 Lasso回归 217

9.1.4 弹性网回归 218

9.1.5 惩罚回归算法的选择 218

9.2 数据准备 218

9.2.1 导入分析所需要的模块和函数 220

9.2.2 数据读取及观察 220

9.3 变量设置及数据处理 221

9.4 岭回归算法 222

9.4.1 使用默认惩罚系数构建岭回归模型 222

9.4.2 使用留一交叉验证法寻求*优惩罚系数构建岭回归模型 223

9.4.3 使用K折交叉验证法寻求*优惩罚系数构建岭回归模型 224

9.4.4 划分训练样本和测试样本下的*优岭回归模型 225

9.5 Lasso回归算法 226

9.5.1 使用随机选取惩罚系数构建岭回归模型 226

9.5.2 使用留一交叉验证法寻求*优惩罚系数构建Lasso回归模型 227

9.5.3 使用K折交叉验证法寻求*优惩罚系数构建Lasso回归模型 227

9.5.4 划分训练样本和测试样本下的*优Lasso回归模型 228

9.6 弹性网回归算法 229

9.6.1 使用随机选取惩罚系数构建弹性网回归模型 229

9.6.2 使用K折交叉验证法寻求*优惩罚系数构建弹性网回归模型 230

9.6.3 划分训练样本和测试样本下的*优弹性网回归模型 231

9.7 习题 231

第10章 K近邻算法 233

10.1 K近邻算法简介 233

10.2 数据准备 236

10.3 回归问题K近邻算法示例 237

10.4 分类问题K近邻算法示例 240

10.5 习题 246

第11章 主成分分析算法 248

11.1 主成分分析算法简介 248

11.2 数据准备 252

11.3 主成分分析算法示例 256

11.4 习题 261

第12章 聚类分析算法 262

12.1 聚类分析算法简介 262

12.2 数据准备 267

12.3 划分聚类分析算法示例 271

12.4 层次聚类分析算法示例 273

12.5 习题 279

第13章 决策树算法 280

13.1 决策树算法简介 280

13.2 数据准备 285

13.3 分类问题决策树算法示例 287

13.4 回归问题决策树算法示例 298

13.5 习题 305

第14章 随机森林算法 307

14.1 随机森林算法的基本原理 307

14.2 数据准备 310

14.3 分类问题随机森林算法示例 311

14.4 回归问题随机森林算法示例 320

14.5 习题 327

第15章 提升法 329

15.1 提升法的基本原理 329

15.2 数据准备 338

15.3 回归提升法示例 340

15.4 二分类提升法示例 349

15.5 多分类提升法示例 356

15.6 习题 362

第16章 支持向量机算法 364

16.1 支持向量机算法的基本原理 364

16.2 数据准备 375

16.3 回归支持向量机算法示例 376

16.4 二分类支持向量机算法示例 379

16.5 多分类支持向量机算法示例 386

16.6 习题 391

第17章 神经网络算法 393

17.1 神经网络算法的基本原理 393

17.2 数据准备 410

17.3 回归神经网络算法示例 411

17.4 二分类神经网络算法示例 418

17.5 多分类神经网络算法示例 423

17.6 习题 427

展开全部

作者简介

杨维忠,山东大学经济学硕士,CPA,十年商业银行工作经历,历任运营、风控、营销、内控等多个职位,擅长商务建模,精通SPSS、Stata、EViews,编著有《SPSS数据挖掘与案例分析应用实践》 《Stata统计分析与实验指导》等近十本畅销书。 张甜,山东大学金融学博士生,金融风险领域研究专家,参与《地方金融运行动态监测及系统性风险预警研究》等多项重大项目,精通SPSS、Stata、R语言,编著有《SPSS统计分析与行业应用案例详解》 《Stata统计分析与行业应用案例详解》等畅销书。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航