×
暂无评论
图文详情
  • ISBN:9787302591214
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:382
  • 出版时间:2021-10-01
  • 条形码:9787302591214 ; 978-7-302-59121-4

本书特色

本书创作团队核心成员长期从事机器学习方面的理论研究和工程实践,通过项目实战,积累了大量解决问题的方法和经验,并通过本书将自己的经验整理出来,以满足广大读者希望使用机器学习来解决实际问题的需要。

内容简介

随着互联网、物联网、云计算等技术的不断发展,许多领域都产生了大量的数据。利用机器学习技术分析海量数据,可以从数据中发现隐含的、有价值的规律和模式,进而用于预测并采取相应动作。在上述背景下,本书从理论、技术和应用三个层面入手,全面讲解如何利用机器学习技术解决实际问题。 本书共分26章,内容包括机器学习解决问题流程、问题分析与建模、数据探索与准备、特征工程、模型训练与评价、模型部署与应用、回归模型、支持向量机、决策树、集成学习、K近邻算法、贝叶斯方法、聚类算法、关联规则学习、神经网络基础、正则化、深度学习中的优化、卷积神经网络、循环神经网络、自编码器、基于深度学习的语音分离方法、基于深度学习的图像去水印方法、基于LSTM的云环境工作负载预测方法、基于QoS的服务组合问题、基于强化学习的投资组合方法、基于GAN模型的大数据系统参数优化方法。 本书内容全面、示例丰富,适合机器学习初学者以及想要全面掌握机器学习技术的算法开发人员,也适合高等院校和培训机构人工智能相关专业的师生教学参考。

目录

目 录

第1章 机器学习解决问题流程 1

1.1 机器学习基础 1

1.1.1 机器学习定义 1

1.1.2 机器学习流派 3

1.1.3 机器学习简史 7

1.2 机器学习解决实际问题的流程 8

1.3 机器学习平台介绍 10

1.3.1 阿里PAI 10

1.3.2 第四范式先知(Sage EE) 11

1.3.3 腾讯智能钛机器学习(TI-ML) 12

1.3.4 中科院EasyML 13

1.3.5 百度机器学习BML 14

1.3.6 华为AI开发平台ModelArts 15

1.3.7 微软Azure机器学习服务 15

1.3.8 谷歌Cloud AutoML平台 16

1.3.9 亚马逊SageMaker 17

1.4 本章小结 18

第2章 问题分析与建模 19

2.1 问题分析 19

2.1.1 明确和理解问题 19

2.1.2 拆解和定位问题 21

2.2 数据分析 23

2.2.1 描述统计分析 24

2.2.2 相关分析 24

2.2.3 回归分析 25

2.2.4 分类分析 25

2.2.5 聚类分析 26

2.3 问题建模 27

2.4 心脏病UCI数据集案例 27

2.4.1 问题描述 28

2.4.2 问题分析 28

2.4.3 数据分析 29

2.4.4 问题建模 30

2.5 本章小结 31

第3章 数据探索与准备 32

3.1 ETL技术 32

3.1.1 ETL工作方式 32

3.1.2 ETL实现模式 33

3.1.3 ETL发展历程 34

3.1.4 主流ETL工具 37

3.2 数据清洗 40

3.2.1 数据缺失处理 40

3.2.2 异常值处理 41

3.3 采样 42

3.3.1 拒绝采样 42

3.3.2 重要性采样 43

3.3.3 马尔可夫链蒙特卡洛采样 44

3.4 本章小结 46

第4章 特征工程 47

4.1 数据预处理 47

4.1.1 特征缩放 47

4.1.2 特征编码 48

4.2 特征选择 53

4.2.1 过滤式选择Filter 53

4.2.2 包裹式选择Wrapper 59

4.2.3 嵌入式选择Embedded 61

4.3 降维 63

4.3.1 主成分分析PCA 63

4.3.2 线性判别分析 65

4.4 本章小结 66

第5章 模型训练与评价 67

5.1 模型选择 67

5.1.1 基础知识 67

5.1.2 模型选择的要素 68

5.2 模型训练 68

5.2.1 留出法 69

5.2.2 交叉验证法 70

5.2.3 自助法 71

5.3 模型调优 71

5.3.1 超参数调优 71

5.3.2 神经架构搜索 73

5.3.3 元学习 76

5.4 模型评价 78

5.4.1 分类问题 78

5.4.2 回归问题 81

5.4.3 聚类问题 82

5.5 本章小结 83

第6章 模型部署与应用 84

6.1 机器学习模型格式 84

6.1.1 scikit-learn 84

6.1.2 TensorFlow 85

6.1.3 PyTorch 86

6.2 机器学习模型部署 87

6.2.1 模型在平台内应用 87

6.2.2 将模型封装成可执行脚本 88

6.2.3 基于容器和微服务的模型部署方式 89

6.2.4 模型部署方式对比 92

6.3 模型对外访问接口 93

6.3.1 REST架构 93

6.3.2 RPC架构 94

6.3.3 gRPC架构 95

6.3.4 模型对外接口对比 96

6.4 模型更新 96

6.4.1 如何更新模型 97

6.4.2 如何进行持续更新 97

6.5 本章小结 99

第7章 回归模型 100

7.1 线性回归 100

7.1.1 线性回归原理 100

7.1.2 多项式回归 101

7.1.3 线性回归案例 101

7.2 正则线性模型 103

7.2.1 正则线性模型原理 103

7.2.2 L1、L2正则化对比 103

7.3 逻辑回归 105

7.3.1 逻辑回归原理 106

7.3.2 逻辑回归案例 109

7.4 本章小结 109

第8章 支持向量机 110

8.1 绪论 110

8.2 支持向量机原理 111

8.2.1 函数间隔 111

8.2.2 对偶问题 112

8.2.3 软间隔SVM 113

8.2.4 KKT条件 114

8.2.5 支持向量 115

8.2.6 核函数 115

8.2.7 SMO 117

8.2.8 合页损失函数 117

8.3 SVR回归方法 117

8.4 SVM预测示例 119

8.5 本章小结 120

第9章 决策树 121

9.1 绪论 121

9.2 决策树基本概念 121

9.2.1 特征选择 122

9.2.2 信息增益 122

9.2.3 信息增益率 123

9.2.4 基尼系数 124

9.3 ID3算法 124

9.4 C4.5算法 125

9.4.1 决策树生成 125

9.4.2 决策树剪枝 126

9.5 CART算法 127

9.5.1 决策树生成 128

9.5.2 决策树剪枝 129

9.6 决策树应用 130

9.7 本章小结 130

第10章 集成学习 131

10.1 bagging与随机森林 131

10.1.1 bagging 131

10.1.2 随机森林 132

10.1.3 随机森林的应用 132

10.1.4 随机森林的推广 135

10.2 boosting 136

10.2.1 Adaboost 136

10.2.2 前向分步算法 142

10.2.3 三大框架 147

10.3 stacking与blending 154

10.4 本章小结 156

第11章 K近邻算法 157

11.1 KNN算法 157

11.2 距离的表示 158

11.3 KD树 159

11.4 KNN心脏病预测实例 160

11.5 本章小结 161

第12章 贝叶斯方法 162

12.1 贝叶斯方法概述 162

12.2 贝叶斯决策论 163

12.3 朴素贝叶斯分类器 165

12.4 贝叶斯网络 165

12.4.1 贝叶斯网络概念 166

12.4.2 贝叶斯网络学习 167

12.4.3 贝叶斯网络推理 168

12.4.4 贝叶斯网络的应用 169

12.5 贝叶斯优化 169

12.5.1 贝叶斯优化框架 170

12.5.2 概率代理模型 170

12.5.3 采集函数 172

12.5.4 贝叶斯优化的应用 173

12.6 贝叶斯优化迭代过程示例 174

12.7 本章小结 177

第13章 聚类算法 178

13.1 聚类的评价指标 178

13.2 距离计算 179

13.3 聚类算法 180

13.3.1 基于层次的算法 180

13.3.2 基于分割的算法 181

13.3.3 基于密度的算法 185

13.4 本章小结 187

第14章 关联规则学习 188

14.1 关联规则学习概述 188

14.2 频繁项集 188

14.3 Apriori算法 189

14.4 FP-growth算法 193

14.5 本章小结 196

第15章 神经网络基础 197

15.1 神经网络概述 197

15.2 神经网络原理 198

15.2.1 神经元 198

15.2.2 损失函数 199

15.2.3 激活函数 201

15.2.4 正向传播 202

15.2.5 反向传播 203

15.3 前馈神经网络 204

15.3.1 前馈神经网络概述 204

15.3.2 MNIST数据集多分类应用 205

15.4 本章小结 206

第16章 正则化 207

16.1 正则化概述 207

16.2 数据集增强 207

16.3 提前终止 208

16.4 Dropout 208

16.5 Batch Normalization 211

16.6 本章小结 213

第17章 深度学习中的优化 214

17.1 优化技术概述 214

17.2 优化原理 215

17.2.1 标准化 215

17.2.2 梯度下降 219

17.2.3 参数初始化 221

17.3 自适应优化方法 223

17.4 参数初始化方法 224

17.5 本章小结 225

第18章 卷积神经网络 226

18.1 卷积神经网络概述 226

18.2 卷积神经网络原理 226

18.2.1 局部连接 227

18.2.2 权值共享 228

18.2.3 池化层 229

18.3 卷积神经网络的新方法 230

18.3.1 1D/2D/3D卷积 230

18.3.2 1×1卷积 231

18.3.3 空洞卷积 231

18.3.4 全卷积神经网络 231

18.4 卷积神经网络的应用 232

18.5 本章小结 234

第19章 循环神经网络 235

19.1 循环神经网络概述 235

19.2 循环神经网络原理 236

19.3 各种RNN的优缺点及应用场景 245

19.4 时间序列预测问题示例 246

19.5 本章小结 248

第20章 自编码器 249

20.1 绪论 249

20.2 自编码器原理 250

20.3 自编码器优缺点及应用场景 257

20.4 自编码器应用 258

20.5 本章小结 259

第21章 基于深度学习的语音分离方法 260

21.1 问题背景 260

21.2 问题定义 261

21.3 相关工作 262

21.4 VoiceFilter的实现方法 263

21.5 本章小结 274

第22章 基于深度学习的图像去水印方法 276

22.1 图像去水印的研究背景 276

22.2 图像修复问题的定义 277

22.3 图像修复的相关工作 278

22.4 方法实现 282

22.5 本章小结 290

第23章 基于LSTM的云环境工作负载预测方法 291

23.1 工作负载预测的研究背景 291

23.2 工作负载预测问题的定义 292

23.3 工作负载预测的相关工作 293

23.4 基于LSTM的工作负载预测 295

23.5 本章小结 300

第24章 基于QoS的服务组合问题 301

24.1 服务组合问题的研究背景 301

24.2 半自动服务组合问题的定义 302

24.3 服务组合问题的相关工作 305

24.4 Q-learning算法 306

24.5 Q-learning算法的实现 308

24.6 本章小结 315

第25章 基于强化学习的投资组合方法 316

25.1 投资组合问题的研究背景 316

25.2 投资组合指数增强问题的定义 319

25.3 投资组合问题的研究方法 322

25.4 深度确定性策略梯度算法 323

25.5 投资组合问题的实现方法 326

25.6 本章小结 334

第26章 基于GAN模型的大数据系统参数优化方法 335

26.1 大数据系统参数优化的研究背景 335

26.2 大数据系统参数优化问题的定义 336

26.3 大数据系统参数优化的方法 337

26.4 ACTGAN方法 347

26.5 本章小结 354

附录1 名词及解释 355

附录2 数据集 377

参考文献 381

展开全部

作者简介

鲍亮,西安电子科技大学副教授,西安电子科技大学博士。主要研究方向为软件体系结构、面向服务的计算和云计算等,主持并完成科研课题多项,发表学术论文20余篇。 崔江涛,西安电子科技大学计算机科学与技术学院教授、博士生导师。西安电子科技大学计算机学院博士。2018年入选陕西省高等学校教学名师,2020年入选陕西省特支计划领军人才。享受国务院政府特殊津贴,入选第八届教育部科学技术委员会学部委员。 李倩,西安交通大学讲师,西安交通大学博士。主要研究方向为行为金融学和组合投资等,主持并完成科研课题多项,发表学术论文10余篇。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航