- ISBN:9787122422620
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:216
- 出版时间:2023-01-01
- 条形码:9787122422620 ; 978-7-122-42262-0
本书特色
适读人群 :本书适合有志于从事机器学习、人工智能技术开发的人员或爱好者使用,也可作为相关专业的教材。(1)内容由浅入深,循序渐进。一方面遵循了读者对机器学习的认知规律;另一方面也便于熟悉机器学习知识的学习者更深入地掌握和应用Scikit-learn框架。 (2)语言通俗易懂,轻松易学,配以形象化的图片和代码,生动地把讲解内容呈现给读者,有效降低了学习的门槛。 (3)讲解主干明确,脉络清晰。贯穿主题算法,从集成学习、管道、交叉验证,到异常检测和信号分解,层次分明。 (4)案例精挑细选,干货多多。几乎每种算法都给出详细的使用案例,这些案例都是作者精心挑选和开发的,紧扣内容,并提供了很多开发技巧,值得认真阅读。
内容简介
本书是《Scikit-learn机器学习详解》(潘风文编著)的进阶篇,讲解了Sklearn(Scikit-learn)机器学习框架的各种高级应用技术,包括数据集导入工具、集成学习、模型选择和交叉验证、异常检测、管道、 信号分解、模型持久化以及Sklearn系统高级配置。通过本书的学习,读者可快速掌握Sklearn框架的高级知识,迈入人工智能殿堂的大门。 本书适合有志于从事机器学习、人工智能技术开发的人员或爱好者使用,也可作为相关专业的教材。
目录
1 机器学习概述 1
1.1 有监督学习2
1.2 无监督学习3
1.3 半监督学习3
1.4 Sklearn概述4
2 数据集导入工具 6
2.1 通用数据集导入API7
2.1.1 数据集加载器7
2.1.2 数据集提取器8
2.1.3 数据集生成器10
2.1.4 文件导入方法11
2.2 专用数据集导入API14
2.2.1 加载样本图像数据集14
2.2.2 加载svmlight/libsvm格式数据集15
2.2.3 从openml.org 下载数据集16
2.3 加载外部数据集16
2.3.1 列表式数据读取16
2.3.2 多媒体文件读取17
3 集成学习 18
3.1 自助抽样(bootstrap)19
3.2 自助聚合算法(bagging)20
3.2.1 标准自助聚合算法(Bagging)21
3.2.2 随机森林(Random Forest)29
3.2.3 极端随机树(Extremely randomized trees)30
3.3 加速提升算法(boosting)30
3.3.1 自适应提升算法(Adaboost)30
3.3.2 梯度提升树算法(GBDT)38
3.4 投票集成算法(voting)49
3.5 堆栈泛化(stacking)56
4 模型选择和交叉验证 62
4.1 交叉验证评估器64
4.1.1 交叉验证64
4.1.2 交叉验证生成器66
4.1.3 使用交叉验证70
4.2 度量指标和评估(评分)75
4.2.1 评分参数scoring的设置76
4.2.2 哑分类评估器和哑回归评估器86
4.3 模型超参数调优90
4.3.1 穷尽网格超参数搜索91
4.3.2 随机超参数搜索99
4.3.3 非暴力参数搜索方法101
4.3.4 贝叶斯优化103
4.4 验证曲线104
4.4.1 交叉验证曲线105
4.4.2 学习曲线108
5 异常检测 115
5.1 新颖点检测117
5.2 离群点检测123
5.2.1 椭圆包络线算法123
5.2.2 孤立森林算法129
5.2.3 局部离群点因子算法130
6 管道 138
6.1 概念介绍139
6.1.1 评估器(estimator)139
6.1.2 转换器(transformer)140
6.1.3 管道(pipeline)141
6.2 管道机制概述142
6.3 中间评估器及子管道148
6.3.1 获取中间评估器148
6.3.2 获取子管道对象149
6.3.3 设置评估器参数150
6.4 特征聚合转换器150
6.5 列转换机制154
6.5.1 数据泄露154
6.5.2 列转换器155
6.6 模型选择162
7 信号分解 164
7.1 主成分分析PCA165
7.2 核主成分分析KPCA173
7.3 字典学习180
7.3.1 预置字典编码180
7.3.2 通用字典学习186
7.4 因子分析189
7.5 其他信号分解194
7.5.1 独立成分分析195
7.5.2 非负矩阵分解196
7.5.3 隐含狄利克雷分布199
8 模型持久化 200
8.1 针对Python对象的序列化201
8.1.1 使用模块pickle序列化201
8.1.2 使用模块joblib序列化204
8.2 模型互操作方式205
9 Sklearn系统配置 210
9.1 系统环境变量211
9.2 运行时环境变量211
后记 215
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0