- ISBN:9787115506641
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:113
- 出版时间:2018-10-01
- 条形码:9787115506641 ; 978-7-115-50664-1
本书特色
斯坦福大学大数据基础课程教材 文科生也看得懂的算法及数据科学入门书 涵盖回归分析、神经网络、决策树、A/B测试等重要主题
内容简介
与使用数学语言或计算机编程语言讲解算法的书不同,本书另辟蹊径,用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k很近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。
目录
1.1 准备数据 1
1.1.1 数据格式 1
1.1.2 变量类型 2
1.1.3 变量选择 3
1.1.4 特征工程 3
1.1.5 缺失数据 4
1.2 选择算法 4
1.2.1 无监督学习 5
1.2.2 监督学习 6
1.2.3 强化学习 7
1.2.4 注意事项 7
1.3 参数调优 7
1.4 评价模型 9
1.4.1 分类指标 9
1.4.2 回归指标 10
1.4.3 验证 10
1.5 小结 11
第 2章 k均值聚类 13
2.1 找出顾客群 13
2.2 示例:影迷的性格特征 13
2.3 定义群组 16
2.3.1 有多少个群组 16
2.3.2 每个群组中有谁 17
2.4 局限性 18
2.5 小结 19
第3章 主成分分析 21
3.1 食物的营养成分 21
3.2 主成分 22
3.3 示例:分析食物种类 24
3.4 局限性 27
3.5 小结 29
第4章 关联规则 31
4.1 发现购买模式 31
4.2 支持度、置信度和提升度 31
4.3 示例:分析杂货店的销售数据 33
4.4 先验原则 35
4.4.1 寻找具有高支持度的项集 36
4.4.2 寻找具有高置信度或高提升度的关联规则 37
4.5 局限性 37
4.6 小结 37
第5章 社会网络分析 39
5.1 展现人际关系 39
5.2 示例:国际贸易 40
5.3 Louvain方法 42
5.4 PageRank算法 43
5.5 局限性 46
5.6 小结 47
第6章 回归分析 49
6.1 趋势线 49
6.2 示例:预测房价 49
6.3 梯度下降法 52
6.4 回归系数 54
6.5 相关系数 55
6.6 局限性 56
6.7 小结 57
第7章 k*近邻算法和异常检测 59
7.1 食品检测 59
7.2 物以类聚,人以群分 60
7.3 示例:区分红白葡萄酒 61
7.4 异常检测 62
7.5 局限性 63
7.6 小结 63
第8章 支持向量机 65
8.1 医学诊断 65
8.2 示例:预测心脏病 65
8.3 勾画*佳分界线 66
8.4 局限性 69
8.5 小结 69
第9章 决策树 71
9.1 预测灾难幸存者 71
9.2 示例:逃离泰坦尼克号 72
9.3 生成决策树 73
9.4 局限性 74
9.5 小结 75
第 10章 随机森林 77
10.1 集体智慧 77
10.2 示例:预测犯罪行为 77
10.3 集成模型 81
10.4 自助聚集法 82
10.5 局限性 83
10.6 小结 84
第 11章 神经网络 85
11.1 建造人工智能大脑 85
11.2 示例:识别手写数字 86
11.3 神经网络的构成 89
11.4 激活规则 91
11.5 局限性 92
11.6 小结 94
第 12章 A/B测试和多臂老虎机 95
12.1 初识A/B测试 95
12.2 A/B测试的局限性 95
12.3 epsilon递减策略 96
12.4 示例:多臂老虎机 97
12.5 胜者为先 99
12.6 epsilon递减策略的局限性 99
12.7 小结 100
附录A 无监督学习算法概览 101
附录B 监督学习算法概览 102
附录C 调节参数列表 103
附录D 更多评价指标 104
术语表 107
关于作者 114
作者简介
黄莉婷(Annalyn Ng),高级数据分析师,剑桥大学心理测量中心硕士,曾受邀在迪士尼研究中心研究客户行为科学,并通过数据挖掘技术帮助三星和雅虎等公司制定营销和人员招聘等方面的策略。 苏川集(Kenneth Soo),斯坦福大学统计学硕士,华威大学高材生,曾从事网络随机故障下应用程序的双目标稳健优化研究,善于用通俗的语言介绍数据科学。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0