- ISBN:9787115498168
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:164
- 出版时间:2018-07-01
- 条形码:9787115498168 ; 978-7-115-49816-8
本书特色
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。 本书讲解了7种重要的数据分析方法,它们分别是k*近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。 本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
内容简介
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。 本书讲解了7种重要的数据分析方法,它们分别是k很近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。 本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。
目录
1.1 Mary对温度的感觉
1.2 实现k*近邻算法
1.3 意大利地区的示例——选择k值
1.4 房屋所有权——数据转换
1.5 文本分类——使用非欧几里德距离
1.6 文本分类——更高维度的k-NN
1.7 小结
1.8 习题
第 2 章 朴素贝叶斯
2.1 医疗检查——贝叶斯定理的基本应用
2.2 贝叶斯定理的证明及其扩展
2.3 西洋棋游戏——独立事件
2.4 朴素贝叶斯分类器的实现
2.5 西洋棋游戏——相关事件
2.6 性别分类——基于连续随机变量的贝叶斯定理
2.7 小结
2.8 习题
第 3 章 决策树
3.1 游泳偏好——用决策树表示数据
3.2 信息论 044
3.3 ID3算法——构造决策树 047
3.4 用决策树进行分类 054
3.5 小结 060
3.6 习题 060
第 4 章 随机森林 064
4.1 随机森林算法概述 064
4.2 游泳偏好——随机森林分析法 065
4.3 随机森林算法的实现 071
4.4 下棋实例 075
4.5 购物分析——克服随机数据的不一致性以及
度量置信水平 082
4.6 小结 084
4.7 习题 084
第 5 章 k-means聚类 089
5.1 家庭收入——聚类为k个簇 089
5.2 性别分类——聚类分类 092
5.3 k-means聚类算法的实现 095
5.4 房产所有权示例——选择簇的数量 099
5.5 小结 105
5.6 习题 105
第 6 章 回归分析 114
6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114
6.2 根据身高预测体重——基于实际数据的线性回归 117
6.3 梯度下降算法及实现 118
6.4 根据距离预测飞行时长 122
6.5 弹道飞行分析——非线性模型 123
6.6 小 结 125
6.7 习 题 125
第 7 章 时间序列分析 130
7.1 商业利润——趋势分析 130
7.2 电子商店的销售额——季节性分析 132
7.3 小 结 140
7.4 习 题 140
附录 A 统计 145
A.1 基本概念 145
A.2 贝叶斯推理 146
A.3 分 布 146
A.4 交叉验证 147
A.5 A/B 测 试 148
附录 B R参考 149
B.1 介 绍 149
B.2 数据类型 150
B.3 线性回归 152
附录 C Python参考 154
C.1 介 绍 154
C.2 数据类型 155
C.3 控 制 流 159
附录 D 数据科学中的算法和方法术语 163
作者简介
Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。 他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。
-
MySQL数据库案例教程
¥34.9¥49.8 -
Java语言程序设计
¥66.5¥95.0 -
计算
¥92.2¥128.0 -
软件工程导论——方法、工具和案例(题库·微课视频版)
¥34.9¥49.8 -
C语言程序设计
¥31.9¥45.5 -
C程序设计(第五版)
¥34.3¥49.0 -
KUKA(库卡)工业机器人编程与操作
¥59.3¥79.0 -
用户增长方法论:找到产品长盛不衰的增长曲线
¥60.5¥89.0 -
删繁就简-单片机入门到精通
¥27.3¥39.0 -
中文版PHOTOSHOP 2024完全自学教程
¥83.9¥119.8 -
智能控制与强化学习先进值迭代评判设计
¥104.9¥139.8 -
实战数据可视化Excel篇
¥27.4¥49.8 -
人工智能应用基础(第2版)
¥32.7¥46.0 -
有限元基础与COMSOL案例分析
¥83.9¥119.8 -
企业AI之旅
¥43.5¥79.0 -
系统集成项目管理工程师教程(第3版
¥97.3¥139.0 -
可编程控制器系统应用编程(中级)
¥44.9¥59.8 -
Blender超级学习手册
¥83.9¥119.9 -
人工智能极简史
¥49.6¥68.0 -
利用PYTHON进行数据分析(原书第3版)
¥116.2¥149.0