- ISBN:9787115426758
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:32开
- 页数:326
- 出版时间:2016-08-01
- 条形码:9787115426758 ; 978-7-115-42675-8
本书特色
这本书是基于r和python的数据科学项目案例集锦,内容涵盖了基于数据科学的所有要素,包括数据采集、处理、清洗、分析、建模、可视化以及数据产品的搭建。案例包含了汽车数据分析、股票市场建模、社交网络分析、推荐系统、地理信息分析,以及python代码的计算优化。通过手把手的案例解析,令读者知其然并知其所以然。业界的数据分析师、数据挖掘工程师、数据科学家都可以读一读。想要了解实际工作中如何用数据产生价值的在校学生,或者对数据科学感兴趣的人也值得一读。
内容简介
本书涵盖r和python两种主流语言,其优点在于其结构,每一章的每一节内容都是按照“准备工作—处理流程—工作原理”的方式组织,这种组织形式非常适合一边实践一边学习(learn-by-doing)。
目录
第1章 准备你的数据科学环境 1
简介 1
理解数据科学管道 3
处理流程 3
工作原理 3
在windows、mac os x、linux上安装r 5
准备工作 5
处理流程 5
工作原理 7
参考资料 7
在r和rstudio中安装扩展包 7
准备工作 8
处理流程 8
工作原理 9
更多内容 10
参考资料 10
在linux和mac os x上安装python 10
准备工作 11
处理流程 11
工作原理 11
更多内容 11
参考资料 12
在windows上安装python 12
处理流程 13
工作原理 13
参考资料 14
在mac os x和linux上安装python数据分析库 14
准备工作 14
处理流程 14
工作原理 15
更多内容 16
参考资料 16
安装更多python包 17
准备工作 17
处理流程 17
工作原理 18
更多内容 18
参考资料 18
安装和使用virtualenv 19
准备工作 19
处理流程 19
工作原理 21
更多内容 21
参考资料 22
第2章 汽车数据的可视化分析(r) 23
简介 23
获取汽车燃料效率数据 24
准备工作 24
处理流程 25
工作原理 25
为了你的**个项目准备好r 26
准备工作 26
处理流程 26
工作原理 26
参考资料 26
将汽车燃料效率数据导入r 27
准备工作 27
处理流程 27
工作原理 28
更多内容 29
参考资料 30
探索和描述燃料效率数据 30
准备工作 30
处理流程 30
工作原理 32
更多内容 33
进一步分析汽车燃料效率数据 34
准备工作 34
处理流程 34
工作原理 43
参考资料 44
研究汽车的产量以及车型 44
准备工作 44
处理流程 44
工作原理 46
更多内容 47
参考资料 47
第3章 模拟美式橄榄球比赛数据(r) 48
简介 48
准备工作 49
获取和清洗美式橄榄球比赛数据 49
准
作者简介
作者简介Tony Ojeda(托尼·奥杰德),华盛顿DC数据社区的联合创始人,一位经验丰富的数据科学家和企业家,他在佛罗里达国际大学获得金融硕士学位,并且在德保罗大学获得了MBA学位。Sean Patrick Murphy(肖恩·派特里克·莫非),华盛顿DC数据社区的联合创始人,曾在约翰霍普金斯大学的应用物理实验室做了15年的高级科学家,他专注于机器学习、信号处理、高性能计算以及建模和模拟。现在他是旧金山、纽约和华盛顿DC多家公司的数据顾问。Benjamin Bengfort(本杰明·班福特),一位非常有经验的数据科学家和Python开发者。他曾在军方、业界和学术界工作过8年。他目前在马里兰大学派克学院攻读计算机博士学位,研究元识别和自然语言处理。他拥有北达科塔州立大学的计算机硕士学位,并是乔治城大学的客座教授。Abhijit Dasgupta(阿布吉特·达斯古普塔),华盛顿DC数据社区的成员,华盛顿DC统计编程社群的创始人和联合组织者,他拥有华盛顿大学生物统计的博士学位,在生物制药行业咨询、商业分析、生物信息以及生物工程咨询方面拥有多年的经验。译者简介郝智恒,甘肃兰州人,南开大学概率统计专业毕业,统计之都活跃会员。目前在阿里巴巴商业智能部任职,擅长数据分析和数据挖掘,喜欢用数据探索商业世界的边界。王佳玮,黄山脚下长大,香港城大-中科大联合培养博士毕业,现于阿里云大数据孵化器团队搬砖,喜欢数据分析和挖掘在社会各领域的应用,目前正致力于用数据和算法解决交通拥堵问题。谢时光,2011年博士毕业于美国弗吉尼亚理工大学工业工程系运筹学专业,毕业后从事数据分析、优化和决策支持相关工作至今。曾先后在安飞士(Avis)、亚马逊(Amazon.com)、费埃哲(FICO)等行业领先的公司从事从供应链到风险控制等多个应用领域的数据分析和优化决策研究工作。刘梦馨,灵雀云高级软件工程师,专注于容器虚拟化领域,机器学习爱好者。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0 -
PREMIERE PRO 2023全面精通:视频剪辑+颜色调整+转场特效+字幕制作+案例实战
¥69.3¥99.0