- ISBN:9787115383495
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:290
- 出版时间:2015-03-01
- 条形码:9787115383495 ; 978-7-115-38349-5
本书特色
本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。
内容简介
本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。 本书适合所有希望通过数据分析解决问题的人阅读参考,包括数据科学家、金融工程师、统计学家、物理学家、学生及其他对数据科学感兴趣的人。
目录
关于封面图
前言
第1章简介:什么是数据科学
1.1大数据和数据科学的喧嚣
1.2冲出迷雾
1.3为什么是现在
1.4数据科学的现状和历史
1.5数据科学的知识结构
1.6思维实验:元定义
1.7什么是数据科学家
1.7.1学术界对数据科学家的定义
1.7.2工业界对数据科学家的定义
第2章统计推断、探索性数据分析和数据科学工作流程
2.1大数据时代的统计学思考
2.1.1统计推断
2.1.2总体和样本
2.1.3大数据的总体和样本
2.1.4大数据意味着大胆的假设
2.1.5建模
2.2探索性数据分析
2.2.1探索性数据分析的哲学
2.2.2练习:探索性数据分析
2.3数据科学的工作流程
2.4思维实验:如何模拟混沌
2.5案例学习:realdirect
2.5.1realdirect是如何赚钱的
2.5.2练一练:realdirect公司的数据策略
第3章算法
3.1机器学习算法
3.2三大基本算法
3.2.1线性回归模型
3.2.2足近邻模型(k-nn)
3.2.3i(均值算法
3.3练习:机器学习算法基础
3.4总结
3.5思维实验:关于统计学家的自动化
第4章垃圾邮件过滤器、朴素贝叶斯与数据清理
4.1思维实验:从实例中学习
4.1.1线性回归为何不适用
4.1.2l(近邻效果如何
4.2朴素贝叶斯模型
4.2.1贝叶斯法则
4.2.2个别单词的过滤器
4.2.3直通朴素贝叶斯
4.3拉普拉斯平滑法
4.4对比朴素贝叶斯和k近邻
4.5bash代码示例”
4.6网页抓取:apl和其他工具
4.7jake的练习题:文章分类问题中的朴素贝叶斯模型
第5章逻辑回归
5.1思维实验
5.2分类器
5.2.1运行时间
5.2.2你自己
5.2.3模型的可解释性
5.2.4可扩展性
……
第6章时间戳数据与金融建模
第7章从数据到结论
第8章构建面向大量用户的推荐引擎
第9章数据可视化与欺诈侦测
第10章社交网络与数据新闻学
第11章因果关系研究
第12章流行病学
第13章从竞赛中学到的:数据泄漏和模型评价
第14章数据工程:mapreduce pregel、hadoop
第15章听听学生学们怎么说
第16章下一代数据科学家、自大狂和职业道德
作者简介
Rachel Schutt 是美国新闻集团旗下数据科学部门的高级副总裁。她从哥伦比亚大学取得博士学位后,加入谷歌研究院工作了数年。她是哥伦比亚大学统计系的兼职教授,同时也是哥伦比亚大学数据科学及工程研究所的教育委员会发起者之一。她有几个专利正在申请之中,这些专利基于她在谷歌的工作,在那里她设计了算法原型,并且通过建模来理解用户的行为,这些*终都反映在了直接面向用户的产品中。她同时拥有纽约大学的数学硕士学位、斯坦福大学的工程经济系统和运筹学硕士学位,以及密歇根大学的数学学士学位。 Cathy O''Neil 从哈佛大学获得了数学博士学位,她曾经是麻省理工数学系的博士后、巴纳德学院的教授(在那里她发表了大量算术代数几何方面的论文)。随后她转身投入工业界,先是在信贷危机中期加入了D.E. Shaw 公司,担任该公司对冲基金的金融师;然后又加入了RiskMetrics(一家对银行和对冲基金进行风险评估的软件公司)。她现在是纽约初创公司联盟的数据科学家,并且撰写和维护着一个博客mathbabe.org。另外,她还参与了占领华尔街运动。 冯凌秉 澳大利亚国立大学统计学博士,本科和研究生分别毕业于中南财经政法大学和中国人民大学。现在,他任职于江西财经大学金融管理国际研究院,任讲师、硕士生导师,研究方向为应用统计与金融计量。 王群锋毕业于西安电子科技大学,现任职于IBM西安研发中心,从事下一代统计预测软件的开发运维工作。
-
写给小白的Python入门实战课
¥18.5¥50.0 -
Excel 实战应用大全
¥18.4¥49.8 -
全图解零基础word excel ppt 应用教程
¥16.8¥48.0 -
Excel高效办公应用于技巧大全
¥21.4¥49.8 -
像数据达人一样思考和沟通:数据科学、统计学与机器学习极简入门
¥48.3¥68.0 -
造神:人工智能神话的起源和破除 (精装)
¥61.6¥88.0 -
大师谈游戏设计 创意与节奏
¥35.9¥49.8 -
ABAQUS 6.14超级学习手册
¥78.5¥109.0 -
游戏设计艺术 第3版
¥167.7¥258.0 -
C++面向对象程序设计习题解答与上机指导 第2版
¥35.4¥59.0 -
多功能智能机器小车的开发与研制
¥20.7¥56.0 -
APP INVENTOR少儿趣味编程动手做
¥21.8¥59.0 -
Photoshop图像处理标准培训教程
¥23.8¥68.0 -
Python数据爬取技术与实战手册
¥22.7¥59.8 -
HTML & CSS设计与构建网站
¥43.9¥79.8 -
翻转世界-互联网思维与新技术如何改变未来
¥18.5¥49.9 -
flash经典课堂动画、游戏与多媒体制作案例教程
¥54.5¥99.0 -
四步创业法
¥27.4¥48.0 -
推荐系统:产品与算法解析
¥62.2¥79.8 -
你好!PYTHON
¥74.9¥99.9