
读者评分
5分
5分
数据科学实战
¥51.7
(6.5折)
1星价
¥60.8
2星价¥60.8
定价¥79.0
- 正版好图书
- 特价书1折起
- 满69包邮(新疆、西藏等六省除外,运费14元起)
商品评论(2条)
图文详情
- ISBN:9787115383495
- 装帧:暂无
- 版次:暂无
- 册数:暂无
- 重量:暂无
- 印刷次数:1
- 开本:16开
- 页数:290
- 出版时间:2015-03-01
- 条形码:9787115383495 ; 978-7-115-38349-5
本书特色
本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。
目录
作者介绍
关于封面图
前言
第1章简介:什么是数据科学
1.1大数据和数据科学的喧嚣
1.2冲出迷雾
1.3为什么是现在
1.4数据科学的现状和历史
1.5数据科学的知识结构
1.6思维实验:元定义
1.7什么是数据科学家
1.7.1学术界对数据科学家的定义
1.7.2工业界对数据科学家的定义
第2章统计推断、探索性数据分析和数据科学工作流程
2.1大数据时代的统计学思考
2.1.1统计推断
2.1.2总体和样本
2.1.3大数据的总体和样本
2.1.4大数据意味着大胆的假设
2.1.5建模
2.2探索性数据分析
2.2.1探索性数据分析的哲学
2.2.2练习:探索性数据分析
2.3数据科学的工作流程
2.4思维实验:如何模拟混沌
2.5案例学习:realdirect
2.5.1realdirect是如何赚钱的
2.5.2练一练:realdirect公司的数据策略
第3章算法
3.1机器学习算法
3.2三大基本算法
3.2.1线性回归模型
3.2.2足近邻模型(k-nn)
3.2.3i(均值算法
3.3练习:机器学习算法基础
3.4总结
3.5思维实验:关于统计学家的自动化
第4章垃圾邮件过滤器、朴素贝叶斯与数据清理
4.1思维实验:从实例中学习
4.1.1线性回归为何不适用
4.1.2l(近邻效果如何
4.2朴素贝叶斯模型
4.2.1贝叶斯法则
4.2.2个别单词的过滤器
4.2.3直通朴素贝叶斯
4.3拉普拉斯平滑法
4.4对比朴素贝叶斯和k近邻
4.5bash代码示例”
4.6网页抓取:apl和其他工具
4.7jake的练习题:文章分类问题中的朴素贝叶斯模型
第5章逻辑回归
5.1思维实验
5.2分类器
5.2.1运行时间
5.2.2你自己
5.2.3模型的可解释性
5.2.4可扩展性
……
第6章时间戳数据与金融建模
第7章从数据到结论
第8章构建面向大量用户的推荐引擎
第9章数据可视化与欺诈侦测
第10章社交网络与数据新闻学
第11章因果关系研究
第12章流行病学
第13章从竞赛中学到的:数据泄漏和模型评价
第14章数据工程:mapreduce pregel、hadoop
第15章听听学生学们怎么说
第16章下一代数据科学家、自大狂和职业道德
关于封面图
前言
第1章简介:什么是数据科学
1.1大数据和数据科学的喧嚣
1.2冲出迷雾
1.3为什么是现在
1.4数据科学的现状和历史
1.5数据科学的知识结构
1.6思维实验:元定义
1.7什么是数据科学家
1.7.1学术界对数据科学家的定义
1.7.2工业界对数据科学家的定义
第2章统计推断、探索性数据分析和数据科学工作流程
2.1大数据时代的统计学思考
2.1.1统计推断
2.1.2总体和样本
2.1.3大数据的总体和样本
2.1.4大数据意味着大胆的假设
2.1.5建模
2.2探索性数据分析
2.2.1探索性数据分析的哲学
2.2.2练习:探索性数据分析
2.3数据科学的工作流程
2.4思维实验:如何模拟混沌
2.5案例学习:realdirect
2.5.1realdirect是如何赚钱的
2.5.2练一练:realdirect公司的数据策略
第3章算法
3.1机器学习算法
3.2三大基本算法
3.2.1线性回归模型
3.2.2足近邻模型(k-nn)
3.2.3i(均值算法
3.3练习:机器学习算法基础
3.4总结
3.5思维实验:关于统计学家的自动化
第4章垃圾邮件过滤器、朴素贝叶斯与数据清理
4.1思维实验:从实例中学习
4.1.1线性回归为何不适用
4.1.2l(近邻效果如何
4.2朴素贝叶斯模型
4.2.1贝叶斯法则
4.2.2个别单词的过滤器
4.2.3直通朴素贝叶斯
4.3拉普拉斯平滑法
4.4对比朴素贝叶斯和k近邻
4.5bash代码示例”
4.6网页抓取:apl和其他工具
4.7jake的练习题:文章分类问题中的朴素贝叶斯模型
第5章逻辑回归
5.1思维实验
5.2分类器
5.2.1运行时间
5.2.2你自己
5.2.3模型的可解释性
5.2.4可扩展性
……
第6章时间戳数据与金融建模
第7章从数据到结论
第8章构建面向大量用户的推荐引擎
第9章数据可视化与欺诈侦测
第10章社交网络与数据新闻学
第11章因果关系研究
第12章流行病学
第13章从竞赛中学到的:数据泄漏和模型评价
第14章数据工程:mapreduce pregel、hadoop
第15章听听学生学们怎么说
第16章下一代数据科学家、自大狂和职业道德
展开全部
本类五星书
浏览历史
本类畅销
-
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
¥11.3¥45.0 -
全国计算机等级考试高分宝典:二级MSOffice高级应用
¥12.5¥49.8 -
Excel数据处理与分析
¥19.1¥59.8 -
C语言程序设计教程实验指导与习题解答(第四版)
¥25.1¥29.8 -
单片机实训与开发教程
¥12.6¥36.0 -
中小企业网络管理员工作实践:网络命令与运维工具卷
¥46.0¥59.8 -
白话聊Excel函数应用100例
¥56.6¥69.0 -
中文版Revit 2018基础培训教程(全彩版)
¥62.4¥78.0 -
复杂性思考:复杂性科学和计算模型
¥55.2¥69.0 -
Spring Cloud微服务和分布式系统实践
¥95.2¥119.0 -
携程架构实践
¥87.2¥109.0 -
游戏引擎架构(第2版)
¥153.3¥219.0 -
机器人学(第三版)
¥48.3¥69.0 -
KOTLIN从入门到项目实战
¥67.2¥79.0 -
人工智能技术应用导论/聂明
¥41.3¥59.0 -
中文版REVIT 2018基础培训教程
¥39.2¥49.0 -
深入理解Linux内核
¥136.1¥168.0 -
有限与无限的游戏:一个哲学家眼中的竞技世界
¥55.1¥68.0 -
WORD之光:颠覆认知的WORD必修课
¥67.9¥79.9 -
计算机科学丛书C程序设计语言(原书第2版.新版)(典藏版)
¥59.4¥69.0