×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
图文详情
  • ISBN:9787302511793
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:363
  • 出版时间:2019-03-01
  • 条形码:9787302511793 ; 978-7-302-51179-3

本书特色

本书详细介绍了大数据挖掘技术,全书分为3篇,共12章。第1篇为大数据分析基础,包括第1~4章,分别为大数据概述、大数据相关技术、数据预处理、R语言工具的使用。第2篇为大数据挖掘技术,包括第5~11章,分别为线性分类方法、分类方法、聚类分析、关联规则、预测方法与离群点诊断、时间序列分析、大数据挖掘可视化。第3篇为大数据挖掘案例,包括第12章,介绍了大数据挖掘应用案例。 本书既可作为高等学校计算机科学与技术、数据科学与大数据技术、统计学、数据分析等专业的高等教育教材,也可作为科研人员、从事大数据相关工作的技术人员的参考书。

内容简介

本书除了系统方法的理论讲解之外,在每一章给出了每种方法的R语言实现的实例,提供PPT、源代码、实验手册、课程与实验大纲、按照知识点结构的学习参考视频(可通过微信扫一扫功能观看)等,均可到清华大学出版社官网下载使用。

目录

第1篇 大数据分析基础 第1章 大数据概述 1.1 大数据的业务应用场景 1.1.1 大数据的产生及特征 1.1.2 大数据现状及趋势 1.1.3 大数据时代面临的技术问题 1.2 云计算与大数据挖掘 1.2.1 云计算的定义与特点 1.2.2 云计算与大数据 1.2.3 大数据挖掘 1.3 大数据挖掘过程概述 1.3.1 挖掘目标的定义与数据理解 1.3.2 数据准备与数据理解 1.3.3 过程模型的建立 1.3.4 过程模型的评估 1.3.5 模型的部署与应用 小结 习题 第2章 大数据相关技术 2.1 大数据获取技术 2.1.1 分布式数据采集系统F1ume 2.1.2 分布式消息队列Kafka 2.1.3 Sqoop数据转移工具 2.1.4 网络爬虫技术 2.1.5 数据预处理工具Kettle 2.2 大数据存储和处理技术 2.2.1 数据处理架构技术演进 2.2.2 Hadoop分布式存储和计算平台 2.2.3 流式数据计算引擎Storm 2.2.4 Spark分布式内存计算引擎 2.2.5 大数据部署方案简介 2.3 大数据查询和分析技术 2.3.1 SQL-on-Hadoop技术 2.3.2 OLAP分析引擎Kylin 2.3.3 大数据分析技术Mahotlt 2.3.4 大数据分析技术Spark MLlib 2.3.5 其他常用分析语言比较 2.4 大数据可视化技术 2.5 主流大数据分析平台简介 小结 习题 第3章 数据预处理 3.1 数据类型、数据特征与数据质量 3.1.1 数据类型 3.1.2 数据集与数据特征 3.1.3 探索数据结构 3.1.4 数据质量相关概念与数据质量分析 3.2 数据采集与抽样 3.2.1 数据采集概述 3.2.2 数据采集方法与应用特性 3.2.3 数据抽样概述 3.2.4 数据抽样方法与应用特性 3.3 数据预处理过程 3.3.1 数据预处理的作用与任务 3.3.2 数据清洗 3.3.3 数据集成 3.3.4 数据变换 3.3.5 数据规约 3.4 Hadoop中的数据预处理应用 3.4.1 使用MapReduee进行数据预处理 3.4.2 使用Kettle和Python进行数据预处理 小结 习题 第4章 R语言工具的使用 4.1 R语言概述 4.1.1 下载、安装和使用 …… 第2篇 大数据挖掘技术 第3篇 大数据挖掘案例 参考文献
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航