包邮大数据原理及实践

1星价 ¥29.1 (7.5折)

2星价￥29.1 定价￥39.0

作者：张晓燕

出版社：上海财经大学出版社

本类榜单：计算机/网络

分类：计算机/网络 > 计算机教材

暂无评论

图文详情

ISBN：9787564239091
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：其他
页数：203
出版时间：2023-01-01
条形码：9787564239091 ; 978-7-5642-3909-1

内容简介

近几年来，随着计算机和信息技术的迅猛发展和普及应用，行业应用系统的规模迅速扩大，行业应用所产生的数据呈爆炸性增长。人们把这种大规模数据称为“海量数据”。本书针对社会需求，为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识，使学生了解分布式数据处理系统的基本思想、原理及架构；通过实际案例分析及实践，使学生掌握大数据存储及处理的技术方法，*终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。本书大致目录：**章，**章，Hadoop生态系统介绍；第二章，Hadoop基本原理及环境搭建；第三章，HDFS基本操作及MapReduce编程；第四章，数据仓库HIVE的基本原理及应用；第五章，SPARK基本原理及应用；第六章，综合案例。

目录
第1章 Hadoop生态系统简介/001
1．1 大数据发展/001
1．2 Hadoop平台介绍/006
1．3 相关的公司/009
1．4 Hadoop生态系统/011
第2章 Hadoop核心组件及其基本原理/014
2．1 HDFS基本原理/014
2．2 MapReduce分布式计算框架/022
2．3 Yarn介绍/029
第3章 Hadoop环境搭建/033
3．1 Linux基础/033
3．2 Linux的文件系统结构/036
3．3 文件类型/038
3．4 Linux基本操作命令/039
3．5 Linux下常用的工具软件/047
3．6 Hadoop环境搭建/051
第4章 Hive基本原理及安装部署/063
4．1 Hive基本原理/063
4．2 Hive的数据存储/064
4．3 Hive的安装部署/066
第5章 Hive的基本操作/070
5．1 Hive的DDL(data define language)操作/070
5．2 Hive的DML(data managed language)操作/076
5．3 Hive shell 参数/093
第6章 Spark基础知识/095
6．1 Spark原理/095
6．2 Spark架构及生态/098
6．3 Spark运行流程及特点/100
6．4 Spark运行模式/108
第7章 Spark RDD编程/114
7．1 RDD设计与运行原理/114
7．2 RDD基本操作/122
7．3 Spark SQL简介/132
第8章基于MLLIB机器学习/140
8．1 概述/140
8．2 Spark分类和预测/142
8．3 决策树算法/145
8．4 朴素贝叶斯算法/152
8．5 回归分析与预测技术/157
8．6 聚类分析/167
大数据原理及实践
8．7 k-means聚类算法简介/172
8．8 DBSCAN聚类算法简介/179
8．9 关联规则分析简介/185
8．10 Apriori算法和FP Tree算法简介/188
参考文献/200

展开全部

本类五星书

更多>>

浏览历史

本类畅销

×

包邮大数据原理及实践

内容简介

目录

预估到手价 ×