×
大数据理论与应用基础

大数据理论与应用基础

1星价 ¥57.7 (7.3折)
2星价¥57.7 定价¥79.0
暂无评论
图文详情
  • ISBN:9787121463488
  • 装帧:暂无
  • 册数:暂无
  • 重量:暂无
  • 开本:其他
  • 页数:400
  • 出版时间:2023-09-01
  • 条形码:9787121463488 ; 978-7-121-46348-8

内容简介

本书从初学者的角度详细介绍大数据的核心技术。全书共11章,包括绪论、Linux的基础操作、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、ZooKeeper分布式协调服务、YARN资源管理器、HBase分布式数据库、Hive数据仓储、PySpark数据处理与分析及综合案例。此外,本书还提供了相应的示例代码,以帮助读者进一步理解相关方案的实现过程。

目录

目 录 第1章 绪论 1 1.1 大数据的形成和发展 1 1.2 大数据的基本概念 3 1.2.1 什么是大数据 3 1.2.2 大数据的特征 3 1.3 大数据关键技术 5 1.3.1 大数据采集技术 5 1.3.2 大数据预处理技术 6 1.3.3 大数据存储与管理技术 7 1.3.4 大数据分析与挖掘技术 8 1.3.5 大数据展现与应用技术 10 1.4 大数据的行业应用 11 1.4.1 水利领域 11 1.4.2 生物医学领域 13 1.4.3 智慧城市领域 14 1.4.4 商业领域 15 1.4.5 信息安全领域 15 1.5 大数据领域的主要职位及其能力要求 16 1.5.1 首席数据官 16 1.5.2 数据科学家 17 1.5.3 大数据开发工程师 17 1.5.4 大数据运维工程师 18 1.6 本章小结 18 1.7 习题 18 第2章 Linux的基础操作 19 2.1 Linux概述 19 2.1.1 Linux系统的发行版本及特点 19 2.1.2 Linux与Windows系统对比 19 2.2 Linux命令 20 2.2.1 命令行技巧 20 2.2.2 Linux帮助命令 22 2.2.3 Linux文件类型及查看操作 24 2.2.4 文件与目录操作 27 2.2.5 文本编辑 34 2.2.6 文本过滤器与处理 39 2.2.7 用户与用户组管理 43 2.2.8 文件权限管理 49 2.2.9 归档与压缩 53 2.2.10 进程管理 56 2.3 本章小结 57 2.4 习题 57 第3章 Hadoop大数据处理架构 59 3.1 Hadoop简介 59 3.1.1 Hadoop的概念 59 3.1.2 Hadoop的发展史 59 3.1.3 Hadoop版本介绍 61 3.2 Hadoop的特性 61 3.3 Hadoop生态系统 62 3.3.1 Hadoop集群的架构 62 3.3.2 Hadoop生态系统的组件 62 3.4 部署Hadoop集群 64 3.4.1 Hadoop集群的部署方式 64
展开全部

作者简介

吴慧欣,男,博士、教授,主要从事系统建模与仿真、机器学习、虚拟现实技术研究,担任河南省大数据专家委员会委员,河南省研究生教育指导委员会委员,河南省一流本科专业软件工程负责人,主持完成省部级以上科研、教改项目9项,获省部级科技奖励2项,国家发明专利7项,发表学术论文32篇,SCI/EI收录15篇。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航