×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
暂无评论
图文详情
  • ISBN:9787113298951
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:276
  • 出版时间:2023-12-01
  • 条形码:9787113298951 ; 978-7-113-29895-1

内容简介

为适应大数据时代的需要,许多高校纷纷设立数据科学与大数据专业。本书基于高等院校相应课程的教学要求而编写,详细讲述了大数据与数据科学、数据采集与数据预处理、数据存储、数据处理、数据分析、数据可视化、数据安全与隐私、大数据应用、数据思维等内容。本书内容注重引导性、前瞻性、经典性、实践性,旨在引导读者进入大数据领域,了解大数据近期新技术及其行业应用,关注大数据分析经典算法。书中还设置了实验环境和多个案例,便于读者进行实践操作。本书适合作为高等院校数据科学与大数据专业及其相近专业教材,也可供从事相关科研和工程技术人员参考。

目录

第 1 章 大数据与数据科学 11.1 大数据概述 11.1.1 大数据的概念 21.1.2 大数据的特征 21.1.3 大数据的结构类型 31.2 大数据的发展 41.3 大数据处理的挑战 51.4 数据科学的概念 61.5 数据科学的由来 71.6 数据科学的应用场景 91.6.1 行业数据 91.6.2 数据服务 10小结 11习题 11第 2 章 数据采集与数据预处理 122.1 数据采集和数据预处理概述 122.1.1 数据采集概述 122.1.2 数据预处理概述 132.2 数据采集技术 152.2.1 网络数据采集技术 152.2.2 日志数据采集技术 232.3 数据预处理技术 282.3.1 数据清洗 282.3.2 数据集成 302.3.3 数据变换 302.3.4 数据规约 312.3.5 电力大数据的采集 32小结 34习题 34第 3 章 数据存储 353.1 数据存储概述 353.1.1 数据存储的发展历程 353.1.2 数据存储模型 373.2 关系型数据库 373.2.1 关系型数据库的基本概念 383.2.2 关系型数据库的优缺点 403.2.3 关系型数据库的 ACID 原则 413.2.4 关系型数据库分库分表 423.3 大数据存储 453.3.1 海量数据存储关键技术 453.3.2 分布式文件系统 473.4 分布式数据库 513.4.1 NoSQL 523.4.2 CAP 理论 533.4.3 BASE 原理 553.4.4 HBase 分布式数据库 573.4.5 MongoDB 分布式数据库 603.4.6 Hive 分布式数据仓库 613.4.7 图数据库 633.4.8 内存数据库 66小结 68习题 68第 4 章 大数据处理平台 694.1 大数据处理平台概述 694.2 大数据的处理平台架构 704.2.1 技术架构 704.2.2 开源平台 714.3 大数据的批量计算 734.3.1 批量计算的概念 734.3.2 批量计算的软件系统 744.4 大数据的流式计算 824.4.1 流式计算的概念 824.4.2 流式计算的软件系统 834.5 大
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航