暂无评论
图文详情
- ISBN:9787113298951
- 装帧:平装-胶订
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:276
- 出版时间:2023-12-01
- 条形码:9787113298951 ; 978-7-113-29895-1
内容简介
为适应大数据时代的需要,许多高校纷纷设立数据科学与大数据专业。本书基于高等院校相应课程的教学要求而编写,详细讲述了大数据与数据科学、数据采集与数据预处理、数据存储、数据处理、数据分析、数据可视化、数据安全与隐私、大数据应用、数据思维等内容。本书内容注重引导性、前瞻性、经典性、实践性,旨在引导读者进入大数据领域,了解大数据近期新技术及其行业应用,关注大数据分析经典算法。书中还设置了实验环境和多个案例,便于读者进行实践操作。本书适合作为高等院校数据科学与大数据专业及其相近专业教材,也可供从事相关科研和工程技术人员参考。
目录
第 1 章 大数据与数据科学 11.1 大数据概述 11.1.1 大数据的概念 21.1.2 大数据的特征 21.1.3 大数据的结构类型 31.2 大数据的发展 41.3 大数据处理的挑战 51.4 数据科学的概念 61.5 数据科学的由来 71.6 数据科学的应用场景 91.6.1 行业数据 91.6.2 数据服务 10小结 11习题 11第 2 章 数据采集与数据预处理 122.1 数据采集和数据预处理概述 122.1.1 数据采集概述 122.1.2 数据预处理概述 132.2 数据采集技术 152.2.1 网络数据采集技术 152.2.2 日志数据采集技术 232.3 数据预处理技术 282.3.1 数据清洗 282.3.2 数据集成 302.3.3 数据变换 302.3.4 数据规约 312.3.5 电力大数据的采集 32小结 34习题 34第 3 章 数据存储 353.1 数据存储概述 353.1.1 数据存储的发展历程 353.1.2 数据存储模型 373.2 关系型数据库 373.2.1 关系型数据库的基本概念 383.2.2 关系型数据库的优缺点 403.2.3 关系型数据库的 ACID 原则 413.2.4 关系型数据库分库分表 423.3 大数据存储 453.3.1 海量数据存储关键技术 453.3.2 分布式文件系统 473.4 分布式数据库 513.4.1 NoSQL 523.4.2 CAP 理论 533.4.3 BASE 原理 553.4.4 HBase 分布式数据库 573.4.5 MongoDB 分布式数据库 603.4.6 Hive 分布式数据仓库 613.4.7 图数据库 633.4.8 内存数据库 66小结 68习题 68第 4 章 大数据处理平台 694.1 大数据处理平台概述 694.2 大数据的处理平台架构 704.2.1 技术架构 704.2.2 开源平台 714.3 大数据的批量计算 734.3.1 批量计算的概念 734.3.2 批量计算的软件系统 744.4 大数据的流式计算 824.4.1 流式计算的概念 824.4.2 流式计算的软件系统 834.5 大
展开全部
本类五星书
本类畅销
-
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
落洼物语
¥8.7¥28.0 -
中国当代文学名篇选读
¥19.1¥53.0 -
中医基础理论
¥50.7¥59.0 -
北大人文课(平装)
¥13.9¥45.0 -
宪法-第二版
¥12.2¥29.0 -
当代中国政府与政治 第二版
¥51.0¥68.0 -
EPLAN电气设计
¥29.9¥39.8 -
闯进数学世界――探秘历史名题
¥21.3¥32.8 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
金融学
¥29.9¥49.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
三国史
¥27.5¥50.0 -
陶瓷坯釉料制备技术/高职高专材料工程技术专业
¥37.4¥45.0 -
陶瓷工艺技术
¥41.7¥49.0 -
飞机总体设计
¥46.8¥78.0 -
陶瓷工艺学/焦宝祥
¥41.7¥49.0 -
古代汉语(第四册)
¥16.1¥35.0 -
编辑审稿实务教程
¥35.1¥45.0