×
超值优惠券
¥50
100可用 有效期2天

全场图书通用(淘书团除外)

关闭
大数据采集与预处理技术

大数据采集与预处理技术

1星价 ¥29.4 (7.0折)
2星价¥29.4 定价¥42.0
暂无评论
图文详情
  • ISBN:9787548734116
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:176
  • 出版时间:2020-04-01
  • 条形码:9787548734116 ; 978-7-5487-3411-6

内容简介

《大数据采集与预处理技术》以大数据关键技术为主线,重点介绍了大数据采集技术和数据预处理技术。《大数据采集与预处理技术》共7章。第1章为大数据概述,重点阐述了大数据的概念、大数据关键技术以及大数据采集和数据预处理的重要性,并对《大数据采集与预处理技术》内容进行了概述;第2章在阐述传统数据采集相关技术基础上,从数据发展出发,剖析了大数据采集的特点和相关技术;第3章介绍了常用的大数据采集架构;第4章介绍了针对系统数据来源复杂、数据量大的企业数据的大数据迁移技术;第5章介绍了互联网数据抓取与处理技术;第6章介绍了数据预处理技术,包括数据清洗、数据集成、数据变换和数据归约等技术;第7章首先阐述了Hadoop相关理论基础,然后以淘宝网数据为例,介绍了大数据从数据采集、数据预处理、数据分析以及数据可视化的综合应用实例。《大数据采集与预处理技术》可作为高等院校大数据相关专业的教学用书,也可以作为从事大数据相关工作的工程技术人员的参考用书。

目录

第1章 大数据概述 1.1 大数据的概念 1.2 大数据关键技术 1.3 大数据采集与数据预处理技术 1.3.1 大数据采集技术 1.3.2 数据预处理技术 1.4 小结 习题 第2章 数据采集基础 2.1 传统数据采集技术 2.1.1 数据采集概述 2.1.2 数据采集系统架构 2.1.3 数据采集关键技术 2.2 大数据采集基础 2.2.1 数据的发展 2.2.2 大数据来源 2.2.3 大数据采集技术 2.3 小结 习题 第3章 大数据采集架构 3.1 概述 3.2 chukwa数据采集 3.3 Flume数据采集 3.4 scribe数据采集 3.5 Kafka数据采集 3.6 小结 习题 第4章 大数据迁移技术 4.1 数据迁移概念 4.2 数据迁移相关技术 4.2.1 基于主机的迁移方式 4.2.2 基于存储的迁移方式 4.2.3 备份恢复的方式 4.2.4 基于主机逻辑卷的数据迁 4.2.5 基于数据库的迁移技术 4.2.6 服务器虚拟化的迁移 4.2.7 其他数据迁移技术 4.3 数据迁移工具 4.3.1 Apache Sqoop 4.3.2 ETL 4.4 Kettle数据迁移实例 4.5 小结 习题 第5章 互联网数据抓取与处理技术 5.1 网络爬虫概述 5.1.1 网络爬虫的概念 5.1.2 网络爬虫的抓取策略 5.1.3 网页*新策略 5.2 常用网络爬虫方法 5.2.1 批量型爬虫 ……
展开全部

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航