暂无评论
图文详情
- ISBN:9787548734116
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:176
- 出版时间:2020-04-01
- 条形码:9787548734116 ; 978-7-5487-3411-6
内容简介
《大数据采集与预处理技术》以大数据关键技术为主线,重点介绍了大数据采集技术和数据预处理技术。《大数据采集与预处理技术》共7章。第1章为大数据概述,重点阐述了大数据的概念、大数据关键技术以及大数据采集和数据预处理的重要性,并对《大数据采集与预处理技术》内容进行了概述;第2章在阐述传统数据采集相关技术基础上,从数据发展出发,剖析了大数据采集的特点和相关技术;第3章介绍了常用的大数据采集架构;第4章介绍了针对系统数据来源复杂、数据量大的企业数据的大数据迁移技术;第5章介绍了互联网数据抓取与处理技术;第6章介绍了数据预处理技术,包括数据清洗、数据集成、数据变换和数据归约等技术;第7章首先阐述了Hadoop相关理论基础,然后以淘宝网数据为例,介绍了大数据从数据采集、数据预处理、数据分析以及数据可视化的综合应用实例。《大数据采集与预处理技术》可作为高等院校大数据相关专业的教学用书,也可以作为从事大数据相关工作的工程技术人员的参考用书。
目录
第1章 大数据概述
1.1 大数据的概念
1.2 大数据关键技术
1.3 大数据采集与数据预处理技术
1.3.1 大数据采集技术
1.3.2 数据预处理技术
1.4 小结
习题
第2章 数据采集基础
2.1 传统数据采集技术
2.1.1 数据采集概述
2.1.2 数据采集系统架构
2.1.3 数据采集关键技术
2.2 大数据采集基础
2.2.1 数据的发展
2.2.2 大数据来源
2.2.3 大数据采集技术
2.3 小结
习题
第3章 大数据采集架构
3.1 概述
3.2 chukwa数据采集
3.3 Flume数据采集
3.4 scribe数据采集
3.5 Kafka数据采集
3.6 小结
习题
第4章 大数据迁移技术
4.1 数据迁移概念
4.2 数据迁移相关技术
4.2.1 基于主机的迁移方式
4.2.2 基于存储的迁移方式
4.2.3 备份恢复的方式
4.2.4 基于主机逻辑卷的数据迁
4.2.5 基于数据库的迁移技术
4.2.6 服务器虚拟化的迁移
4.2.7 其他数据迁移技术
4.3 数据迁移工具
4.3.1 Apache Sqoop
4.3.2 ETL
4.4 Kettle数据迁移实例
4.5 小结
习题
第5章 互联网数据抓取与处理技术
5.1 网络爬虫概述
5.1.1 网络爬虫的概念
5.1.2 网络爬虫的抓取策略
5.1.3 网页*新策略
5.2 常用网络爬虫方法
5.2.1 批量型爬虫
……
展开全部
本类五星书
本类畅销
-
落洼物语
¥8.4¥28.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥33.6¥48.0 -
中国当代文学名篇选读
¥17.0¥53.0 -
中医基础理论
¥50.7¥59.0 -
长征记忆(八品)
¥9.5¥45.0 -
中医基础理论【中医 针灸专业用】
¥18.0¥25.0 -
北大人文课(平装)
¥12.2¥45.0 -
世界现代设计史-[第二版]
¥63.6¥120.0 -
宪法-第二版
¥20.3¥29.0 -
先进防伪技术
¥81.3¥98.0 -
当代中国政府与政治 第二版
¥57.8¥68.0 -
企业法务教程
¥34.8¥49.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
毛泽东思想和中国特色社会主义理论体系概论(2021年版)
¥8.5¥25.0 -
办公室工作实务(第4版)/黄海
¥27.8¥48.0 -
计算机操作系统教程(第4版)(清华大学计算机系列教材)
¥31.9¥49.0 -
习近平总书记教育重要论述讲义
¥13.3¥35.0 -
无人机概论
¥37.2¥59.0 -
(平装)北大必修课:北大口才课
¥18.2¥45.0 -
海商法-第四版
¥30.2¥48.0