包邮Hadoop应用架构

1星价 ¥44.5 (6.4折)

2星价￥44.5 定价￥69.0

作者：(美)马克·格洛沃(MarkGrove

出版社：人民邮电出版社

本类榜单：计算机/网络

分类：计算机/网络 > 程序设计 > 其他

买过本商品的人还买了

暂无评论

图文详情

ISBN：9787115442437
装帧：暂无
册数：暂无
重量：暂无
开本：32开
页数：278
出版时间：2017-01-01
条形码：9787115442437 ; 978-7-115-44243-7

本书特色

本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件，讲解较为单一的使用方法，而本书偏重实践，在架构的高度详细阐释诸多工具如何相互配合，搭建出打磨之后的完整应用。书中提供了诸多案例，易于理解，配有详细的代码解析，知识点一目了然。为加强训练，本书后半部分提供了详细的案例，涵盖*为常见的Hadoop应用架构。无论是设计Hadoop应用，还是将Hadoop同现有数据基础架构集成，本书都可以提供详实的参考。

内容简介

使用Hadoop进行数据存储和建模的着眼点和思路将数据输入、输出系统的*方案 MapReduce、Spark和Hive等数据处理框架介绍数据去重、窗口分析等常见Hadoop处理模式应用在Hadoop上采用Giraph、GraphX等图形处理工具综合使用工作流以及Apache Oozie等调度工具以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理点击流分析、欺诈检验和数据仓库的架构案例 Hadoop之父Doug Cutting作序推荐。“对Hadoop有所了解”与“能够使用Hadoop形成实际解决方案”之间的一座桥梁！

前言

**部分　考虑Hadoop应用的架构设计

**章　Hadoop数据建模

第二章　Hadoop数据移动

第三章　Hadoop数据处理

第四章　常见Hadoop处理范式

第五章　Hadoop图处理

第六章　协调调度

第七章　Hadoop近实时处理

第二部分　案例研究

第八章　点击流分析

第九章　欺诈检测

第十章　数据仓库

附录　A Impala中的关联

索引

作者简介

展开全部

作者简介

Mark Grover Apache Sentry项目管理委员会成员，《Hive编程指南》作者之一，曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目，并为Apache Bigtop项目和Apache Sentry（项目孵化中）项目贡献代码。 Ted Malaska Cloudera公司的资深解决方案架构师，致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局（FINRA，Financial Industry Regulatory Authority）首席架构师，指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。 Jonathan Seidman Cloudera公司的解决方案架构师，协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组（Chicago Hadoop User Group）及芝加哥大数据（Chicago Big Data）的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管，为*为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。 Gwen Shapira Cloudera公司的解决方案架构师，知名博主，拥有15年从业经验，协助客户设计高扩展性的数据架构。曾任Pythian高级顾问、Oracle ACE主管以及NoCOUG董事会成员，活跃于诸多业内会议。

本类五星书

更多>>

浏览历史

本类畅销

×

包邮Hadoop应用架构

本书特色

内容简介

目录

作者简介

预估到手价 ×