- ISBN:9787512379442
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:147
- 出版时间:2015-08-01
- 条形码:9787512379442 ; 978-7-5123-7944-2
本书特色
尽管不需要一个巨大的计算基础设施来运用apache hadoop处理大规模数据,但是要开始启动项目仍然是十分困难的。这本实践指南展示了如何在云中使用亚马逊弹性mapreduce(emr)来快速启动数据分析项目,emr是亚马逊web服务(aws)提供的hadoop框架。 作者kevin schmidt和christopher phillips通过一个样本mapreduce日志分析应用程序的开发全过程,向读者展示了使用emr、多种aws和apache技术的*佳实践。通过使用代码样本和示例配置,本书介绍了如何装配解决大数据分析问题所必要的基础材料。 获取用于大规模数据分析的aws和apache软件工具的概览。 使用一个简单的日志分析器来贯穿执行job flow处理的全过程。 发现用于过滤和分析数据集的有用的mapreduce模式。 使用apache hive 和pig代替java程序来构建mapreduce的job flow。 学习使用亚马逊emr来运行机器算法的基础知识。 开发使用亚马逊emr和其他aws工具的项目开销模型。
内容简介
尽管不需要一个巨大的计算基础设施来运用Apache Hadoop处理大规模数据,但是要开始启动项目仍然是十分困难的。这本实践指南展示了如何在云中使用亚马逊弹性MapReduce(EMR)来快速启动数据分析项目,EMR是亚马逊Web服务(AWS)提供的Hadoop框架。 作者Kevin Schmidt和Christopher Phillips通过一个样本MapReduce日志分析应用程序的开发全过程,向读者展示了使用EMR、多种AWS和Apache技术的*佳实践。通过使用代码样本和示例配置,本书介绍了如何装配解决大数据分析问题所必要的基础材料。 获取用于大规模数据分析的AWS和Apache软件工具的概览。 使用一个简单的日志分析器来贯穿执行Job Flow处理的全过程。 发现用于过滤和分析数据集的有用的MapReduce模式。 使用Apache Hive 和Pig代替Java程序来构建MapReduce的Job Flow。 学习使用亚马逊EMR来运行机器算法的基础知识。 开发使用亚马逊EMR和其他AWS工具的项目开销模型。
目录
相关资料
“创建mapreduce系统的复杂性阻止了许多组织使用该工具。亚马逊emr使得所有人都可以使用mapreduce,而本书将emr变为你的一个工具。”
——matthew gast
aerohive公司高级技术主管
作者简介
Kevin J.Schmidt是Dell SecureWorks有限公司的一名资深管理员。他负责公司SIEM平台主要部分的设计与开发。 Christopher Phillips是Dell SecureWorks有限公司的一名资深软件开发者。他负责公司的威胁智能服务平台的设计与开发。
-
Excel高效办公应用于技巧大全
¥21.4¥49.8 -
计算机二级office通关秘籍
¥19.6¥28.0 -
大师谈游戏设计 创意与节奏
¥38.3¥49.8 -
全图解零基础word excel ppt 应用教程
¥14.4¥48.0 -
C++面向对象程序设计习题解答与上机指导 第2版
¥35.4¥59.0 -
全国计算机等级考试最新真考题库模拟考场及详解·二级MSOffice高级应用
¥24.8¥45.0 -
Python数据爬取技术与实战手册
¥22.7¥59.8 -
HTML & CSS设计与构建网站
¥43.9¥79.8 -
flash经典课堂动画、游戏与多媒体制作案例教程
¥54.5¥99.0 -
四步创业法
¥27.4¥48.0 -
推荐系统:产品与算法解析
¥62.2¥79.8 -
社交网络对齐
¥77.8¥99.8 -
大数据基础
¥22.8¥38.0 -
技术之外
¥48.3¥69.0 -
零基础玩转STABLE DIFFUSION
¥72.9¥99.8 -
Blender超级学习手册
¥86.3¥119.9 -
高效C/C++调试
¥69.3¥99.0 -
AIGC从入门到实战:CHATGPT+MIDJOURNEY+STABLE DIFFUSION+行业应
¥48.9¥69.8 -
实战AI大模型
¥74.3¥99.0 -
YOLO目标检测
¥69.9¥99.8