- ISBN:9787512379442
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:147
- 出版时间:2015-08-01
- 条形码:9787512379442 ; 978-7-5123-7944-2
本书特色
尽管不需要一个巨大的计算基础设施来运用apache hadoop处理大规模数据,但是要开始启动项目仍然是十分困难的。这本实践指南展示了如何在云中使用亚马逊弹性mapreduce(emr)来快速启动数据分析项目,emr是亚马逊web服务(aws)提供的hadoop框架。 作者kevin schmidt和christopher phillips通过一个样本mapreduce日志分析应用程序的开发全过程,向读者展示了使用emr、多种aws和apache技术的*佳实践。通过使用代码样本和示例配置,本书介绍了如何装配解决大数据分析问题所必要的基础材料。 获取用于大规模数据分析的aws和apache软件工具的概览。 使用一个简单的日志分析器来贯穿执行job flow处理的全过程。 发现用于过滤和分析数据集的有用的mapreduce模式。 使用apache hive 和pig代替java程序来构建mapreduce的job flow。 学习使用亚马逊emr来运行机器算法的基础知识。 开发使用亚马逊emr和其他aws工具的项目开销模型。
内容简介
尽管不需要一个巨大的计算基础设施来运用Apache Hadoop处理大规模数据,但是要开始启动项目仍然是十分困难的。这本实践指南展示了如何在云中使用亚马逊弹性MapReduce(EMR)来快速启动数据分析项目,EMR是亚马逊Web服务(AWS)提供的Hadoop框架。 作者Kevin Schmidt和Christopher Phillips通过一个样本MapReduce日志分析应用程序的开发全过程,向读者展示了使用EMR、多种AWS和Apache技术的*佳实践。通过使用代码样本和示例配置,本书介绍了如何装配解决大数据分析问题所必要的基础材料。 获取用于大规模数据分析的AWS和Apache软件工具的概览。 使用一个简单的日志分析器来贯穿执行Job Flow处理的全过程。 发现用于过滤和分析数据集的有用的MapReduce模式。 使用Apache Hive 和Pig代替Java程序来构建MapReduce的Job Flow。 学习使用亚马逊EMR来运行机器算法的基础知识。 开发使用亚马逊EMR和其他AWS工具的项目开销模型。
目录
相关资料
“创建mapreduce系统的复杂性阻止了许多组织使用该工具。亚马逊emr使得所有人都可以使用mapreduce,而本书将emr变为你的一个工具。”
——matthew gast
aerohive公司高级技术主管
作者简介
Kevin J.Schmidt是Dell SecureWorks有限公司的一名资深管理员。他负责公司SIEM平台主要部分的设计与开发。 Christopher Phillips是Dell SecureWorks有限公司的一名资深软件开发者。他负责公司的威胁智能服务平台的设计与开发。
-
写给小白的Python入门实战课
¥16.0¥50.0 -
Photoshop图像处理标准培训教程
¥20.4¥68.0 -
翻转世界-互联网思维与新技术如何改变未来
¥16.0¥49.9 -
多功能智能机器小车的开发与研制
¥17.9¥56.0 -
Excel 实战应用大全
¥15.9¥49.8 -
APP INVENTOR少儿趣味编程动手做
¥18.9¥59.0 -
像数据达人一样思考和沟通:数据科学、统计学与机器学习极简入门
¥48.3¥68.0 -
造神:人工智能神话的起源和破除 (精装)
¥48.4¥88.0 -
全图解零基础word excel ppt 应用教程
¥14.4¥48.0 -
ABAQUS 6.14超级学习手册
¥78.5¥109.0 -
物联网关键技术及其数据处理研究
¥19.1¥59.8 -
Word/Excel/PPT高效商务办公从入门到精通
¥15.4¥48.0 -
浪潮之巅 第4版(2册)
¥80.6¥139.0 -
Python数据爬取技术与实战手册
¥22.7¥59.8 -
HTML & CSS设计与构建网站
¥43.9¥79.8 -
机器学习导论
¥47.4¥79.0 -
flash经典课堂动画、游戏与多媒体制作案例教程
¥54.5¥99.0 -
推荐系统:产品与算法解析
¥59.9¥79.8 -
你好!PYTHON
¥74.9¥99.9 -
社交网络对齐
¥77.8¥99.8