×
暂无评论
图文详情
  • ISBN:9787115301116
  • 装帧:一般胶版纸
  • 册数:暂无
  • 重量:暂无
  • 开本:16开
  • 页数:191
  • 出版时间:2013-02-01
  • 条形码:9787115301116 ; 978-7-115-30111-6

本书特色

  apache pig 是一个高级过程语言,适合于使用 hadoop 和 mapreduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 sql 的查询,pig 可以简化 hadoop 的使用。本文不仅为初学者讲授,pig 的基础知识,同时还向有经验的用户更加全面的介绍pig的重点特性。 通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在hadoop集群中运行脚本的方法和技巧。

内容简介

  《pig编程指南》不仅为初学者讲解apache pig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的pig重要特性,如piglatin脚本语言、控制台shell交互命令以及用于对pig进行拓展的用户自定义函数(udf)等。当读者有大数据处理需求时,《pig编程指南》提供了如何更高效地使用pig来完成需求的方法。      《pig编程指南》适合各个层次的pig用户及开发人员阅读使用。

目录

第1章 初识pig 
1.1 pig是什么? 
1.1.1 pig是基于hadoop的 
1.1.2 pig latin,一种并行数据流语言 
1.1.3 pig的用途 
1.1.4 pig的设计思想 
1.2 pig发展简史 
 
第2章 安装和运行pig 
2.1 下载和安装pig 
2.1.1 从apache下载pig软件包 
2.1.2 从cloudera下载pig 
2.1.3 使用maven下载pig 
2.1.4 下载pig源码 
2.2 运行pig
展开全部

作者简介

  alan gates 是将PIG从雅虎的研究项目转化成一个成功的Apache开源项目的工程师团队中*早的成员。他负责监督Pig的实现、编程接口和总体设计。

预估到手价 ×

预估到手价是按参与促销活动、以最优惠的购买方案计算出的价格(不含优惠券部分),仅供参考,未必等同于实际到手价。

确定
快速
导航