- ISBN:9787115301116
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:191
- 出版时间:2013-02-01
- 条形码:9787115301116 ; 978-7-115-30111-6
本书特色
apache pig 是一个高级过程语言,适合于使用 hadoop 和 mapreduce 平台来查询大型半结构化数据集。通过允许对分布式数据集进行类似 sql 的查询,pig 可以简化 hadoop 的使用。本文不仅为初学者讲授,pig 的基础知识,同时还向有经验的用户更加全面的介绍pig的重点特性。 通过学习本书,你将能够身日了解数据模型,包括基本数据和复杂数据类型。掌握更高效的在hadoop集群中运行脚本的方法和技巧。
内容简介
《pig编程指南》不仅为初学者讲解apache pig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的pig重要特性,如piglatin脚本语言、控制台shell交互命令以及用于对pig进行拓展的用户自定义函数(udf)等。当读者有大数据处理需求时,《pig编程指南》提供了如何更高效地使用pig来完成需求的方法。 《pig编程指南》适合各个层次的pig用户及开发人员阅读使用。
目录
1.1 pig是什么?
1.1.1 pig是基于hadoop的
1.1.2 pig latin,一种并行数据流语言
1.1.3 pig的用途
1.1.4 pig的设计思想
1.2 pig发展简史
第2章 安装和运行pig
2.1 下载和安装pig
2.1.1 从apache下载pig软件包
2.1.2 从cloudera下载pig
2.1.3 使用maven下载pig
2.1.4 下载pig源码
2.2 运行pig
作者简介
alan gates 是将PIG从雅虎的研究项目转化成一个成功的Apache开源项目的工程师团队中*早的成员。他负责监督Pig的实现、编程接口和总体设计。
-
由浅入深学习SAP财务
¥67.3¥118.0 -
Excel 实战应用大全
¥15.9¥49.8 -
网络社团结构成因探究及其对网络中同步动力学行为的影响
¥32.4¥45.0 -
网络节点异质性预测研究及其对网络中信息-疾病耦合动力学行为的影响
¥32.4¥45.0 -
基于近邻思想和同步模型的聚类算法
¥46.6¥59.0 -
PYTORCH深度学习指南:编程基础 卷I
¥74.3¥99.0 -
智能图像处理技术及应用研究
¥35.8¥65.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥89.6¥128.0 -
遥感影像智能处理与分析
¥37.4¥52.0 -
人工智能+机器人入门与实战(修订版)用树莓派+Python+OpenCV制作计算
¥51.0¥69.8 -
技术之外
¥33.8¥69.0 -
系统集成项目管理工程师考试大纲(
¥12.9¥15.0 -
网络工程师教程(第2版)
¥69.3¥99.0 -
图解TCP/IP(第6版)
¥58.3¥79.8 -
PPT完美设计入门与进阶
¥68.6¥98.0 -
PYTHON GUI设计TKINTER 菜鸟编程(增强版)
¥70.3¥99.0 -
企业级应用开发实战
¥41.9¥59.9 -
MIDJOURNEY AI绘画艺术创作教程:关键词设置、艺术家与风格应用175例
¥56.8¥98.0 -
写给大家看的MIDJOURNEY设计书
¥48.9¥69.8 -
TensorFlow机器学习实用指南
¥65.5¥119.0