- ISBN:9787111529286
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:264
- 出版时间:2016-03-01
- 条形码:9787111529286 ; 978-7-111-52928-6
本书特色
本书是一本以spark1.4为基础,详细介绍了spark技术的概况、内部机制和企业界的应用情况。作者结合国内外众多资料和项目经验,力求深入浅出地讲解spark技术的生态应用和发展状况,此外还选取了sparksummit中的典型案例进行解析,为读者全面展现spark技术在企业界的应用情况。本书适合spark技术初学者、spark技术爱好者、spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书。
内容简介
spark是一个高效的分布式计算系统,相比hadoop,它在性能上比hadoop要高100倍。spark提供比hadoop更上层的api,同样的算法在spark中实现往往只有hadoop的1/10或者1/100的长度。spark较大的集群来自腾讯――8000个节点,而单个较大的job分别是阿里巴巴和databricks――1pb,震撼人心!同时,截止2015年6月,spark的contributor比2014年涨了3倍,达到730人;总代码行数也比2014年涨了2倍多,达到40万行。本书是国内(包括github社区)较新的基于spark 1.4版本的技术书籍,涵盖spark技术的环境搭建、rdd实操应用、内部机制、调优和企业应用等内容,具体如下。1)基于intellij idea的运行、开发和编译环境的详细搭建过程。2)详细介绍spark技术基础概念和应用实践。3)基于spark 1.4官方文档对spark四大应用框架进行解读。4)基于源码深入剖析spark的资源调度、任务调度和shuffle过程。5)深入解读近两年spark峰会和国内企业分享的典型应用案例。本书的编写系统完整,力争以通俗易懂的语言全方位精细解读spark技术,本书主要针对大数据技术初学者,包括但不限于大学生、研究生和工程师。此外,spark应用开发人员、运维工程师和开源软件爱好者也可以将本书作为参考用书。本书共分为概念、开发、机制和应用四篇,概念篇介绍spark的背景概念和环境配置方法,开发篇介绍了spark核心开发、四大应用框架和调优策略,机制篇则对spark的rdd、调度和shuffle等机制进行解读,应用篇针对spark在业界的典型应用进行阐述。
目录
作者简介
刘驰,博士,现任北京理工大学软件学院教授,软件服务工程系系主任。入选“北京理工大学杰出中青年支持与发展计划”。主持了国家自然科学基金、工信部电子商务集成试点工程等多项国家省部级重点项目。分别于清华大学和英国帝国理工学院获得学士和博士学位,后历任德国电信研究院(柏林)博士后研究员、美国IBM TJ Watson研究中心研究员和IBM中国研究院研究主管。研究方向为:物联网、云计算和大数据技术。
-
硅谷之火-人与计算机的未来
¥15.5¥39.8 -
人工智能的底层逻辑
¥55.3¥79.0 -
造神:人工智能神话的起源和破除 (精装)
¥32.7¥88.0 -
软件定义网络(SDN)技术与应用
¥25.7¥39.8 -
数学之美
¥41.0¥69.0 -
谁说菜鸟不会数据分析(入门篇)(第4版)
¥43.8¥69.0 -
自己动手写PYTHON虚拟机
¥35.0¥79.0 -
Photoshop平面设计实用教程
¥14.5¥39.8 -
计算机网络技术
¥13.9¥33.0 -
Excel函数.公式与图表
¥16.4¥48.0 -
.NET安全攻防指南(下册)
¥89.0¥129.0 -
.NET安全攻防指南(上册)
¥89.0¥129.0 -
大模型实战:微调、优化与私有化部署
¥65.3¥99.0 -
多模态数据融合与挖掘技术
¥34.7¥45.0 -
仓颉编程快速上手
¥62.9¥89.8 -
剪映AI
¥62.6¥88.0 -
FINAL CUT短视频剪辑零基础一本通
¥28.9¥39.8 -
数据挖掘技术与应用
¥46.0¥75.0 -
人工智能安全
¥66.4¥109.0 -
AI赋能写作:AI大模型高效写作一本通
¥36.8¥49.0