- ISBN:9787111529286
- 装帧:暂无
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:264
- 出版时间:2016-03-01
- 条形码:9787111529286 ; 978-7-111-52928-6
本书特色
本书是一本以spark1.4为基础,详细介绍了spark技术的概况、内部机制和企业界的应用情况。作者结合国内外众多资料和项目经验,力求深入浅出地讲解spark技术的生态应用和发展状况,此外还选取了sparksummit中的典型案例进行解析,为读者全面展现spark技术在企业界的应用情况。本书适合spark技术初学者、spark技术爱好者、spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书。
内容简介
spark是一个高效的分布式计算系统,相比hadoop,它在性能上比hadoop要高100倍。spark提供比hadoop更上层的api,同样的算法在spark中实现往往只有hadoop的1/10或者1/100的长度。spark较大的集群来自腾讯――8000个节点,而单个较大的job分别是阿里巴巴和databricks――1pb,震撼人心!同时,截止2015年6月,spark的contributor比2014年涨了3倍,达到730人;总代码行数也比2014年涨了2倍多,达到40万行。本书是国内(包括github社区)较新的基于spark 1.4版本的技术书籍,涵盖spark技术的环境搭建、rdd实操应用、内部机制、调优和企业应用等内容,具体如下。1)基于intellij idea的运行、开发和编译环境的详细搭建过程。2)详细介绍spark技术基础概念和应用实践。3)基于spark 1.4官方文档对spark四大应用框架进行解读。4)基于源码深入剖析spark的资源调度、任务调度和shuffle过程。5)深入解读近两年spark峰会和国内企业分享的典型应用案例。本书的编写系统完整,力争以通俗易懂的语言全方位精细解读spark技术,本书主要针对大数据技术初学者,包括但不限于大学生、研究生和工程师。此外,spark应用开发人员、运维工程师和开源软件爱好者也可以将本书作为参考用书。本书共分为概念、开发、机制和应用四篇,概念篇介绍spark的背景概念和环境配置方法,开发篇介绍了spark核心开发、四大应用框架和调优策略,机制篇则对spark的rdd、调度和shuffle等机制进行解读,应用篇针对spark在业界的典型应用进行阐述。
目录
作者简介
刘驰,博士,现任北京理工大学软件学院教授,软件服务工程系系主任。入选“北京理工大学杰出中青年支持与发展计划”。主持了国家自然科学基金、工信部电子商务集成试点工程等多项国家省部级重点项目。分别于清华大学和英国帝国理工学院获得学士和博士学位,后历任德国电信研究院(柏林)博士后研究员、美国IBM TJ Watson研究中心研究员和IBM中国研究院研究主管。研究方向为:物联网、云计算和大数据技术。
-
造神:人工智能神话的起源和破除 (精装)
¥32.7¥88.0 -
过程控制技术(第2版高职高专规划教材)
¥27.6¥38.0 -
专业导演教你拍好短视频
¥13.8¥39.9 -
数学之美
¥41.0¥69.0 -
系统性创新手册(管理版)
¥42.6¥119.0 -
人工智能
¥20.3¥55.0 -
硅谷之火-人与计算机的未来
¥15.5¥39.8 -
WPS OFFICE完全自学教程(第2版)
¥97.3¥139.0 -
人工智能基础及应用
¥34.6¥48.0 -
深入浅出软件架构
¥117.2¥186.0 -
软件设计的哲学(第2版)
¥54.0¥69.8 -
大数据技术导论(第2版)
¥28.9¥41.0 -
人工智能的底层逻辑
¥55.3¥79.0 -
剪映+PREMIERE+AIGC 短视频制作速成
¥73.5¥98.0 -
人人都能学AI
¥49.3¥68.0 -
剪映AI
¥52.0¥88.0 -
数据挖掘技术与应用
¥46.0¥75.0 -
数据采集与处理
¥36.4¥49.8 -
PLC结构化文本编程(第2版)
¥56.3¥79.0 -
中小型网络组建与管理
¥30.7¥43.0