大数据应用与技术丛书Scala和Spark大数据分析.函数式编程.数据流和机器学习

1星价 ¥113.8 (7.2折)

2星价￥113.8 定价￥158.0

作者：[德]雷扎尔·卡里姆（Md.Reza

出版社：清华大学出版社

本类榜单：计算机/网络

分类：计算机/网络 > 数据库 > 数据仓库与数据挖掘

暂无评论

图文详情

ISBN：9787302551966
装帧：一般胶版纸
册数：暂无
重量：暂无
开本：其他
页数：624
出版时间：2020-06-01
条形码：9787302551966 ; 978-7-302-55196-6

本书特色

近年来，Scala得以迅速流行，在数据科学和分析领域势头更盛。基于Scala的Spark被广泛应用于生产环境，海量数据的分析可瞬间完成！本书全面系统地介绍Spark应用开发的面向对象和函数式编程概念，指导你用Scala编写强大的Spark程序。本书瞄准*前沿的技术，包含Spark SQL、结构流、graphX和Spark MLib等所有API。本书面向想利用Scala和Spark执行数据分析的人士。 ? 本书包含大量精妙的、紧贴实用的大数据分析问题，并说明如何使用Hadoop生态系统上的Scala解决这些问题。 ? 一本十分有用的大块头书籍，它呈现概念，并透彻地讲述如何实现概念。 ? 本书内容丰富，讨论了PySpark、SparkR、Alixuio和Zeppelin，包罗一切。 ? 学习将函数式编程和面向对象概念融为一体的精妙Scala类型系统。 ? 处理大范围的应用，从简单的批处理、流处理乃至机器学习 ? 分析*常见的用例和一些复杂用例，使用Spark执行大规模数据分析

内容简介

本书介绍Spark应用开发的面向对象和函数式编程概念，讨论RDD和DataFrame基本抽象，讲述如何使用SparkSQL、GraphX和Spark来开发可扩展的、容错的流式应用程序，很后介绍监控、配置、调试、测试和开发等不错主题。通过本书的学习，你将能使用SparkR和PySpark API开发Spark应用程序，使用Zeppelin进行交互式数据分析，使用Alluxio进行内存数据处理，将透彻理解Spark，并能对海量数据执行全栈数据分析，很终成为数据科学家。

作者简介

Md. Rezaul Karim 是德国Fraunhofer FIT的研究学者，也是德国亚琛工业大学的博士学位研究生预科生。他拥有计算机科学的学士与硕士学位。在加盟Fraunhofer FIT之前，他曾作为研究员任职于爱尔兰的数据分析深入研究中心。更早之前，他还担任过三星电子公司全球研究中心的首席工程师；该研究中心分布于韩国、印度、越南、土耳其以及孟加拉。再早之前，他还在韩国庆熙大学的数据库实验室担任过助理研究员，在韩国的BMTech21公司担任过研发工程师，在孟加拉国的i2软件技术公司担任过软件工程师。 Karim拥有超过8年的研发领域工作经验，并在如下算法和数据结构领域具有深厚的技术背景：C/C++、Java、Scala、R、Python、Docker、Mesos、Zeppelin、Hadoop以及MapReduce，并深入学习了如下技术：Spark、Kafka、DC/OS、DeepLearning4j以及H2O-Sparking Water。他的研究兴趣包括机器学习、深度学习、语义网络、关联数据(Linked Data)、大数据以及生物信息学。同时，他还是Packt出版社出版的以下两本书籍的作者： ● Large-Scale Machine Learning with Spark ● Deep Learning with TensorFlow Sridhar Alla是一位大数据专家，他曾帮助大大小小的诸多公司解决各种复杂的问题，例如数据仓库、数据治理、安全、实时数据处理、高频率的交易系统以及建立大规模的数据科学实践项目等。他也是敏捷技术的实践者，是一位获得认证的敏捷DevOps实践者和实施者。他在美国网域存储公司，以存储软件工程师的身份开始了自己的职业生涯。然后成为位于波士顿的eIQNetworks公司的CTO，该公司是一家网络安全公司。在他的履历表中，还包括曾担任位于费城的Comcast公司的数据科学与工程总监。他是很多会议或者活动(如Hadoop World、Spark峰会等)的热心参与者，在多项技术上提供面授/在线培训。他在美国商标专利局(US PTO)也有多项专利技术，内容涉及大规模计算与分布式系统等。他还持有印度尼赫鲁科技大学计算机科学方向的学士学位。目前，他和妻子居住在新泽西州。 Alla在Scala、Java、C、C++、Python、R以及Go语言上有超过18年的编程经验，他的技术研究范围也扩展到Spark、Hadoop、Cassandra、HBase、MongoDB、Riak、Redis、Zeppelin、Mesos、Docker、Kafka、ElasticSearch、Solr、H2O、机器学习、文本分析、分布式计算以及高性能计算等领域。

本类五星书

更多>>

浏览历史

大数据应用与技术丛书Scala和Spark大数据分析.函数式编程.数据流和机器学习

[德]雷扎尔·卡里姆（Md.Reza

¥113.8¥158.0

本类畅销

×

大数据应用与技术丛书Scala和Spark大数据分析.函数式编程.数据流和机器学习

本书特色

内容简介

目录

作者简介

预估到手价 ×