- ISBN:9787115490063
- 装帧:简裝本
- 册数:暂无
- 重量:暂无
- 开本:大32开
- 页数:84
- 出版时间:2018-08-01
- 条形码:9787115490063 ; 978-7-115-49006-3
本书特色
近年来,流处理变得越来越流行。作为高度创新的开源流处理器,Flink拥有诸多优势,包括容错性、高吞吐、低延迟,以及同时支持流处理和批处理的能力。本书分为6章,侧重于介绍Flink的核心设计理念、功能和用途,内容涉及事件时间和处理时间、窗口和水印机制、检查点机制、性能测评,以及Flink如何实现批处理。
本书面向有兴趣学习如何分析大规模流数据的读者。
内容简介
作为新一代的开源流处理器,Flink是众多大数据处理框架中一颗冉冉升起的新星。它以同一种技术支持流处理和批处理,并能同时满足高吞吐、低延迟和容错的需求。本书由Flink项目核心成员执笔,系统阐释Flink的适用场景、设计理念、功能、用途和性能优势。
- Flink的适用场景
- 流处理架构相较于批处理架构的优势
- Flink中的时间概念
- Flink的检查点机制
- Flink的性能优势
目录
第 1章 为何选择Flink 1
1.1 流处理欠佳的后果 2
1.1.1 零售业和市场营销 2
1.1.2 物联网 3
1.1.3 电信业 5
1.1.4 银行和金融业 5
1.2 连续事件处理的目标 6
1.3 流处理技术的演变 6
1.4 初探Flink 9
1.5 生产环境中的Flink 12
1.5.1 布衣格电信 13
1.5.2 其他案例 14
1.6 Flink的适用场景 15
第 2章 流处理架构 17
2.1 传统架构与流处理架构 17
2.2 消息传输层和流处理层 18
2.3 消息传输层的理想功能 19
2.3.1 兼具高性能和持久性 20
2.3.2 将生产者和消费者解耦 20
2.4 支持微服务架构的流数据 21
2.4.1 数据流作为中心数据源 22
2.4.2 欺诈检测:流处理架构用例 22
2.4.3 给开发人员带来的灵活性 24
2.5 不限于实时应用程序 24
2.6 流的跨地域复制 26
第3章 Flink 的用途 29
3.1 不同类型的正确性 29
3.1.1 符合产生数据的自然规律 29
3.1.2 事件时间 31
3.1.3 发生故障后仍保持准确 32
3.1.4 及时给出所需结果 33
3.1.5 使开发和运维更轻松 33
3.2 分阶段采用Flink 34
第4章 对时间的处理 35
4.1 采用批处理架构和Lambda 架构计数 35
4.2 采用流处理架构计数 38
4.3 时间概念 40
4.4 窗口 41
4.4.1 时间窗口 41
4.4.2 计数窗口 43
4.4.3 会话窗口 43
4.4.4 触发器 44
4.4.5 窗口的实现 44
4.5 时空穿梭 44
4.6 水印 45
4.7 真实案例:爱立信公司的Kappa 架构 47
第5章 有状态的计算 49
5.1 一致性 50
5.2 检查点:保证exactly-once 51
5.3 保存点:状态版本控制 59
5.4 端到端的一致性和作为数据库的流处理器 62
5.5 Flink 的性能 65
5.5.1 Yahoo! Streaming Benchmark 65
5.5.2 变化1:使用Flink 状态 66
5.5.3 变化2:改进数据生成器并增加吞吐量 67
5.5.4 变化3:消除网络瓶颈 68
5.5.5 变化4:使用MapR Streams 69
5.5.6 变化5:增加key 基数 69
5.6 结论 71
第6章 批处理:一种特殊的流处理 73
6.1 批处理技术 75
6.2 案例研究:Flink 作为批处理器 76
附录 其他资源 79
关于作者 84
作者简介
埃伦·弗里德曼(Ellen Friedman)
解决方案咨询师,知名大数据相关技术布道师,在流处理架构和大数据处理框架等方面有多部著作。
科斯塔斯·宙马斯(Kostas Tzoumas)
Flink项目核心成员,data Artisans公司联合创始人兼首席执行官,在流处理和数据科学领域经验丰富。
译者介绍
王绍?Q
阿里巴巴资 深技术专家,Apache Flink Committer,淘宝花名“大沙”。毕业于北京大学信息科学技术学院,后取得加州大学圣地亚哥分校计算机工程博士学位。目前就职于阿里巴巴计算平台事业部,负责Flink SQL引擎及机器学习的相关开发。加入阿里巴巴之前,在Facebook开发分布式图存储系统TAO。曾多次拜访由Flink创始团队创办的公司data Artisans,并与其首 席执行官科斯塔斯·宙马斯(本书作者之一)以及首 席技术官斯蒂芬·尤恩有着广泛的合作。
-
有限与无限的游戏:一个哲学家眼中的竞技世界
¥37.4¥68.0 -
硅谷之火-人与计算机的未来
¥14.3¥39.8 -
全图解零基础word excel ppt 应用教程
¥12.0¥48.0 -
机器学习
¥59.4¥108.0 -
深度学习的数学
¥43.5¥69.0 -
智能硬件项目教程:基于ARDUINO(第2版)
¥37.7¥65.0 -
元启发式算法与背包问题研究
¥38.2¥49.0 -
AI虚拟数字人:商业模式+形象创建+视频直播+案例应用
¥62.9¥89.8 -
UNIX环境高级编程(第3版)
¥164.9¥229.0 -
剪映AI
¥52.8¥88.0 -
深度学习高手笔记 卷2:经典应用
¥90.9¥129.8 -
纹样之美:中国传统经典纹样速查手册
¥77.4¥109.0 -
UG NX 12.0数控编程
¥24.8¥45.0 -
MATLAB计算机视觉与深度学习实战(第2版)
¥90.9¥128.0 -
界面交互设计理论研究
¥30.8¥56.0 -
UN NX 12.0多轴数控编程案例教程
¥25.8¥38.0 -
微机组装与系统维护技术教程(第二版)
¥37.8¥43.0 -
Go 语言运维开发 : Kubernetes 项目实战
¥48.2¥79.0 -
明解C语言:实践篇
¥62.9¥89.8 -
Linux服务器架设实战(Linux典藏大系)
¥84.5¥119.0