流式系统

流式系统

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

系统讲解流式处理核心、本质的概念、特性、设计和方法。

内容简介

本书分为两部分:第一部分以Beam的编程模型为抓手讨论流处理的种种核心问题,重点是相对高层次地讨论批处理模型以及流处理模型;第二部分讨论流与表的二象性,即两者之间的类比与差异,对概念进行深入探讨,并讨论关于流处理的“流与表”的思考方式。

本书还概要浏览大数据处理系统的家族历史,深入讨论流式系统发展领域的一些重要贡献。此外,本书配有大量的动画示意图,读者可以在线查看相关动图示例。

作者简介

作者泰勒·阿基道,谷歌的高级软件工程师、数据处理语言与系统团队的技术负责人,也是Apache Beam PMC的创始成员。

章节目录

版权信息

内容提要

O'Reilly Media, Inc.介绍

推荐序

译者序

前言

第一部分 Beam模型

第1章 流式入门

1.1 术语:什么是流式

1.2 数据处理模式

1.3 小结

第2章 数据处理的来龙去脉

2.1 路线图

2.2 批处理基础:定义及位置

2.3 开始流式处理:时机及方法

2.4 小结

第3章 水位

3.1 定义

3.2 源水位的创建

3.3 水位传播

3.4 百分位数水位

3.5 处理时间水位

3.6 案例分析

3.7 小结

第4章 高级开窗

4.1 时机/位置:处理时间开窗

4.2 位置:会话

4.3 位置:自定义开窗

4.4 小结

第5章 精确一次及副作用

5.1 为什么精确一次这么重要

5.2 准确性与完整性

5.3 确保在混洗中精确一次

5.4 解决确定性

5.5 性能

5.6 源端的精确一次

5.7 汇端的精确一次

5.8 使用场景

5.9 其他系统

5.10 小结

第二部分 流和表

第6章 流和表

6.1 流和表的基础:流表相对性的特殊理论

6.2 批处理与流和表

6.3 流和表世界的定义、位置、时机和方法

6.4 流表相对性的通用理论

6.5 小结

第7章 持久状态的实践

7.1 动机

7.2 隐式状态

7.3 通用状态

7.4 小结

第8章 流式SQL

8.1 什么是流式SQL

8.2 回顾:流和表的偏好

8.3 展望:迈向健壮的流式SQL

8.4 小结

第9章 流式连接

9.1 所有连接都是流式连接

9.2 非开窗连接

9.3 开窗连接

9.4 小结

第10章 大规模数据处理的演进

10.1 MapReduce

10.2 Hadoop

10.3 Flume

10.4 Storm

10.5 Spark

10.6 MillWheel

10.7 Kafka

10.8 Cloud Dataflow

10.9 Flink

10.10 Beam

10.11 小结

关于作者

关于封面

流式系统是2024年由人民邮电出版社出版,作者[美] 泰勒·阿基道。

得书感谢您对《流式系统》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
会计信息系统 电子书
《会计信息系统》以真实的轧钢企业为背景,设计了企业实用的会计科目体系、企业日常业务资料;以金蝶k3软件为应用系统,对书中的财务会计模块和供应链模块进行了全方位的运行,为《会计信息系统》的系统应用部分奠定了坚实的基础。
深入解析Android 5.0系统 电子书
本书详细剖析了最新Android5.0系统框架的原理和具体实现。本书共24章,覆盖了Android5.0系统中重要的模块,对于每个模块都详细介绍了它们的架构、原理及代码实现等各个方面,尽量让读者知其然,又知其所以然,达到学以致用的目的。本书主要内容为AndroidBuild系统核心、Android的Bionic、系统调用的实现、Binder应用层的核心类、JNI、同步和消息机制、进程间的消息传递、
设计师的系统思维 电子书
为你介绍系统思维相关的基础知识,以及这些知识在产品设计、设计管理中的运用。
分布式系统设计实践 电子书
全面梳理分布式技术,详解原理及应用,研究大型系统案例。
深入理解Zabbix监控系统 电子书
本书深入剖析Zabbix监控系统源码及功能,助力理解核心原理,提供二次开发参考。