Kafka Streams实战

Kafka Streams实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书教读者在Kafka平台上实现流式处理。在这本易于理解的书中,读者将通过实际的例子来收集、转换和聚合数据,使用多个处理器,处理实时事件。

内容简介

Kafka Streams是Kafka提供的一个用于构建流式处理程序的Java库,它与Storm、Spark等流式处理框架不同,是一个仅依赖于Kafka的Java库,而不是一个流式处理框架。除Kafka之外,Kafka Streams不需要额外的流式处理集群,提供了轻量级、易用的流式处理API。

本书包括4部分,共9章,从基础API到复杂拓扑的应用,通过具体示例由浅入深地详细介绍了Kafka Streams基础知识及使用方法。本书的主要内容包含流式处理发展历程和Kafka Streams工作原理的介绍,Kafka基础知识的介绍,使用Kafka Streams实现一个具体流式处理应用程序,讨论状态存储及其使用方法,讨论表和流的二元性及使用场景,介绍Kafka Streams应用程序的监控及测试方法,介绍使用Kafka Connect将现有数据源集成到Kafka Streams中,使用KSQL进行交互式查询等。

本书适合使用Kafka Streams实现流式处理应用的开发人员阅读。

作者简介

作者小威廉·P. 贝杰克,是Kafka Streams源码贡献者,在Conflument公司的Kafka Streams团队工作,有15年以上的软件开发经验,其中8年专注于后端开发,特别是处理大量数据,在数据提炼团队中,使用Kafka来改善下游客户的数据流。

章节目录

版权信息

内容提要

中文版序

译者序

译者简介

前言

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

致谢

关于作者

关于本书

读者对象

本书组织结构:路线图

关于代码

图书论坛

其他在线资源

关于封面插图

第一部分 开启Kafka Streams之旅

第1章 欢迎来到Kafka Streams

1.1 大数据的发展以及它是如何改变程序设计方式的

1.2 流式处理简介

1.3 处理购买交易

1.4 改变看待购买交易的视角

1.5 Kafka Streams在购买处理节点图中的应用

1.6 Kafka Streams在购买交易流中的应用

1.7 小结

第2章 Kafka快速指南

2.1 数据问题

2.2 使用Kafka处理数据

2.3 Kafka架构

2.4 生产者发送消息

2.5 消费者读取消息

2.6 安装和运行Kafka

2.7 小结

第二部分 Kafka Streams开发篇

第3章 开发Kafka Streams

3.1 流式处理器API

3.2 Kafka Streams的Hello World

3.3 处理客户数据

3.4 交互式开发

3.5 下一步

3.6 小结

第4章 流和状态

4.1 事件的思考

4.2 将状态操作应用到Kafka Stream

4.3 使用状态存储查找和记录以前看到的数据

4.4 连接流以增加洞察力

4.5 Kafka Streams中的时间戳

4.6 小结

第5章 KTable API

5.1 流和表之间的关系

5.2 记录更新和KTable配置

5.3 聚合和开窗操作

5.4 小结

第6章 处理器API

6.1 更高阶抽象与更多控制的权衡

6.2 使用源、处理器和接收器创建一个拓扑

6.3 通过股票分析处理器深入研究处理器API

6.4 组合处理器

6.5 集成处理器API和Kafka Streams API

6.6 小结

第三部分 管理Kafka Streams

第7章 监控和性能

7.1 Kafka基本监控

7.2 应用程序指标

7.3 更多Kafka Streams调试技术

7.4 小结

第8章 测试Kafka Streams应用程序

8.1 测试拓扑

8.2 集成测试

8.3 小结

第四部分 Kafka Streams进阶

第9章 Kafka Streams的高级应用

9.1 将Kafka与其他数据源集成

9.2 替代数据库

9.3 KSQL

9.4 小结

附录A 额外的配置信息

A.1 限制启动时再平衡的数量

A.2 应对代理中断的能力

A.3 处理反序列化错误

A.4 扩展应用程序

A.5 RocksDB配置

A.6 提前创建重新分区的主题

A.7 配置内部主题

A.8 重置Kafka Streams应用程序

A.9 清理本地状态

附录B 精确一次处理语义

Kafka Streams实战是2019年由人民邮电出版社出版,作者。

得书感谢您对《Kafka Streams实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
自然语言处理实战 电子书
实战自然语言处理及深度学习,涵盖基础知识与实际应用。
Spark海量数据处理:技术详解与平台实战 电子书
在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架Apache Spark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。 本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
Flink核心技术:源码剖析与特性开发 电子书
本书从设计思想和特性开发两个视角,对Flink框架进行介绍。
TensorFlow技术解析与实战 电子书
TensorFlow是谷歌公司开发的深度学习框架,也是目前深度学习的主流框架之一。
DAX设计模式(第2版) 电子书
为Power BI、SQL Server Analysis Services和Power Pivot提供全面的DAX现成解决方案集合。