Kafka权威指南

Kafka权威指南

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

这本实践指南助你成为流式平台上处理实时数据的专家。

内容简介

  本书是关于Kafka的全面教程,主要内容包括:Kafka相对于其他消息队列系统的优点,主要是它如何完美匹配大数据平台开发;详解Kafka内部设计;用Kafka构建应用的zuijia实践;理解在生产中部署Kafka的zuijia方式;如何确保Kafka集群的安全。

作者简介

  Neha Narkhede, Confluent联合创始人、CTO,曾在LinkedIn主导基于Kafka和Apache Samza构建流式基础设施,是Kafka作者之一。

  Gwen Shapira, Confluent系统架构师,帮助客户构建基于Kafka的系统,在可伸缩数据架构方面拥有十余年经验;曾任Cloudera公司解决方案架构师。另著有《Hadoop应用架构》。

  Todd Palino, LinkedIn主任级SRE,负责部署管理大型的Kafka、Zookeeper和Samza集群。

  译者简介

  薛命灯,毕业于厦门大学软件学院,十余年软件开发和架构经验,InfoQ高级社区编辑。译有《硅谷革命》《生产微服务》等书。微信公众号CodeDeep。

章节目录

版权信息

版权声明

O'Reilly Media, Inc. 介绍

业界评论

前言

读者对象

排版约定

使用代码示例

O'Reilly Safari

联系我们

致谢

电子书

第1章 初识Kafka

1.1 发布与订阅消息系统

1.2 Kafka登场

1.3 为什么选择Kafka

1.4 数据生态系统

1.5 起源故事

1.6 开始Kafka之旅

第2章 安装Kafka

2.1 要事先行

2.2 安装Kafka Broker

2.3 broker配置

2.4 硬件的选择

2.5 云端的Kafka

2.6 Kafka集群

2.7 生产环境的注意事项

2.8 总结

第3章 Kafka生产者——向Kafka写入数据

3.1 生产者概览

3.2 创建Kafka生产者

3.3 发送消息到Kafka

3.4 生产者的配置

3.5 序列化器

3.6 分区

3.7 旧版的生产者API

3.8 总结

第4章 Kafka消费者——从Kafka读取数据

4.1 KafkaConsumer概念

4.2 创建Kafka消费者

4.3 订阅主题

4.4 轮询

4.5 消费者的配置

4.6 提交和偏移量

4.7 再均衡监听器

4.8 从特定偏移量处开始处理记录

4.9 如何退出

4.10 反序列化器

4.11 独立消费者——为什么以及怎样使用没有群组的消费者

4.12 旧版的消费者API

4.13 总结

第5章 深入Kafka

5.1 集群成员关系

5.2 控制器

5.3 复制

5.4 处理请求

5.5 物理存储

5.6 总结

第6章 可靠的数据传递

6.1 可靠性保证

6.2 复制

6.3 broker配置

6.4 在可靠的系统里使用生产者

6.5 在可靠的系统里使用消费者

6.6 验证系统可靠性

6.7 总结

第7章 构建数据管道

7.1 构建数据管道时需要考虑的问题

7.2 如何在Connect API和客户端API之间作出选择

7.3 Kafka Connect

7.4 Connect之外的选择

7.5 总结

第8章 跨集群数据镜像

8.1 跨集群镜像的使用场景

8.2 多集群架构

8.3 Kafka的MirrorMaker

8.4 其他跨集群镜像方案

8.5 总结

第9章 管理Kafka

9.1 主题操作

9.2 消费者群组

9.3 动态配置变更

9.4 分区管理

9.5 消费和生产

9.6 客户端ACL

9.7 不安全的操作

9.8 总结

第10章 监控Kafka

10.1 度量指标基础

10.2 broker的度量指标

10.3 客户端监控

10.4 延时监控

10.5 端到端监控

10.6 总结

第11章 流式处理

11.1 什么是流式处理

11.2 流式处理的一些概念

11.3 流式处理的设计模式

11.4 Streams示例

11.5 Kafka Streams的架构概览

11.6 流式处理使用场景

11.7 如何选择流式处理框架

11.8 总结

附录A 在其他操作系统上安装Kafka

A.1 在Windows上安装Kafka

A.2 在MacOS上安装Kafka

作者介绍

封面介绍

看完了

Kafka权威指南是2018年由人民邮电出版社出版,作者NehaNarkhede。

得书感谢您对《Kafka权威指南》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python+Excel职场办公数据分析 电子书
一本适合编程小白学习的职场数据分析宝典。
HBase入门与实践(第2版) 电子书
本书以精练的语言介绍了HBase的基础知识。
Oracle从入门到精通 电子书
(1)全程同步视频教学,手机扫码,随看随学 (2)Oracle项目实战教学录像 (3)Java项目实战教学录像 (4)全书配套范例源码与实战练习答案 (5)Oracle常见面试题、Oracle常见函数汇总等相关电子书
Flink入门与实战 电子书
深入浅出展现Flink技术精髓,力求详细而完整地描述Flink大数据项目实战,从零开始快速掌握Flink的基本原理和核心功能。
Spark海量数据处理:技术详解与平台实战 电子书
在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架Apache Spark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。 本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。