编辑推荐
一部讲解数据流处理的作品,适合架构师、大数据科学家及IT工程师阅读。
内容简介
所有连续的事件流都可以称为数据流。对连续数据流使用和处理,设计和构建流式数据架构,能够实现实时或近实时应用,提升整个组织的效率。
本书以Apache Kafka 和MapR Streams为例,重点讲解如何确定使用流数据的时机、如何为多用户系统设计流式架构、为什么要求消息传递层具备某些特定功能,以及为什么需要微服务,并且描述了目前最符合流式设计需求的消息传递和流分析工具。
作者简介
作者Ted Dunning,MapRTechnologies首席应用架构师,开源社区的活跃成员。现任ApacheFoundation孵化器的VP,是大量项目的冠军得主和导师,也是ApacheZooKeeper和Drill项目的贡献者和PMC成员。
章节目录
版权信息
内容简介
O'Reilly Media,Inc.介绍
前言
第1章 为什么使用流
飞机、火车和汽车:车联网和物联网
流数据:这才是现实世界
什么时候需要流
不止是实时:流架构的更多优势
流架构的最佳实践
医疗数据流案例
流数据:架构设计的核心
第2章 流式架构
狭义视角:实时应用
通用流式架构的关键问题
消息传递技术的重要性
实时分析工具
Apache Storm
Apache Spark Streaming
Apache Flink
Apache Apex
流分析功能比较
小结
第3章 流架构:微服务的理想平台
为什么需要微服务
微服务需要哪些支撑
关于微服务的更多详情
设计流架构:以在线视频服务为例
新设计:支持消息传递的基础设施
通用微架构的重要性
命名问题
为什么使用分布式文件和NoSQL数据库
视频服务的新设计
小结:综合平台视角
第4章 使用Kafka进行流传输
Kafka的动机
Kafka的创新
Kafka的基本概念
排序
持久化
Kafka API
KafkaProducer API
KafkaConsumer API
遗留API
Kafka实用程序
负载均衡
镜像
Kafka的陷阱
产品环境下的Kafka
主题和分区的数目有限
手动均衡分区负载
没有固有的序列化机制
镜像的不足
小结
第5章 MapR Streams
MapR Streams的创新
MapR流系统的历史和情境
MapR Streams的工作原理
配置MapR Streams
地理分布式复制
MapR Streams的陷阱
第6章 基于流数据的欺诈检测
刷卡速度
快速响应决策:“这是欺诈吗”
多用途流数据
欺诈检测器的向上扩展
小结
第7章 地理分布式数据流
利益相关者
设计目标
设计选择
我们的设计
数据
控制谁能访问流数据
基于流的地理分布式复制的优势
第8章 总结
流式架构的优势
过渡到流架构
小结
附录A 附加资源
作者简介
流式架构:Kafka与MapRStreams数据流处理是2017年由电子工业出版社出版,作者[美] Ted Dunning。
得书感谢您对《流式架构:Kafka与MapRStreams数据流处理》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。