实时数据处理和分析指南

实时数据处理和分析指南

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

一本介绍实时大数据计算领域的相关技巧和经验(包括Flink、Spark、Storm、Kafka等流处理框架技术)的开发实战指南。

内容简介

本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。 在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。

作者简介

作者希尔皮·萨克塞纳,IT领域的一位技术布道者。她曾涉足多个领域(机器对机器空间、医疗保健、电信、人才招聘和制造业)。在企业解决方案的构思和执行的所有方面,以及在软件行业的产品和服务方面有超过12年的经验。她一直在大数据领域从事设计、管理和提供解决方案,并领导着一支高水平和分布在各地的精英工程师团队。

章节目录

版权信息

版权声明

内容提要

作者简介

前言

本书内容概述

阅读基础

读者对象

本书约定

审稿人简介

资源与支持

配套资源

提交勘误

与我们联系

关于异步社区和异步图书

第一部分 导言——熟悉实时分析

第1章 实时分析简介

1.1 大数据的定义

1.2 大数据的基础设施

1.3 实时分析——神话与现实

1.4 近实时解决方案——可用的架构

1.5 Lambda架构——分析可能性

1.6 物联网——想法与可能性

1.7 云——考虑NRT和物联网

1.8 小结

第2章 实时应用的基本组件

2.1 NRT系统及其构建模块

2.2 NRT的高级系统视图

2.3 NRT的技术视图

2.4 小结

第二部分 搭建基础设施

第3章 了解和跟踪数据流

3.1 了解数据流

3.2 为数据提取安装基础设施

3.3 将数据从源填到处理器——期望和注意事项

3.4 比较与选择适合用例的最佳实践

3.5 小试牛刀

3.6 小结

第4章 安装和配置Storm

4.1 Storm概述

4.2 Storm架构和组件

4.3 安装和配置Storm

4.4 在Storm上实时处理任务

4.5 小结

第5章 配置Apache Spark和Flink

5.1 安装并快速运行Spark

5.2 安装并快速运行Flink

5.3 安装并快速运行Apache Beam

5.4 Apache Beam中的平衡

5.5 小结

第三部分 Storm实时计算

第6章 集成Storm与数据源

6.1 RabbitMQ有效的消息传递

6.2 RabbitMQ交换器

6.3 RabbitMQ与Storm集成

6.4 PubNub数据流发布者

6.5 将Storm和RMQ_PubNub传感器数据拓扑串在一起

6.6 小结

第7章 从Storm到Sink

7.1 安装并配置Cassandra

7.2 Storm和Cassandra拓扑

7.3 Storm和IMDB集成处理维度数据

7.4 集成表示层与Storm

7.5 小试牛刀

7.6 小结

第8章 Storm Trident

8.1 状态保持和Trident

8.2 基本Storm Trident拓扑

8.3 Trident内部实现

8.4 Trident操作

8.5 DRPC

8.6 小试牛刀

8.7 小结

第四部分 使用Spark实现实时计算

第9章 运用Spark引擎

9.1 Spark概述

9.2 Spark的独特优势

9.3 Spark用例

9.4Spark架构——引擎内部的运行模式

9.5 Spark的语用概念

9.6 Spark 2.x——数据框和数据集的出现

9.7 小结

第10章 运用Spark操作

10.1 Spark——封装和API

10.2 RDD语用探索

10.3 共享变量——广播变量和累加器

10.4 小结

第11章 Spark Streaming

11.1 Spark Streaming的概念

11.2 Spark Streaming的简介和体系结构

11.3 Spark Streaming的封装结构

11.4 连接Kafka和Spark Streaming

11.5 小结

第五部分 使用Flink实现实时分析

第12章 运用Apache Flink

12.1 Flink体系结构和执行引擎

12.2 Flink的基本组件和进程

12.3 将源流集成到Flink

12.4 Flink处理和计算

12.5 Flink持久化

12.6 Flink CEP

12.7 Pattern API

12.8 Gelly

12.9 小试牛刀

12.10 小结

第六部分 综合应用

第13章 用例研究

13.1 概述

13.2 数据建模

13.3 工具和框架

13.4 建立基础设施

13.5 实现用例

13.6 运行用例

13.7 小结

实时数据处理和分析指南是2020年由人民邮电出版社出版,作者[印度] 希尔皮·萨克塞纳。

得书感谢您对《实时数据处理和分析指南》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
SPSS数据处理与分析(微课版) 电子书
本书重点阐述了数据处理与分析的相关知识,讲解了Excel、SPSSStatistics、SPSSModeler三种数据分析工具的使用方法。全书共有六个项目,系统地论述了Excel数据处理与分析、SPSSStatistics数据创建与数据预处理、SPSSStatistics数据的描述性统计分析、SPSSStatistics数据推断、SPSSModeler数据分析、SPSSModeler数据挖掘,并且
Excel 2016数据处理与分析应用教程 电子书
本书分为10章,内容包括Excel2016基础知识、数据输入与编辑、公式、函数、图表、数据管理、数据透视分析、宏、财务分析函数及应用、模拟分析。全书采用由易到难、循序渐进的方式介绍了Excel的常用知识点,并通过大量的实例讲解Excel的常用功能与操作步骤。本书内容翔实,案例丰富,操作步骤清晰,实用性强,并在各章配备微课视频,读者扫描二维码即可进行在线网络学习。本书可以作为高等院校相关专业的教学用
Excel数据处理与分析:数据思维+分析方法+场景应用 电子书
作者在世界500强企业从事数据分析师工作,有着丰富的实践经验,带你轻松入门数据分析。
Python数据处理、分析、可视化与数据化运营 电子书
本书共10章,内容包括认识Python、Python语言基础、数据对象的读写、数据清洗和预处理、数据可视化、基本数据统计分析、高级数据建模分析、自然语言处理和文本挖掘、数据分析部署和应用、数据分析与数据化运营等。
Excel 2016 数据处理与分析(微课版) 电子书
本书以培养应用能力为目标,将理论与实际应用相结合,系统地讲解使用Excel 2016进行数据处理与分析的方法。全书共分为11章,主要内容包括数据的输入与编辑,单元格数据的格式设置,公式、引用与名称,函数及其应用,数据图表处理,数据的排序与筛选,数据的汇总、合并与透视,数据的查询与核对,工作表的显示与打印,数据的安全与保密设置及Excel VBA基础等。本书可作为普通高等院校相关专业的教材,也可作为