大数据计算系统:原理、技术与应用

大数据计算系统:原理、技术与应用

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

从原理、编程、运维与优化的角度介绍大数据计算系统的设计与构建。

内容简介

本书兼顾广度和深度、应用和原理、研发和运维,对于各类大数据计算系统进行了深入的介绍,包括大数据计算系统的基本概念、各种大数据计算系统的配置与程序设计方法、大数据计算系统的运行原理、大数据计算机系统的监控、运维和调优方法等。

本书适用于作为数据科学与大数据、计算机等专业本科生和研究生相关课程的教材,还可供大数据领域从业人员参考。

章节目录

版权信息

前言

第一部分 基础

第1章 大数据计算系统概述

1.1 大数据计算系统的定义

1.2 常见的大数据计算系统

1.3 大数据计算系统的监控与运维概述

1.4 大数据计算系统的性能优化

习题1

第二部分 应用实现

第2章 Hadoop的配置与编程

2.1 批处理计算框架概述

2.2 Hadoop环境的配置与搭建

2.3 一个简单示例

2.4 MapReduce编程

习题2

第3章 HDFS及其应用

3.1 HDFS概述

3.2 HDFS Shell

3.3 HDFS目录与数据的浏览

3.4 HDFS API

习题3

第4章 Spark的配置与编程

4.1 Spark环境的安装与部署

4.2 Spark的运行

4.3 Spark Scala编程

习题4

第5章 Storm的配置与编程

5.1 流计算概述

5.2 Storm概述

5.3 Storm开发环境的搭建

5.4 Storm编程

5.5 Storm编程示例——单词计数

习题5

第6章 GraphX及其应用

6.1 图计算概述

6.2 GraphX编程

6.3 GraphX编程示例

习题6

第三部分 原理

第7章 Hadoop的原理

7.1 Hadoop的体系结构

7.2 MapReduce的工作机制

7.3 MapReduce作业的运行机制

7.4 作业的调度

7.5 任务的执行

7.6 Shuffle的工作原理

习题7

第8章 HDFS的原理

8.1 HDFS的体系结构

8.2 HDFS中的数据访问

8.3 安全机制

8.4 容错机制

8.5 HDFS on YARN

习题8

第9章 Spark的原理

9.1 Spark的原理概述

9.2 Spark的RDD

9.3 Spark的存储

9.4 Spark任务的执行与提交

9.5 Spark的容错原理

习题9

第10章 Storm的原理

10.1 Storm的概念与系统架构

10.2 Storm的运行原理

10.3 Storm拓扑的并发机制

10.4 Storm的通信机制

10.5 Storm的容错

习题10

第11章 GraphX的原理

11.1 GraphX概述

11.2 GraphX的图数据存储

11.3 GraphX对图计算的支持

习题11

第四部分 监控、运维与调优

第12章 大数据计算系统的监控

12.1 监控的准备工作

12.2 监控内容

12.3 Hadoop监控的相关参数

12.4 通过HTTP界面监控Hadoop的状态

12.5 Hadoop的监控命令

12.6 编写自己的监控工具

12.7 利用Ganglia进行Hadoop集群监控

12.8 Hadoop的其他监控工具

习题12

第13章 大数据计算系统的运维

13.1 Hadoop及相关服务的启动与停止

13.2 用户身份确认和授权

13.3 Hadoop的运维命令

13.4 Hadoop中的数据迁移和备份

13.5 Hadoop的容灾处理

13.6 基于Greenplum进行Hadoop故障检测

习题13

第14章 大数据计算系统的调优

14.1 为什么要进行调优

14.2 如何调优

14.3 Hadoop的性能指标

14.4 系统优化

14.5 机架感知对性能调优的影响

14.6 Hadoop系统参数调优

14.7 生产环境的Hadoop性能优化

习题14

大数据计算系统:原理、技术与应用是2023年由机械工业出版社出版,作者刘海龙 编著。

得书感谢您对《大数据计算系统:原理、技术与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据技术原理与应用(第3版) 电子书
本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。
大数据原理与技术 电子书
本书则是华为公司针对华为ICT学院大数据方向的在读学生,专门组织合作伙伴和华为公司内部员工开发的标准化教材,这套教材的目的在于循序渐进地帮助华为ICT学院大数据方向的学生掌握大数据技术的基本原理与应用场景,能够在面对真实的业务场景时,独立完成大数据平台的搭建、维护及故障的处理。
大数据技术原理与应用——概念、存储、处理、分析与应用 电子书
全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。
大数据技术原理与应用——从入门到实战 电子书
本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoo
数据库系统原理及应用教程 电子书
本书系统全面地阐述了数据库系统的基本理论、技术和方法,具有概念清楚、重点突出、章节安排合理,重视上机实验环节等特点。书中以流行的SQLServer2016数据库管理系统为技术案例和实验平台,具有较好的可操作性。书中每章附有丰富习题。为便于组织教学和实验,本书的后一章为数据库课程的教学标准、实验标准和实验方案,供读者参考。