Hadoop3.x大数据开发实战(视频教学版)

Hadoop3.x大数据开发实战(视频教学版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

Hadoop生态系统详解,适合初学者。

内容简介

本书以Hadoop3.x及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解VMware中CentOS7操作系统的安装;第2章讲解操作系统集群环境的配置;第3~16章讲解Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过案例演示了各个框架的实际应用。读者即使没有任何大数据基础,通过阅读本书,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书通俗易懂,内容丰富,适合大数据开发初学者、大数据运维人员以及大数据分析与挖掘的从业者阅读,也可作为培训机构和大专院校大数据专业课程的教学用书。

章节目录

版权信息

内容简介

作者简介

前言

第1章VMware中安装CentOS

1.1 下载CentOS 7镜像文件

1.2 新建虚拟机

1.3 安装操作系统

1.4 动手练习

第2章CentOS7集群环境配置

2.1 系统环境配置

2.2 安装JDK

2.3 克隆虚拟机

2.4 配置主机IP映射

2.5 动手练习

第3章Hadoop

3.1 Hadoop简介

3.2 YARN基本架构及组件

3.3 YARN工作流程

3.4 配置集群各节点SSH无密钥登录

3.5 搭建Hadoop 3.x分布式集群

3.6 动手练习

第4章HDFS

4.1 HDFS简介

4.2 HDFS命令行操作

4.3 HDFS Web界面操作

4.4 HDFS Java API操作

4.5 动手练习

第5章MapReduce

5.1 MapReduce简介

5.2 MapReduce程序编写步骤

5.3 案例分析:单词计数

5.4 案例分析:数据去重

5.5 案例分析:求平均分

5.6 案例分析:二次排序

5.7 使用MRUnit测试MapReduce程序

5.8 动手练习

第6章ZooKeeper

6.1 ZooKeeper简介

6.2 ZooKeeper安装配置

6.3 ZooKeeper命令行操作

6.4 ZooKeeper Java API操作

6.5 案例分析:监听服务器动态上下线

6.6 动手练习

第7章HDFS与YARNHA

7.1 HDFS HA搭建

7.2 YARN HA搭建

7.3 动手练习

第8章HBase

8.1 什么是HBase

8.2 HBase基本结构

8.3 HBase数据模型

8.4 HBase集群架构

8.5 HBase安装配置

8.6 HBase Shell命令操作

8.7 HBase Java API操作

8.7.5 删除数据

8.8 HBase过滤器

8.9 案例分析:HBase MapReduce数据转移

8.10 案例分析:HBase数据备份与恢复

8.11 动手练习

第9章Hive

9.1 什么是Hive

9.2 Hive架构体系

9.3 Hive三种运行模式

9.4 Hive安装配置

9.5 Hive常见属性配置

9.6 Beeline CLI的使用

9.7 Hive数据库操作

9.8 Hive表操作

9.9 Hive查询

9.10 其他Hive命令

9.11 Hive元数据表结构分析

9.12 Hive自定义函数

9.13 Hive JDBC操作

9.14 案例分析:Hive与HBase整合

9.15 案例分析:Hive分析搜狗用户搜索日志

9.16 动手练习

第10章Sqoop

10.1 什么是Sqoop

10.2 使用Sqoop

10.3 数据导入工具

10.4 数据导出工具

10.5 Sqoop安装与配置

10.6 案例分析:将MySQL表数据导入到HDFS中

10.7 案例分析:将HDFS中的数据导出到MySQL中

10.8 案例分析:将MySQL表数据导入到HBase中

10.9 动手练习

第11章Kafka

11.1 什么是Kafka

11.2 Kafka架构

11.3 主题与分区

11.4 分区副本

11.5 消费者组

11.6 数据存储机制

11.7 Kafka集群环境搭建

11.8 命令行操作

11.9 Java API操作

11.10 案例分析:Kafka生产者拦截器

11.11 动手练习

第13章Storm

13.1 什么是Storm

13.2 Storm Topology

13.3 Storm集群架构

13.4 Storm流分组

13.5 Storm集群环境搭建

13.6 案例分析:单词计数

13.7 案例分析:Storm与Kafka整合

13.8 动手练习

第14章Elasticsearch

14.1 什么是Elasticsearch

14.2 基本概念

14.3 集群架构

14.4 集群环境搭建

14.5 安装Kibana

14.6 REST API

14.7 Head插件安装

14.8 Java API操作:员工信息

14.9 动手练习

第15章Scala

15.1 什么是Scala

15.2 安装Scala

15.3 Scala基础

15.4 集合

15.5 类和对象

15.6 抽象类和特质

15.7 使用Eclipse创建Scala项目

15.8 使用IntelliJ IDEA创建Scala项目

15.9 动手练习

第16章Spark

16.1 Spark概述

16.2 Spark主要组件

16.3 Spark运行时架构

16.4 Spark集群环境搭建

16.5 Spark HA搭建

16.6 Spark应用程序的提交

16.7 Spark Shell的使用

16.8 Spark RDD

16.9 案例分析:使用Spark RDD实现单词计数

16.10 Spark SQL

16.11 案例分析:使用Spark SQL实现单词计数

16.12 案例分析:Spark SQL与Hive整合

16.13 案例分析:Spark SQL读写MySQL

16.14 动手练习

Hadoop3.x大数据开发实战(视频教学版)是2022年由清华大学出版社出版,作者张伟洋。

得书感谢您对《Hadoop3.x大数据开发实战(视频教学版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
视频直播营销与运营实战108招:小技巧大效果 电子书
本书逻辑架构清晰明了,技巧描写深入浅出,内容形式图文并茂,适合网络直播领域的运营者、管理者,特别是主题策划者、宣传推广者、吸粉引流者等阅读。
鸿蒙应用开发实战 电子书
本书为华为鸿蒙系统HarmonyOS开发图书,以JavaScript为开发语言,提供完整源代码。
ReactNative移动开发实战 电子书
React native入门书籍,打造高品质移动用户体验。
Vulkan开发实战详解 电子书
本书共分为19章,介绍了Vulkan的诞生、特点、开发环境的搭建以及运行机制、渲染管线和调试技术,着色器编程语言—GLSL、投影及各种变换、光照、纹理映射、3D模型的加载、混合与雾、两种测试及片元丢弃、顶点着色器的妙用、片元着色器的妙用、真实光学环境的模拟、阴影及高级光照、几种高级着色器特效、骨骼动画、Vulkan的性能优化等,最后以一个休闲游戏—方块历险记的案例来展示Vulkan的功能与技术。本
Vue企业开发实战 电子书
《大型电商网站大麦网开发:vue、ES6与Webpack技能结合》