从零开始学Hadoop大数据分析(视频教学版)

从零开始学Hadoop大数据分析(视频教学版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书通过30个小案例和4个项目案例及20小时教学视频手把手带领小白入门Hadoop大数据分析的核心技术。

内容简介

本书全面介绍了Hadoop大数据分析的基础知识、14个核心组件模块及4个项目实战案例。为了帮助读者高效、直观地学习,作者特意为本书录制了20小时同步配套教学视频。

本书共19章,分为3篇。第1篇Hadoop基础知识,涵盖大数据概述、Hadoop的安装与配置、Hadoop分布式文件系统及基于Hadoop 3的HDFS高可用等相关内容;第2篇Hadoop核心技术,涵盖的内容有Hadoop的分布式协调服务:ZooKeeper;分布式离线计算框架:MapReduce;Hadoop的集群资源管理系统:YARN;Hadoop的数据仓库框架:Hive;大数据快速读写:HBase;海量日志采集工具:Flume;Hadoop和关系型数据库间的数据传输工具:Sqoop;分布式消息队列:Kafka;开源内存数据库:Redis;Ambari和CDH;快速且通用的集群计算系统:Spark。第3篇Hadoop项目案例实战,主要介绍了基于电商产品的大数据业务分析系统、用户画像分析、基于个性化的视频推荐系统及电信离网用户挽留4个项目实战案例,以提高读者的大数据项目开发水平。

本书内容全面,实用性强,适合作为Hadoop大数据分析与挖掘的入门读物,也可作为Java程序员的进阶读物。另外,本书还特别适合想要提高大数据项目开发水平的人员阅读。对于专业的培训机构和相关院校而言,本书也是一本不可多得的教学用书。

作者简介

作者温春水,毕业于中国人民大学,获硕士学位。历任森途国信新工科研究院院长、大唐网络和三点一刻大数据技术总监,负责大数据技术架构。12年以上的IT从业经验,其中从事IT培训超过5年,直接授课学员超过3万人。受邀为燕山石化和中国石油等企业完成Python及大数据技术等企业内训;受聘面向哈尔滨工业大学、南开大学、天津大学、华南农业大学、山东科技大学、北京交通大学、西安交通大学、天津师范大学和北京航空航天大学等高校的本科生及研究生讲授项目管理、需求分析、软件体系设计和项目开发等课程。

章节目录

版权信息

前言

第1篇 Hadoop基础知识

第1章 初识Hadoop

1.1 大数据初探

1.2 Hadoop简介

1.3 小结

第2章 Hadoop的安装与配置

2.1 虚拟机的创建

2.2 安装Linux系统

2.3 配置网络信息

2.4 克隆服务器

2.5 SSH免密码登录

2.6 安装和配置JDK

2.7 Hadoop环境变量配置

2.8 Hadoop分布式安装

2.9 小结

第3章 Hadoop分布式文件系统

3.1 DFS介绍

3.2 HDFS介绍

3.3 Hadoop中HDFS的常用命令

3.4 HDFS的应用

3.5 小结

第4章 基于Hadoop 3的HDFS高可用

4.1 Hadoop 3.x的发展

4.2 Hadoop 3 HDFS完全分布式搭建

4.3 什么是HDFS高可用

4.4 搭建HDFS高可用

4.5 小结

第2篇 Hadoop核心技术

第5章 Hadoop的分布式协调服务——ZooKeeper

5.1 ZooKeeper的核心概念

5.2 ZooKeeper的安装与运行

5.3 ZooKeeper服务器端的常用命令

5.4 客户端连接ZooKeeper的相关操作

5.5 使用Java API访问ZooKeeper

5.6 小结

第6章 分布式离线计算框架——MapReduce

6.1 MapReduce概述

6.2 MapReduce执行过程

6.3 MapReduce实例

6.4 温度排序实例

6.5 小结

第7章 Hadoop的集群资源管理系统——YARN

7.1 为什么要使用YARN

7.2 YARN的基本架构

7.3 YARN工作流程

7.4 YARN搭建

7.5 小结

第8章 Hadoop的数据仓库框架——Hive

8.1 Hive的理论基础

8.2 Hive的配置与安装

8.3 Hive表的操作

8.4 表的分区与分桶

8.5 内部表与外部表

8.6 内置函数与自定义函数

8.7 通过Java访问Hive

8.8 Hive优化

8.9 小结

第9章 大数据快速读写——HBase

9.1 关于NoSQL

9.2 HBase基础

9.3 HBase安装

9.4 HBase的Shell操作

9.5 Java API访问HBase实例

9.6 小结

第10章 海量日志采集工具——Flume

10.1 什么是Flume

10.2 Flume的特点

10.3 Flume架构

10.4 Flume的主要组件

10.5 Flume安装

10.6 Flume应用典型实例

10.7 通过exec命令实现数据收集

10.8 小结

第11章 Hadoop和关系型数据库间的数据传输工具——Sqoop

11.1 什么是Sqoop

11.2 Sqoop工作机制

11.3 Sqoop的安装与配置

11.4 Sqoop数据导入实例

11.5 Sqoop数据导出实例

11.6 小结

第12章 分布式消息队列——Kafka

12.1 什么是Kafka

12.2 Kafka的架构和主要组件

12.3 Kafka的下载与集群安装

12.4 Kafka应用实例

12.5 小结

第13章 开源的内存数据库——Redis

13.1 Redis简介

13.2 Redis安装与配置

13.3 客户端登录

13.4 Redis的数据类型

13.5 小结

第14章 Ambari和CDH

14.1 Ambari的安装与集群管理

14.2 CDH的安装与集群管理

14.3 小结

第15章 快速且通用的集群计算系统——Spark

15.1 Spark基础知识

15.2 弹性分布式数据集RDD

15.3 Spark作业运行机制

15.4 运行在YARN上的Spark

15.5 Spark集群安装

15.6 Spark实例详解

15.7 小结

第3篇 Hadoop项目案例实战

第16章 基于电商产品的大数据业务分析系统实战

16.1 项目背景、实现目标和项目需求

16.2 功能与流程

16.3 数据收集

16.4 数据预处理

16.5 数据分析——创建外部表

16.6 建立模型

16.7 数据可视化

16.8 小结

第17章 用户画像分析实战

17.1 项目背景

17.2 项目目标与项目开发过程

17.3 核心代码解读

17.4 项目部署

17.5 小结

第18章 基于个性化的视频推荐系统实战

18.1 项目背景

18.2 项目目标与推荐系统简介

18.3 推荐系统项目架构

18.4 推荐系统模型构建

18.5 核心代码

18.6 小结

第19章 电信离网用户挽留实战

19.1 商业理解

19.2 数据理解

19.3 数据整理

19.4 数据清洗

19.5 数据转换

19.6 建模

19.7 评估

19.8 部署

19.9 用户离网案例代码详解

19.10 小结

从零开始学Hadoop大数据分析(视频教学版)是2019年由机械工业出版社华章分社出版,作者温春水毕洁馨。

得书感谢您对《从零开始学Hadoop大数据分析(视频教学版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据:挖掘数据背后的真相 电子书
无须数学、统计学基础,轻松掌握大数据。
在线视频技术精要 电子书
音视频、开发、人工智能、编解码,帮你构建在线视频技术的全景图在线视频技术。
大数据与人工智能导论 电子书
人工智能参考书,大数据挖掘指导书。
统计与数据分析基础(微课版) 电子书
本书主要介绍了统计与数据分析的基本知识、数据采集的操作、数据采集后的清洗和加工操作、描述性统计分析、抽样估计分析、统计指数分析、相关与回归分析、时间序列分析、数据可视化展现,以及编制数据分析报告等内容。
从零开始:PhotoshopCC2019设计基础+商业设计实战 电子书
Adobe中国授权培训中心官方推荐教材。