HADOOP大数据开发实战

HADOOP大数据开发实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。

内容简介

本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(HadoopDistributedFileSystem)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。

作者简介

作者杨力,原普开数据大数据架构师兼教学总监,新奥集团公司云数据平台项目首席架构师,京东万象大数据平台缔造人之一,二六三网络通信反垃圾邮件系统平台项目经理。 现任沈阳兄弟连教学总监。兄弟连是国内知名的教育培训机构,目前已在新三板上市。其出版的细说系列,市场反映良好。

章节目录

版权信息

内容提要

前言

第1章 大数据概论

1.1 大数据的学习基础

1.2 大数据的背景

1.3 对大数据的不同认识

1.4 大数据的行业案例

1.5 大数据的基本概念

1.6 大数据技术生态圈

本章总结

本章习题

第2章 搭建Hadoop分布式集群

2.1 云平台

2.2 安装CentOS 6

2.3 Linux系统配置

2.4 Hadoop的配置部署

本章总结

本章习题

第3章 HDFS入门

3.1 Hadoop分布式文件系统HDFS

3.2 HDFS核心设计

3.3 HDFS体系结构

本章总结

本章习题

第4章 HDFS接口

4.1 HDFS命令行接口

4.2 HDFS Java接口

本章总结

本章习题

第5章 HDFS的运行机制

5.1 HDFS中数据流的读写

5.2 HA机制

5.3 Federation机制

本章总结

本章习题

第6章 Hadoop I/O流操作

6.1 数据完整性

6.2 压缩

6.3 序列化

6.4 基于文件的数据结构SequenceFile

本章总结

本章习题

第7章 初识MapReduce编程模型

7.1 MapReduce编程框架

7.2 WordCount编程实例

7.3 Hadoop MapReduce架构

本章总结

本章习题

第8章 MapReduce应用编程开发

8.1 MapReduce编程开发

8.2 MapReduce在集群上的运作

8.3 MapReduce的类型与格式

本章总结

本章习题

第9章 MapReduce编程案例

9.1 数据去重

9.2 数据排序

9.3 平均成绩

9.4 多表关联

9.5 二次排序

本章总结

本章习题

第10章 MapReduce运行机制与YARN平台

10.1 剖析MapReduce作业运行机制

10.2 Shuffle和排序

10.3 任务的执行

10.4 作业的调度

10.5 YARN平台简介

10.6 YARN平台架构

本章总结

本章习题

第11章 汽车销售数据统计分析项目

11.1 数据概况

11.2 项目实战

本章总结

本章习题

HADOOP大数据开发实战是2019年由人民邮电出版社出版,作者杨力。

得书感谢您对《HADOOP大数据开发实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
图数据库实战 电子书
图数据库入门教程书籍,采用Gremlin语言,完整展示图应用程序的构建过程,从入门到实践学习图数据库。
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
MySQL数据库基础与实践 电子书
本书从实用的角度出发,全面讲解MySQL数据库技术。
大数据技术原理与应用(第3版) 电子书
本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。
Elasticsearch数据搜索与分析实战 电子书
深入描述了Elasticsearch的各种运行机制。