Hadoop大数据实战权威指南(第2版)

Hadoop大数据实战权威指南(第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

深入解析大数据概念、技术、方法;Hadoop生态组件平台搭建与应用;实际项目开发案例。

内容简介

基于”深入分析组件原理、充分展示搭建过程、详细指导应用开发”的理念,以最新版Hadoop及其生态组件为对象,采用理论与应用高度融合的方法,介绍大数据的概念、技术、方法、应用、以及项目开发。全书分为三篇,第一篇为大数据的基本概念和技术综述,第二篇为平台搭建与基本应用,内容设计Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇为数据处理与项目开发,综合运用各类组件进行实际数据处理,包括交互式应用、决策、推荐算法、销售数据分析系统等。

章节目录

封面

扉页

内容简介

版权页

第2版前言

第1版前言

目录

第一篇 大数据的基本概念和技术

第1章 绪论

1.1 大数据的时代背景

1.2 大数据的基本概念和特征

1.3 大数据系统的技术支撑体系

1.4 大数据领域的主要职位及其能力要求

1.5 本章小结

第2章 Hadoop大数据关键技术

2.1 Hadoop大数据应用生态系统

2.2 大数据采集技术

2.3 大数据存储技术

2.4 分布式计算框架

2.5 数据分析平台与工具

2.6 本章小结

第二篇 Hadoop大数据平台搭建与基本应用

第3章 Linux操作系统与集群搭建

3.1 Linux操作系统

3.2 Linux集群的搭建

3.3 集群的配置

3.4 Linux基本命令

3.5 本章小结

第4章 HDFS安装与基本应用

4.1 HDFS概述

4.2 HDFS架构分析

4.3 文件操作过程分析

4.4 Hadoop的安装与配置

4.5 Hadoop集群的启动

4.6 Hadoop集群的基本应用

4.7 本章小结

第5章 MapReduce与Yarn

5.1 MapReduce程序的概念

5.2 深入理解Yarn

5.3 在Linux平台安装Eclipse

5.4 开发MapReduce程序的基本方法

5.5 本章小结

第6章 Hive和HBase的安装与应用

6.1 在CentOS 7下安装MySQL

6.2 Hive安装与应用

6.3 ZooKeeper集群安装

6.4 HBase的安装与应用

6.5 本章小结

第7章 Sqoop和Kafka的安装与应用

7.1 安装部署Sqoop

7.2 安装部署Kafka集群

7.3 本章小结

第8章 Spark集群的安装与开发环境的配置

8.1 深入理解Spark

8.2 Scala的安装与配置

8.3 Spark集群的安装与配置

8.4 IDEA开发环境的安装与配置

8.5 本章小结

第9章 Spark应用基础

9.1 Spark应用程序的运行模式

9.2 Spark的应用设计

9.3 本章小结

第三篇 大数据处理与项目开发

第10章 交互式数据处理

10.1 数据预处理

10.2 创建数据仓库

10.3 数据分析

10.4 本章小结

第11章 协同过滤推荐系统

11.1 推荐算法概述

11.2 协同过滤推荐算法分析

11.3 Spark MLlib推荐算法应用

11.4 本章小结

第12章 销售数据分析系统

12.1 数据采集

12.2 在HBase集群上准备数据

12.3 安装Phoenix中间件

12.4 基于Web的前端开发

12.5 本章小结

参考文献

封底

Hadoop大数据实战权威指南(第2版)是2019年由电子工业出版社出版,作者黄东军。

得书感谢您对《Hadoop大数据实战权威指南(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
大数据Hadoop 3.X分布式处理实战 电子书
本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测) 电子书
本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
Android Gradle权威指南 电子书
  30万 读者的选择   一本关于AndroidGradle的权V指南   基于新的AndroidGradle   一本由浅入深讲解AndroidGradle开发的书   对Gradle基础、Groovy基础、Gradle插件、AndroidGradle构建、基于AndroidGradle的单元测试和持续集成等做循序渐进的讲解   在讲解的过程中融入作者在项目中遇到的问题、解决问题的思路以及方法。   通过本书,读者可以入门,并且深入了解Gradle以及AndroidGradle构建,并以此为基础,深入AndroidGradle相关知识点和使用技巧,让读者在工作中事半功倍。
Hadoop大数据平台集群部署与开发 电子书
Hadoop大数据平台集群部署与开发课程是云计算的一门专业平台课。本教材可为参与大数据开发与处理等相关流程的技术人员提供有益参考,为其介绍大数据处理技术Hadoop以及Hadoop家族体系的其他核心成员:Zookeeper、HBase、Hive、Flume、Sqoop等。本教材以分类任务的形式,具体介绍了“这些成员”的概念及实际应用,具有较强的综合性和实践性强,内容涉及广泛,讲解深入透彻。
大数据技术基础——基于Hadoop与Spark 电子书
将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。