大数据Hadoop 3.X分布式处理实战

大数据Hadoop 3.X分布式处理实战

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。

大数据Hadoop 3.X分布式处理实战是2019年由人民邮电出版社出版,作者吴章勇 杨强。

得书感谢您对《大数据Hadoop 3.X分布式处理实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
基于Hadoop与Spark的大数据开发实战 电子书
大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Hadoop大数据处理与分析教程(慕课版) 电子书
本书系统全面地介绍了有关Hadoop的各类知识。全书共分11章,内容包括绪论、Linux操作系统的安装、Hadoop的伪分布式安装、Hadoop集群的搭建及配置、HadoopHDFS命令、MapReduce编程入门、Hive、Sqoop、HBase、Spark的介绍与安装、综合案例——网络爬虫大数据分析。
大数据处理技术基础与应用(Hadoop+Spark) 电子书
本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
Hadoop大数据开发基础 电子书
本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自
Hadoop3实战指南 电子书
基于全新的Hadoop 3.x,主要分析Hadoop 3.2.0的新特性和新功能,以企业级真实案例详细解读,带你全方位掌握大数据处理分析、分布式计算等。