100 条"Hadoop Spark大数据分析实战"搜索结果
  • 迟殿委 编著
  • 本书全面讲解Hadoop生态圈各组件的核心知识、操作和分析技术,系统介绍Spark框架搭建、操作和典型的机器学习分析技术。
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Hadoop+Spark大数据技术 电子书
  • 曾国荪 曹洁 编著
  • 本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
  • 杨俊
  • 面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
HADOOP大数据开发实战 电子书
  • 杨力
  • Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
大数据处理技术基础与应用(Hadoop+Spark) 电子书
  • 主编
  • 本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
图解Spark:大数据快速分析实战 电子书
  • 王磊
  • 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark3.0新特性。
Hadoop大数据开发实战(慕课版) 电子书
  • 千锋教育高教产品研发部
  • 本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
Hadoop大数据开发基础 电子书
  • 张良均
  • 本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自
Spark大数据实时计算:基于Scala开发实战 电子书
  • 杨力
  • 通过实用技术和实战案例,让你轻松掌握大数据实时计算的方法。
大数据Hadoop 3.X分布式处理实战 电子书
  • 吴章勇 杨强
  • 本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
Spark大数据编程实用教程 电子书
  • 文艾 等编著
  • 本书从实用角度出发,介绍了Scala+Spark开发的相关知识、方法和实战经验,包括大数据开发基础、Scala基本概念、Idea使用、Scala基础语法和api使用、Scala编程示例、Spark基本概念及运行机制、Spark快速学习路线图、Spark开发及运行环境构建、SparkRDD的概念及详细使用、Spark结构化数据处理(包括SparkSQL、SparkDataframe和SparkDat
Hadoop3实战指南 电子书
  • 孙志伟
  • 基于全新的Hadoop3.x,主要分析Hadoop3.2.0的新特性和新功能,以企业级真实案例详细解读,带你全方位掌握大数据处理分析、分布式计算等。
Hadoop数据仓库实战 电子书
  • 肖睿 兰伟 廖春琼
  • 本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
Hadoop大数据开发案例教程与项目实战(在线实验+在线自测) 电子书
  • 西普教育研究院 时允田 林雪纲
  • 本书是一本Hadoop学习入门参考书,全书共11章,分为基础篇和提高篇两部分。基础篇包括第1~6章,具体包括Hadoop概述、Hadoop基础环境配置、分布式存储HDFS、计算系统MapReduce、计算模型Yarn、数据云盘。提高篇包括第7~11章,具体包括协调系统Zookeeper、Hadoop数据库Hbase、Hadoop数据仓库Hive、Hadoop数据采集Flume、OTA离线数据分析平
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
财务大数据分析 电子书
  • 主编
  • 本书选取某新零售行业的公司为原型,通过整合来自企业经营的大数据和来自互联网的大数据,结合大量丰富的企业管理与业务案例场景,从大数据采集、处理、挖掘、可视化分析,到决策与优化改善,逐步展开,帮助读者了解大数据的技术基础(Python、SQL),掌握大数据采集、处理的方法,具备应用典型的大数据算法进行价值挖掘的能力,具备结合企业经营管理场景进行大数据可视化分析、决策的能力。本书共分为三个部分:第一部分
财务大数据分析 电子书
  • 王浩
  • 本教材以理论与实际操作相结合,以厦门科云智慧云平台为依托,以大数据分析通用流程为基础,聚焦于财务大数据分析与可视化工具方法。本书涵盖了Python 基础、数据获取(爬虫)、数据处理(Pandas) 、数据可视化以及财务大数据分析实战演练五个模块。在内容设计中穿插了基于财务实践的编程案例,通过将Python数据分析工具与具体的财务场景相融合,培养学生应用Python进行财务大数据分析的能力。本教材贴
Python大数据分析与挖掘实战(微课版) 电子书
  • 黄恒秋 莫洁安 谢东津 张良均 苏颖
  • 本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域
Spark分布式处理实战 电子书
  • 刘均
  • 本书以项目实践作为主线,结合必需的理论知识,以任务的形式进行内容设计,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及Spark基本原理、基于IDEA搭建Spark开发环境、RDD基本原理、SparkSQL基本操作流程、电商业务系统的基本流程、电商用户行为分析的基本指标以及分析过程、通过不同的维度对销售数据进行分析