100 条"大数据技术入门到商业实战:Hadoop Spark Flink全解析"搜索结果
Hadoop+Spark大数据技术 电子书
  • 曾国荪 曹洁 编著
  • 本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
  • 杨俊
  • 面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Flink入门与实战 电子书
  • 徐葳
  • 深入浅出展现Flink技术精髓,力求详细而完整地描述Flink大数据项目实战,从零开始快速掌握Flink的基本原理和核心功能。
大数据处理技术基础与应用(Hadoop+Spark) 电子书
  • 主编
  • 本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
Hadoop数据仓库实战 电子书
  • 肖睿 兰伟 廖春琼
  • 本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
HADOOP大数据开发实战 电子书
  • 杨力
  • Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
大数据技术原理与应用——从入门到实战 电子书
  • 主编
  • 本书全面系统地介绍了大数据的相关技术原理与应用方法。全书从理论知识入手,在介绍大数据相关理论知识的基础上,逐步深入地讲解大数据技术,将理论与实践完美结合。本书分为大数据基础篇、大数据存储篇、大数据采集篇、大数据计算篇和大数据应用篇。全书共15章,内容包括大数据概述、Linux集群搭建、分布式文件系统HDFS、HDFS的安装与基本应用、分布式数据库系统HBase、HBase的安装与基本应用、Sqoo
Spark海量数据处理:技术详解与平台实战 电子书
  • 范东来
  • 在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
图解Spark:大数据快速分析实战 电子书
  • 王磊
  • 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark3.0新特性。
大数据实时流处理技术实战——基于Flink+Kafka技术 电子书
  • 刘均 主编
  • 本书以项目实践作为主线,结合必需的理论知识,以任务的形式设计内容,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。本书主要内容涉及流式数据的基础知识、Flink的简介及发展历史、Flink的系统架构及FlinkAPI介绍、Flink的集群部署模式、Flink流式API的基本应用、Flink时间和窗口API的应用、Flink高级应用
数据科学商业实战 电子书
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
Hadoop大数据开发实战(慕课版) 电子书
  • 千锋教育高教产品研发部
  • 本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
大模型入门:技术原理与实战应用 电子书
  • 杨波
  • 人工智能是人类探索未来的重要领域之一,以ChatGPT为代表的大模型应用一经推出在短短几个月时间内火爆全球。大模型代表了自然语言处理领域的一项伟大成就,它的诞生和发展正引领着我们走向全新的创作时代。本书共9章,深入探讨了大模型的工作原理和使用方法——提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场
Hadoop海量数据处理:技术详解与项目实战(第2版) 电子书
  • 范东来
  • 本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。
Spark大数据技术与应用(微课版) 电子书
  • 主编
  • 本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Sp
TensorFlow技术解析与实战 电子书
  • 李嘉璇
  • TensorFlow是谷歌公司开发的深度学习框架,也是目前深度学习的主流框架之一。
Hadoop大数据开发基础 电子书
  • 张良均
  • 本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自