100 条"Spark高级数据分析(第2版)"搜索结果
  • [美] 桑迪·里扎
  • 四位数据科学家携手打造,教你用Spark进行大规模数据分析。
图解Spark:大数据快速分析实战 电子书
  • 王磊
  • 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark3.0新特性。
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
Hadoop+Spark大数据技术 电子书
  • 曾国荪 曹洁 编著
  • 本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
Spark大数据技术与应用(第2版)(微课版) 电子书
  • 肖芳 张良均 主编
  • 本书共9章,内容包括:Spark概述、Scala基础、Spark编程基础、Spark编程进阶、SparkSQL——结构化数据文件处理、SparkStreaming——实时计算框架、SparkGraphX——图计算框架、SparkMLlib——功能强大的算法库,以及项目案例——广告检测的流量作弊识别。
Spark大数据编程实用教程 电子书
  • 文艾 等编著
  • 本书从实用角度出发,介绍了Scala+Spark开发的相关知识、方法和实战经验,包括大数据开发基础、Scala基本概念、Idea使用、Scala基础语法和api使用、Scala编程示例、Spark基本概念及运行机制、Spark快速学习路线图、Spark开发及运行环境构建、SparkRDD的概念及详细使用、Spark结构化数据处理(包括SparkSQL、SparkDataframe和SparkDat
Excel高级数据处理与分析(微课版) 电子书
  • 丁菊玲 主编
  • 本书由Excel数据处理与分析基础篇、基于Excel的数据分析综合应用篇、Excel数据分析报告篇这3篇共10章组成。其中,Excel数据处理与分析基础篇(第1章~第5章)从数据分析流程的视角介绍数据分析概述、数据获取与数据预处理、数据管理、数据处理与分析、数据可视化,并贯穿Excel基础内容,包括Excel基本数据表操作、数据管理、数据验证、图表、分类汇总、透视分析、数据处理函数、规划求解等;基
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
Spark大数据技术与应用(微课版) 电子书
  • 主编
  • 本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Sp
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Spark海量数据处理:技术详解与平台实战 电子书
  • 范东来
  • 在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
高级算法和数据结构 电子书
  • LA
  • 这是一本关于“高级/进阶”算法和数据结构的图书,主要介绍了用于Web应用程序、系统编程和数据处理领域的各种算法,旨在让读者了解如何用这些算法应对各种棘手的编码挑战,以及如何将其应用于具体问题,以应对新技术浪潮下的“棘手”问题。本书对一些广为人知的基本算法进行了扩展,还介绍了用于改善优先队列、有效缓存、对数据进行集群等的技术,以期读者能针对不同编程问题选出更好的解决方案。书中示例大多辅以图解,并以不
电能质量高级分析及应用 电子书
  • 李群
  • 本书编者结合多年的现成试验检测经验和科技研究成果,以电能质量数据高级分析和应用为主线,系统阐述了电能质量的检测、监测、数据处理、高级分析等的相关理论和应用技术。
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
  • 杨俊
  • 面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
Wireshark数据包分析实战(第3版) 电子书
  • Wireshark网络嗅探软件详解:2.0.5版IPv6及案例讲解。
大数据财务分析(第2版 微课版) 电子书
大数据处理技术基础与应用(Hadoop+Spark) 电子书
  • 主编
  • 本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
Spark大数据实时计算:基于Scala开发实战 电子书
  • 杨力
  • 通过实用技术和实战案例,让你轻松掌握大数据实时计算的方法。
Spark最佳实践 电子书
  • 林世飞
  • 腾讯专家首次分享Spark最新实践,基于真实数据,用案例分析全面解读大数据应用设计!
Spark编程基础 电子书
  • 林子雨
  • 系统、完整的数据科学与大数据技术专业解决方案。深入浅出,有效降低Spark技术学习门槛。
大数据财务分析 电子书
  • 张立军 主编
  • 本书旨在帮助读者提升大数据背景下的企业财务数据分析能力。