100 条"Spark快速大数据分析"搜索结果
Spark快速大数据分析 电子书
图解Spark:大数据快速分析实战 电子书
  • 王磊
  • 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark3.0新特性。
Hadoop+Spark大数据技术 电子书
  • 曾国荪 曹洁 编著
  • 本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
Spark大数据编程实用教程 电子书
  • 文艾 等编著
  • 本书从实用角度出发,介绍了Scala+Spark开发的相关知识、方法和实战经验,包括大数据开发基础、Scala基本概念、Idea使用、Scala基础语法和api使用、Scala编程示例、Spark基本概念及运行机制、Spark快速学习路线图、Spark开发及运行环境构建、SparkRDD的概念及详细使用、Spark结构化数据处理(包括SparkSQL、SparkDataframe和SparkDat
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
财务大数据分析 电子书
  • 主编
  • 本书选取某新零售行业的公司为原型,通过整合来自企业经营的大数据和来自互联网的大数据,结合大量丰富的企业管理与业务案例场景,从大数据采集、处理、挖掘、可视化分析,到决策与优化改善,逐步展开,帮助读者了解大数据的技术基础(Python、SQL),掌握大数据采集、处理的方法,具备应用典型的大数据算法进行价值挖掘的能力,具备结合企业经营管理场景进行大数据可视化分析、决策的能力。本书共分为三个部分:第一部分
财务大数据分析 电子书
  • 王浩
  • 本教材以理论与实际操作相结合,以厦门科云智慧云平台为依托,以大数据分析通用流程为基础,聚焦于财务大数据分析与可视化工具方法。本书涵盖了Python 基础、数据获取(爬虫)、数据处理(Pandas) 、数据可视化以及财务大数据分析实战演练五个模块。在内容设计中穿插了基于财务实践的编程案例,通过将Python数据分析工具与具体的财务场景相融合,培养学生应用Python进行财务大数据分析的能力。本教材贴
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
  • 杨俊
  • 面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Spark大数据技术与应用(微课版) 电子书
  • 主编
  • 本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Sp
大数据分析与挖掘 电子书
  • 石胜飞
  • 数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
大数据分析可视化 电子书
  • 李宗伟 主编
  • 本书从大数据可视化的基本概念入手,介绍大数据的采集及预处理、大数据可视化的主要工具及使用相关工具进行可视化分析等方面的内容。《大数据分析可视化》共8章。第1章-第3章主要介绍大数据可视化的基本概念、相关工具和大数据采集及预处理,第4章-第6章主要介绍基本图形制作、极坐标系和平行坐标系下各类图形制作及基本三维图形与地图制作,第7章-第8章主要介绍机器学习可视化图形制作及进阶图形制作。
PySpark大数据分析与应用 电子书
  • 戴刚
  • 本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
Spark大数据技术与应用(第2版)(微课版) 电子书
  • 肖芳 张良均 主编
  • 本书共9章,内容包括:Spark概述、Scala基础、Spark编程基础、Spark编程进阶、SparkSQL——结构化数据文件处理、SparkStreaming——实时计算框架、SparkGraphX——图计算框架、SparkMLlib——功能强大的算法库,以及项目案例——广告检测的流量作弊识别。
大数据处理技术基础与应用(Hadoop+Spark) 电子书
  • 主编
  • 本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
Spark大数据实时计算:基于Scala开发实战 电子书
  • 杨力
  • 通过实用技术和实战案例,让你轻松掌握大数据实时计算的方法。
大数据分析处理(慕课版) 电子书
  • 郭永洪 主编
  • 统地阐述大数据分析处理工作流程中的重要步骤。
Python经济管理大数据分析 电子书
  • 吴庆源
  • 本书的目的是对经济管理大数据进行Python分析。本书的特征是直接针对经济管理数据库中提取的粗数据,一步步进行数据的清洗和Python分析,更加适合于初学者和现实应用。本书的目标读者主要是经济管理类型专业以及业界经管类工作人员。本书的主要经济管理知识涉及宏观经济、企业财务、企业管理等方面,针对现实运用中对企业经营管理经常需要涉及的分析报告需求,设置Python单比率时间序列分析、多指标比率分析以及
财务大数据分析与可视化 电子书
  • 李静
  • 本教程选用微软PowerBI为数据分析工具,将10个项目划分为应用入门、进阶提升和财务综合应用三个循序渐进的学习阶段。应用入门包括财务大数据与可视化分析认知、PowerBI初体验、数据获取与整理、数据建模和数据可视化5个项目;进阶提升包括PowerBI动态交互、数据可视化分析实例和爬虫案例分析3个项目;财务综合应用包括财务数据可视化智能分析和应收账款数据可视化分析2个综合案例。本书结构合理、案例丰
病案首页大数据分析与应用 电子书
  • 肖兴政
  • 本书主要包含四个部分,包括对病案首页内涵与标准、病案首页数据汇集与质量管理、病案首页数据分析与应用以及病案数据分析应用展望。其中病案首页数据分析与应用部分是本书的特色部分,区别于一般基于服务能力/效率、质量安全以及患者入/离院方式的分析思路,本书在大数据分析基础上,从患者人员流动、医疗资源监测与规划以及医疗共同体几个方面利用病案首页数据提出新的分析思路,以推进对病案首页数据的进一步价值挖掘,更好的