Spark快速大数据分析(第2版) 电子书

Spark快速大数据分析(第2版)

编辑推荐

涵盖Spark 3.0的新特性,着重展示如何利用机器学习算法执行大数据分析。

内容简介

本书的主角是在大数据时代应运而生的数据处理与分析利器——Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。

章节目录

展开全部

Spark快速大数据分析(第2版)是2021年由人民邮电出版社出版,作者[美] 朱尔斯·S.达米吉。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《Spark快速大数据分析(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Spark快速大数据分析 电子书

本书从零开始讲解Spark。
大数据分析与挖掘 电子书

数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
Spark海量数据处理:技术详解与平台实战 电子书

在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,...
精通特征工程 电子书

掌握特征工程基本原则和应用,增强机器学习算法效果。
Spark编程基础(Scala版) 电子书

本书是厦门大学作者团队长期经验总结的结晶,是在厦门大学《大数据技术原理与应用》入门级大数据教材的基础之上编写的。为了确保教程质量,在编著出版纸质教材之前,实验室已经于2016年...
SQL优化核心思想 电子书

10章深入SQL优化,涵盖基础知识、统计信息、访问路径、连接方式、优化技巧等。