Spark快速大数据分析 电子书

Spark快速大数据分析

手机扫码阅读
  • 微信扫一扫

    关注微信公众号

编辑推荐

本书从零开始讲解 Spark。

内容简介

本书由 Spark ***及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

章节目录

展开全部

Spark快速大数据分析是2015年由人民邮电出版社出版,作者[美]HoldenKarau。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《Spark快速大数据分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
大数据分析与挖掘 电子书

数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
Spark海量数据处理:技术详解与平台实战 电子书

在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架Apache Spark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。 本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
Spark编程基础(Scala版) 电子书

本书是厦门大学作者团队长期经验总结的结晶,是在厦门大学《大数据技术原理与应用》入门级大数据教材的基础之上编写的。为了确保教程质量,在编著出版纸质教材之前,实验室已经于2016年10月通过实验室官网免费发布共享了简化版的Spark在线教程和相关教学资源,同时,该在线教程也已经用于厦门大学计算机科学系研究生的大数据课程教学,并成为全国高校大数据课程教师培训交流班的授课内容。实验室根据读者对在线Spark教程的大量反馈意见以及教学实践中发现的问题,对Spark在线教程进行了多次修正和完善,所有这些前期准备工作,都为纸质教材的编著出版打下了坚实的基础。 披荆斩棘,在大数据丛林中开辟学习捷径 填沟削坎,为快速学习Spark 技术铺平道路 深入浅出,有效降低Spark 技术学习门槛 资源全面,构建全方位一站式在线服务体系
大数据技术原理与应用(第2版) 电子书

国内高校大数据课程知名教师倾心之作,带你“零基础”学习大数据。
R语言入门与实践 电子书

本书适合立志成为数据科学家的R语言初学者阅读。
ODPS权威指南——阿里大数据平台应用开发实践 电子书

  2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录!   交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。   成功创下这项纪录背后,有ODPS很大的功劳!   阿里巴巴集团副总裁刘振飞表示,云计算在今年双11 起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS 完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。   ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场   本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。   本书包括以下重要内容:   ODPS概览及其基本知识;   如何高效地使用ODPS SQL;   MapReduce编程和进阶应用;   ODPS机器学习算法;   ODPS权限、资源和数据管理;   深入了解ODPS体系结构和高级机制。   书中所有示例代码都可以通过https://github.com/duckrun/odps_book免费下载。