本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Sp
本书共9章,内容包括:Spark概述、Scala基础、Spark编程基础、Spark编程进阶、Spark SQL——结构化数据文件处理、Spark Streaming——实时计算框架、Spark GraphX——图计算框架、Spark MLlib——功能强大的算法库,以及项目案例——广告检测的流量作弊识别。
Spark大数据技术与应用(第2版)(微课版)是2022年由人民邮电出版社出版,作者肖芳 张良均 主编。
温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《Spark大数据技术与应用(第2版)(微课版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。