本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,Spark SQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Spark Streaming实时计算框架,Spark MLlib 机器学习算法库,Redis数据库,综合案例—Spark电商实时数据处理。通过对本书的学习,读者可以充分理解常用数据预处理方法的精髓,掌握具体技术细节,并在实践中提升实际开发能力,为学习大数据技能打下扎实基础。
本书可以作为高等院校计算机、软件工程、数据科学与大数据技术等相关专业的教材,也可作为相关技术人员的参考书。
Spark大数据技术与应用(微课版)是2024年由人民邮电出版社出版,作者主编。
温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《Spark大数据技术与应用(微课版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。