PySpark大数据分析与应用

PySpark大数据分析与应用

立即阅读
手机扫码
  • 微信扫一扫

    关注微信公众号

内容简介

本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark 大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、 基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析 中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款 风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部 分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。

本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。

PySpark大数据分析与应用是2024年由人民邮电出版社出版,作者戴刚。

得书感谢您对《PySpark大数据分析与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
云计算与大数据技术应用 电子书
本书共11章,主要内容包括云计算与大数据概述、相关技术、虚拟化技术、集群系统基础、MPI、Hadoop、Spark、Storm、数据中心技术和云计算大数据仿真技术、云计算数据存储技术。本书内容丰富,每章节的流程设计合理,在内容上的详尽程度也合情合理,同时将实验内容融合在课程之中,使理论紧密联系实际,内容系统讲解,循序渐进,螺旋迭代,深入浅出;采用项目任务式;用实战教学,注重入门并提高,边做边学。本
大数据导论 思维、技术与应用 电子书
本书以基本概念与实例相结合的方法,由浅入深、顺序渐进的对大数据思维、技术和应用做了全面系统的介绍。全书共12章,分为大数据基础篇、大数据存储篇、大数据处理篇、大数据挖掘篇和大数据应用篇。每个知识节点都配有与理论学习内容相结合的案例介绍和代码实例,并在每章后面都配有丰富的作业。
Python大数据分析与挖掘实战(微课版) 电子书
本书以应用为导向,将理论与实践相结合,深入浅出地介绍了利用Python进行大数据分析与挖掘的基本知识,以及如何将其应用到具体领域的方法。本书分3篇:基础篇、案例篇和提高篇。基础篇(第1章-第6章)主要介绍Python基础知识及应用于科学计算、数据处理、数据可视化、机器学习、深度学习等方面的基础知识;案例篇(第7章-第11章)主要介绍利用Python进行金融、地理信息、交通、文本分析、图像识别等领域
大数据技术与应用基础项目教程 电子书
全书共十个项目,除了项目一介绍大数据基础理论外,其余项目均以实战为主线,内容循序渐进,逐步深入,围绕大数据技术的应用层层展开。内容主要包括大数据的基本概念、Ubuntu及服务安装配置、Hadoop集群部署、MapReduce编程、HBase数据库部署与应用、Hive数据仓库安装与应用、Pig数据分析、Sqoop数据迁移、Spark部署及数据分析等知识,最后以大数据技术的具体应用介绍了MapRedu
Python大数据应用基础 电子书
本书内容由浅入深,实例指导性强,通过大量的实例讲述Python程序设计基础,同时结合Python语言的特性,讲解各类基于Python的大数据应用实例。本书全部例题代码适用于Python3.6及更高版本。全书共13章,主要内容包括大数据及Python概述,Python基础知识、程序流程控制结构、常用组合数据类型、函数与模块、面向对象程序设计、文件相关操作、数据预处理和数据分析、使用NumPy进行处理