PySpark大数据分析与应用 电子书

PySpark大数据分析与应用

9.9开通会员

内容简介

本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的 相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark 大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、 基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析 中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款 风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部 分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。

本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。

章节目录

展开全部

PySpark大数据分析与应用是2024年由人民邮电出版社出版,作者戴刚。

温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《PySpark大数据分析与应用》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
基于机器学习的工作流活动推荐 电子书
随着云计算、大数据等的快速发展,越来越多的组织用信息化手段进行流程管理。如何提升流程执行的智能化程度、动态性和柔性,以提高对非标准业务的管理效率,是流程管理面临的一个重要问题。本书基于流程管理系统积累的日志,提出了3种流程管理的工作流活动推荐方法,分别为基于用户类别近邻的活动推荐方法、基于Pearson相关系数的活动推荐方法和基于协同过滤的活动推荐方法,并介绍了一种流程信息的可视化算法,实现了一个
MySQL数据库运维与管理(微课版) 电子书
随着企业数字化转型不断深化,企业对数据库工程师的需求越来越大。本书结合实际工作场景,将企业数据库运维的相关工作分为10个项目,内容包括了解数据库运维工作,安装和配置MySQL,管理MySQL权限与安全,分析MySQL日志,备份与恢复MySQL,监控、测试并优化MySQL性能,MySQL复制,搭建及运维MySQLCluster,结合Redis的MySQL运维,数据库自动化运维。本书配套教学PPT、题
Python程序设计——编程基础、Web开发及数据分析 电子书
《Python程序设计——编程基础、Web开发及数据分析》系统讲述了Python程序设计的基础知识。全书共15章,内容包括:Python概述、Python基本语法、Python的基本流程控制、Python的四种典型序列结构、Python函数、Python文件和数据库操作、面向对象程序设计、模块和包、字符串操作与正则表达式的使用、错误及异常处理、GUI编程、网络和多线程编程、基于Flask框架的We
铁路文本大数据分析挖掘研究及应用 电子书
本书阐述了铁路文本大数据分析挖掘的理论、技术及应用,内容包括:绪论、文本大数据分析挖掘基础、文本大数据分析挖掘理论体系、常用分析与挖掘工具包、铁路文本大数据分析挖掘平台研究、铁路安全文本大数据应用案例、铁路应急管理文本大数据应用案例。
大数据技术与应用 电子书
本书教学设计遵循教学规律,对真实项目进行了科学拆分与提炼。主要内容分为Hadoop大数据技术基础与Hadoop大数据分析案例两部分,前者包括大数据的有关概念、Hadoop概述、Hadoop集群的部署与管理、HDFS、MapReduce编程以及Hadoop生态的其他常用组件ZooKeeper、HBase、Hive、Sqoop、Flume、Storm、Kafka的工作原理、安装部署和使用方法,后者通过
对照Excel,零基础学Python数据分析 电子书
本书主要介绍如何使用Python处理Excel数据。本书内容分为三大部分:第一部分主要介绍数据分析的概念和Python基础;第二部分通过蜂蜜电商数据分析案例详细介绍数据分析的技术要点,包括读写Excel文件所需的xlwings库和openpyxl库、数据分析的pandas核心库,以及数据可视化常用的Matplotlib库和Seaborn库;第三部分包括个人消费贷款数据分析和螺蛳粉连锁店销售数据分析
Python基础与大数据应用 电子书
本书分为11章,前6章讲解了Python基本语法和基本应用,后5章系统地讲解了用Python爬取数据、处理数据、分析数据的方法与过程。每章除了丰富的实例外,还设计了来源于实践的项目训练及拓展训练项目。
大数据技术与应用基础 电子书
本书在介绍大数据发展背景、特点及主要技术层面的基础上,对大数据的数据采集、数据存储、常见计算模式和典型系统工具进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算及典型工具(HBase、Hive)、批处理计算及典型工具(MapReduce、Spark)、流式计算及典型工具(Storm、Apex、Flink)、事件流及典型工具(Druid)等。本书提供了大量的实例和源代码供读