Spark SQL入门与数据分析实践 电子书

Spark SQL入门与数据分析实践

内容简介

本书共8章内容,由浅入深地讲解Spark SQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。

章节目录

展开全部

Spark SQL入门与数据分析实践是2021年由人民邮电出版社出版,作者杨虹 谢显中 周前能 张安文编著。

温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《Spark SQL入门与数据分析实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
TensorFlow深度学习基础与应用 电子书
本书内容包括TensorFlow在Windows操作系统、Linux操作系统、macOS下的安装,TensorFlow静态图、动态图、损失函数、优化器等基础语法,k均值、k近邻、朴素贝叶斯、决策树、支持向量机、人工神经网络、线性回归、逻辑回归、决策树回归等机器学习算法,分类、检测、检索、光学字符识别等图像处理技术,中文分词、命名实体识别等自然语言处理技术,TensorFlow高阶应用等。
Python数据分析入门与实战 电子书
本书系统地描述了如何利用Python语言进行数据分析。由浅入深的编写方式可以帮助读者轻松愉快地进入数据的世界。全书从理论到实践、从基础语法到科学计算库,循序渐进地讲解了Python数据分析所需要学习的技能。搭配项目实战帮助读者更好、更快地掌握Python数据分析知识点。此外,还全面介绍了数据分析的必知必会技能。本书提供代码资源下载服务,每章均配有重要知识点串讲视频。本书不仅适合零基础喜欢数据分析的
基于机器学习的工作流活动推荐 电子书
随着云计算、大数据等的快速发展,越来越多的组织用信息化手段进行流程管理。如何提升流程执行的智能化程度、动态性和柔性,以提高对非标准业务的管理效率,是流程管理面临的一个重要问题。本书基于流程管理系统积累的日志,提出了3种流程管理的工作流活动推荐方法,分别为基于用户类别近邻的活动推荐方法、基于Pearson相关系数的活动推荐方法和基于协同过滤的活动推荐方法,并介绍了一种流程信息的可视化算法,实现了一个
MySQL数据库运维与管理(微课版) 电子书
随着企业数字化转型不断深化,企业对数据库工程师的需求越来越大。本书结合实际工作场景,将企业数据库运维的相关工作分为10个项目,内容包括了解数据库运维工作,安装和配置MySQL,管理MySQL权限与安全,分析MySQL日志,备份与恢复MySQL,监控、测试并优化MySQL性能,MySQL复制,搭建及运维MySQLCluster,结合Redis的MySQL运维,数据库自动化运维。本书配套教学PPT、题
Python程序设计——编程基础、Web开发及数据分析 电子书
《Python程序设计——编程基础、Web开发及数据分析》系统讲述了Python程序设计的基础知识。全书共15章,内容包括:Python概述、Python基本语法、Python的基本流程控制、Python的四种典型序列结构、Python函数、Python文件和数据库操作、面向对象程序设计、模块和包、字符串操作与正则表达式的使用、错误及异常处理、GUI编程、网络和多线程编程、基于Flask框架的We
Hadoop+Spark大数据技术 电子书
本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
SQL Server 2008中文版项目教程(第3版) 电子书
本书以创建一个“教学管理数据库”为例,循序渐进地讲解MicrosoftSQLServer2008管理和使用的基础知识,以及数据库定义语句和数据库查询语句的语法。本书采用项目式编写体例,将教学内容分解为10个前后有关联的项目,每个项目分解为若干简单的任务,每个任务又包含几个知识点,并且给出图文并茂的示例加以说明,充分考虑SQLServer数据库初学者的实际需要,保证初学者从基础开始,逐步掌握SQLS
基于Hadoop与Spark的大数据开发实战 电子书
大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数