100 条"Spark数据分析:基于Python语言"搜索结果
数据科学导论——基于Python语言(微课版) 电子书
  • 朝乐门
  • 本书共7章,主要介绍数据科学的基础理论、统计学与模型、机器学习与算法、数据可视化、数据加工、大数据技术、数据产品开发及数据科学中的人文与管理等内容。
图解Spark:大数据快速分析实战 电子书
  • 王磊
  • 基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark3.0新特性。
Python数据分析 电子书
  • 吴道君,朱家荣
  • 本书全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。  本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。  本书内容充实、结构合理、实用性强,具有明确的应用能力培养目标,易于接受和理解,学完本书后,可以具备数据分析的基本能力。  本书适合
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
Spark SQL入门与数据分析实践 电子书
  • 杨虹 谢显中 周前能 张安文编著
  • 本书共8章内容,由浅入深地讲解SparkSQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Python商业数据分析 电子书
  • 编著
  • 全书共12章,主要内容包括:商业数据分析概论、Python商业数据存取、Python商业数据图形绘制与可视化、Python描述性统计、Python参数估计、Python参数假设检验、Python相关分析、Python一元线性回归分析、Python多元线性回归分析、Python时间序列分析、Python量化金融数据分析、Python机器学习。
数据结构:Python语言描述 电子书
  • 张光河
  • 基于Python语言的数据结构基础编程语法详解,国外高等院校信息科学与技术教材。
数据结构:Python语言描述 电子书
  • 吕云翔 郭颖美 孟爻 等编著
  • 《数据结构:Python语言描述》选择Python作为描述语言,在选材与编排上,贴近当前普通高等院校“数据结构”课程的现状和发展趋势,内容难度适中,突出实用性和应用性。在内容选取与结构上,《数据结构:Python语言描述》并未对各种数据结构面面俱到,而是通过分类和讲解典型结构,使读者形成对数据结构的宏观认识。《数据结构:Python语言描述》共8章,分别为绪论、线性表、栈和队列、串和数组、树形结构
Spark编程基础(Python版) 电子书
  • 林子雨
  • 本书以Python作为开发Spark应用程序的编程语言,介绍了Spark编程的基础知识。全书共8章,内容包括大数据技术概述、Spak的设计与运行原理、Spark环境搭建和使用方法、RDD编程、SparkSOL、SparkStreaming、StructuredStreaming和SparkMLlib等。
Python数据分析与应用 电子书
  • 张良均
  • 本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开介绍相关的理论知识点,推导生成可行的解决方案,后落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施。通过从任务需求到实现这一完整工作流程的体验,帮助读者真正理解与消化Python数据分析与应用。书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。
Python医学数据分析入门 电子书
  • 刘文婷
  • 数据分析是当今大数据时代最关键的技术,其广泛应用于包括医学在内的各个领域。
Python数据分析(项目式) 电子书
  • 主编
  • 本书紧跟数据分析的最新发展趋势,基于Python的数据分析平台和工具,介绍数据分析的相关知识与技能。本书共7个项目,分为3部分:基础部分、数据分析部分、机器学习实战部分。基础部分包括项目一和项目二,介绍数据分析环境的搭建,以及NumPy的理论和实践知识;数据分析部分包括项目三~项目六,结合案例介绍数据检查、数据呈现、数据多维化等,涵盖真实数据分析工作的完整流程;机器学习实战部分只包括项目七,利用一
Python财务数据分析 电子书
  • 主编
  • 随着大数据、人工智能等技术的创新迭代速度加快,经济社会数字化转型全面开启,本书旨在培养会计审计人员的数字化、信息化能力,助推会计审计工作运用新技术、融入新时代、实现新突破。本书围绕Python财务数据分析展开编写,整体分为基础篇、应用篇两部分。基础篇包括第1章~第4章内容,系统阐述了Python环境配置、语法基础、财务数据采集与分析、财务数据可视化等基础知识;应用篇包括第5章~第7章内容,本部分结
Python数据分析与挖掘 电子书
  • 杨玲
  • 本书面向大数据应用型人才,以任务为导向,系统地介绍Python数据分析与挖掘的常用技术与真实案例。全书共7章,第1、2章介绍Python数据分析的常用模块及其应用,涵盖NumPy数值计算模块、pandas数据分析模块,较为系统地阐述Python数据分析的方法;第3、4章介绍轻量级的数据交换格式JSON和连接MySQL数据库的pymysql模块,并以此进行数据综合案例的分析;第5章介绍Matplot
大数据数学基础(Python语言描述) 电子书
  • 雷俊丽 张良均
  • 本书全面地讲解了在科学领域广泛运用的微积分、概率论与数理统计、线性代数、数值计算、多元统计分析等数学基础知识。全书共6章:第1章介绍了大数据与数学、数学与Python的关系;第2章介绍了微积分的基础知识,包括极限、导数、微分、不定积分与定积分等;第3章介绍了概率论与数理统计的基础知识,包括数据分布特征、概率与概率分布、参数估计、假设检验等;第4章介绍了线性代数的基础知识,包括行列式、矩阵的运算和特
Spark大数据实时计算:基于Scala开发实战 电子书
  • 杨力
  • 通过实用技术和实战案例,让你轻松掌握大数据实时计算的方法。
数据挖掘——基于R语言的实战 电子书
  • 张俊妮
  • 本书以深入浅出的语言系统地讲解了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与R语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较。本书使用基于R语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用R语言进行数据挖掘。
数据可视化——基于R语言 电子书
  • 贾俊平
  • 本书以R语言为实现工具,以数据可视化分析为导向,结合实际案例介绍数据可视化方法。全书共8章,第1章介绍数据可视化概述以及R语言数据处理的基本技能;第2章介绍R语言绘图基础,重点介绍R语言传统绘图包graphics中的绘图函数及基本使用方法;第3章介绍类别数据的可视化方法;第4章介绍数据分布特征的可视化方法;第5章介绍变量间关系的可视化方法;第6章介绍样本相似性的可视化方法;第7章介绍时间序列的可视
文本数据挖掘——基于R语言 电子书
  • 黄天元
  • 文本是一种特殊的非结构化数据,在当今的大数据时代,其价值日趋凸显。本书利用开源而强大的R软件,对文本数据挖掘的概念、技术及技巧进行了系统的介绍。本书共11章,内容包括:走进文本数据挖掘,R语言快速入门,字符串的基本处理,用好正则表达式,导入各类文本数据,对各类文本数据进行预处理,文本特征提取的4种方法,基于机器学习的文本分类方法,文本情感分析,文本可视化,文本数据挖掘项目实践。本书还提供了丰富的应