100 条"Hadoop Spark大数据分析实战"搜索结果
  • 迟殿委 编著
  • 本书全面讲解Hadoop生态圈各组件的核心知识、操作和分析技术,系统介绍Spark框架搭建、操作和典型的机器学习分析技术。
Hadoop大数据平台集群部署与开发 电子书
  • 罗文浪、邱波、郭炳宇、姜善永
  • Hadoop大数据平台集群部署与开发课程是云计算的一门专业平台课。本教材可为参与大数据开发与处理等相关流程的技术人员提供有益参考,为其介绍大数据处理技术Hadoop以及Hadoop家族体系的其他核心成员:Zookeeper、HBase、Hive、Flume、Sqoop等。本教材以分类任务的形式,具体介绍了“这些成员”的概念及实际应用,具有较强的综合性和实践性强,内容涉及广泛,讲解深入透彻。
Spark大数据技术与应用(微课版) 电子书
  • 主编
  • 本书以初学者的角度详细介绍Spark架构的核心技术,主要围绕Spark的架构、Spark的开发语言、Spark模块的主要功能展开;以IDEA为主要开发工具,CentOS为运行环境,采用“理实一体化”授课模式。本书内容包括Spark导论,Spark环境搭建与使用,Scala语言,Spark弹性分布式数据集,SparkSQL、DataFrame和DataSet,Kafka分布式发布-订阅消息系统,Sp
大数据分析与挖掘 电子书
  • 石胜飞
  • 数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
Hadoop大数据开发基础(第2版)(微课版) 电子书
  • 张军
  • 本书以任务为导向,较为系统地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。全书共8章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce入门编程、MapReduce进阶编程、Hive数据仓库、HBase分布式数据库,以及一个项目案例(电影网站用户影评分析)。本书的第2~7章包含实训与课后习题,读者可通过练习和操作实践,巩
大数据分析可视化 电子书
  • 李宗伟 主编
  • 本书从大数据可视化的基本概念入手,介绍大数据的采集及预处理、大数据可视化的主要工具及使用相关工具进行可视化分析等方面的内容。《大数据分析可视化》共8章。第1章-第3章主要介绍大数据可视化的基本概念、相关工具和大数据采集及预处理,第4章-第6章主要介绍基本图形制作、极坐标系和平行坐标系下各类图形制作及基本三维图形与地图制作,第7章-第8章主要介绍机器学习可视化图形制作及进阶图形制作。
PySpark大数据分析与应用 电子书
  • 戴刚
  • 本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
Spark大数据技术与应用(第2版)(微课版) 电子书
  • 肖芳 张良均 主编
  • 本书共9章,内容包括:Spark概述、Scala基础、Spark编程基础、Spark编程进阶、SparkSQL——结构化数据文件处理、SparkStreaming——实时计算框架、SparkGraphX——图计算框架、SparkMLlib——功能强大的算法库,以及项目案例——广告检测的流量作弊识别。
Hadoop大数据处理与分析教程(慕课版) 电子书
  • 王秀友 丁小娜 刘运 主编
  • 本书系统全面地介绍了有关Hadoop的各类知识。全书共分11章,内容包括绪论、Linux操作系统的安装、Hadoop的伪分布式安装、Hadoop集群的搭建及配置、HadoopHDFS命令、MapReduce编程入门、Hive、Sqoop、HBase、Spark的介绍与安装、综合案例——网络爬虫大数据分析。
大数据分析处理(慕课版) 电子书
  • 郭永洪 主编
  • 统地阐述大数据分析处理工作流程中的重要步骤。
Python经济管理大数据分析 电子书
  • 吴庆源
  • 本书的目的是对经济管理大数据进行Python分析。本书的特征是直接针对经济管理数据库中提取的粗数据,一步步进行数据的清洗和Python分析,更加适合于初学者和现实应用。本书的目标读者主要是经济管理类型专业以及业界经管类工作人员。本书的主要经济管理知识涉及宏观经济、企业财务、企业管理等方面,针对现实运用中对企业经营管理经常需要涉及的分析报告需求,设置Python单比率时间序列分析、多指标比率分析以及
Hadoop应用开发与案例实战(慕课版) 电子书
  • 王建
  • Hadoop是目前比较流行的大数据框架之一,可使用简单的高级编程模型实现大型数据集的分布式存储和处理。本书以Hadoop的概念、集群搭建、核心组件、实战案例等为主线,较为全面地介绍了Hadoop大数据存储及处理技术的相关知识。全书共10章,前9章主要讲解Hadoop基础,内容包括初识Hadoop、Hadoop的安装与配置、高可用与联邦、分布式文件系统HDFS、集群资源管理系统YARN、分布式计算框
大数据开发项目实战 电子书
  • 祝锡永,张良均 主编
  • 本书以项目案例为导向,贯穿讲解一个大数据的实战项目:广电大数据用户画像。全书共8章,具体内容包括大数据项目概述、Hadoop生态组件基础、广电大数据用户画像——需求分析、广电大数据用户画像——数据采集与预处理等。
数权法1.0:数权的理论基础 电子书
  • 主编
  • 《数权法1.0》基于“数据人”假设,创新性地提出了“数权法”的概念,试图建构一个“数权—数权制度—数权法”的法律架构,这必定会成为法学领域的创新与突破,在中国乃至世界范围内都具有划时代的意义。从农耕文明到工业文明再到数字文明,人类从“人权”“物权”迈向“数权”时代,法律将实现从“人法”到“物法”再到“数法”的跃迁。数权法是人类迈向数字文明的新秩序,是时代进化的产物。
Spark海量数据处理:技术详解与平台实战 电子书
  • 范东来
  • 在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架ApacheSpark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了StructuredStreaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
财务大数据分析与可视化 电子书
  • 李静
  • 本教程选用微软PowerBI为数据分析工具,将10个项目划分为应用入门、进阶提升和财务综合应用三个循序渐进的学习阶段。应用入门包括财务大数据与可视化分析认知、PowerBI初体验、数据获取与整理、数据建模和数据可视化5个项目;进阶提升包括PowerBI动态交互、数据可视化分析实例和爬虫案例分析3个项目;财务综合应用包括财务数据可视化智能分析和应收账款数据可视化分析2个综合案例。本书结构合理、案例丰
病案首页大数据分析与应用 电子书
  • 肖兴政
  • 本书主要包含四个部分,包括对病案首页内涵与标准、病案首页数据汇集与质量管理、病案首页数据分析与应用以及病案数据分析应用展望。其中病案首页数据分析与应用部分是本书的特色部分,区别于一般基于服务能力/效率、质量安全以及患者入/离院方式的分析思路,本书在大数据分析基础上,从患者人员流动、医疗资源监测与规划以及医疗共同体几个方面利用病案首页数据提出新的分析思路,以推进对病案首页数据的进一步价值挖掘,更好的
大数据技术基础与实战 电子书
  • 编著
  • 本书主要内容包括:大数据技术概述、Linux基础与集群搭建、Hadoop集群配置、HDFS、MapReduce分布式编程、Hive大数据仓库、HBase数据库部署与操作、数据获取与Flume应用、基于Spark的内存计算,以及利用大数据平台处理图像。
Spark最佳实践 电子书
  • 林世飞
  • 腾讯专家首次分享Spark最新实践,基于真实数据,用案例分析全面解读大数据应用设计!
Spark编程基础 电子书
  • 林子雨
  • 系统、完整的数据科学与大数据技术专业解决方案。深入浅出,有效降低Spark技术学习门槛。
Python商务数据分析与实战 电子书
  • 何伟,张良均 主编
  • |a本书以Python数据分析常用技术与真实案例相结合的方式,介绍Python商务数据分析应用的重要内容。全书共10章,内容包括:商务数据分析概述、Python数据分析简介、数据获取、探索性分析、数据预处理等。