100 条"Hadoop数据分析"搜索结果
HADOOP大数据开发实战 电子书
  • 杨力
  • Hadoop基础教程,大数据技术原理与应用教程,MapReduce框架入门实战指南。
Hadoop数据仓库实战 电子书
  • 肖睿 兰伟 廖春琼
  • 本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
Hadoop大数据开发基础 电子书
  • 张良均
  • 本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的第2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自
Hadoop大数据处理与分析教程(慕课版) 电子书
  • 王秀友 丁小娜 刘运 主编
  • 本书系统全面地介绍了有关Hadoop的各类知识。全书共分11章,内容包括绪论、Linux操作系统的安装、Hadoop的伪分布式安装、Hadoop集群的搭建及配置、HadoopHDFS命令、MapReduce编程入门、Hive、Sqoop、HBase、Spark的介绍与安装、综合案例——网络爬虫大数据分析。
Hadoop+Spark大数据技术 电子书
  • 曾国荪 曹洁 编著
  • 本书介绍Hadoop、Spark两种大数据处理框架,共12章,内容包括:Hadoop大数据开发环境、HDFS大数据分布式存储、MapReduce分布式计算框架、HBase分布式数据库、Scala基础编程、Spark大数据处理框架、Windows环境下Spark综合编程等。
大数据技术基础——基于Hadoop与Spark 电子书
  • 李瑶
  • 将Hadoop和Spark组合起来进行剖析,呈现完整的大数据技术方案。
Hadoop大数据开发实战(慕课版) 电子书
  • 千锋教育高教产品研发部
  • 本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
Hadoop大数据平台集群部署与开发 电子书
  • 罗文浪、邱波、郭炳宇、姜善永
  • Hadoop大数据平台集群部署与开发课程是云计算的一门专业平台课。本教材可为参与大数据开发与处理等相关流程的技术人员提供有益参考,为其介绍大数据处理技术Hadoop以及Hadoop家族体系的其他核心成员:Zookeeper、HBase、Hive、Flume、Sqoop等。本教材以分类任务的形式,具体介绍了“这些成员”的概念及实际应用,具有较强的综合性和实践性强,内容涉及广泛,讲解深入透彻。
基于Hadoop与Spark的大数据开发实战 电子书
  • 肖睿 丁科 吴刚山
  • 大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
Hadoop大数据开发基础(第2版)(微课版) 电子书
  • 张军
  • 本书以任务为导向,较为系统地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。全书共8章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce入门编程、MapReduce进阶编程、Hive数据仓库、HBase分布式数据库,以及一个项目案例(电影网站用户影评分析)。本书的第2~7章包含实训与课后习题,读者可通过练习和操作实践,巩
实战大数据(Hadoop+Spark+Flink)从平台构建到交互式数据分析(离线/实时) 电子书
  • 杨俊
  • 面向大数据开发工程师,大数据运维工程师围绕Hadoop、Spark、Flink三大主流平台,详解大数据平台的搭建及数据分析(离线/实时)随书配备全套数据集、安装包、配置文件、海量教学视频(近30GB),方便学用
大数据Hadoop 3.X分布式处理实战 电子书
  • 吴章勇 杨强
  • 本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
大数据处理技术基础与应用(Hadoop+Spark) 电子书
  • 主编
  • 本书是一本介绍大数据处理技术的专业图书,力求提高读者对大数据处理的认知水平和动手能力。本书首先介绍大数据技术的相关概念和发展历程,从实践的角度介绍Hadoop和Spark的安装部署、编程基础和使用方法;然后结合具体案例,重点介绍SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的应用思路和方法,并通过具体代码,让读者更好地感受大数据处理技术的效果。本
大数据财务分析 电子书
  • 张立军 主编
  • 本书旨在帮助读者提升大数据背景下的企业财务数据分析能力。
Python数据分析 电子书
  • 吴道君,朱家荣
  • 本书全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。  本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。  本书内容充实、结构合理、实用性强,具有明确的应用能力培养目标,易于接受和理解,学完本书后,可以具备数据分析的基本能力。  本书适合
Python商业数据分析 电子书
  • 编著
  • 全书共12章,主要内容包括:商业数据分析概论、Python商业数据存取、Python商业数据图形绘制与可视化、Python描述性统计、Python参数估计、Python参数假设检验、Python相关分析、Python一元线性回归分析、Python多元线性回归分析、Python时间序列分析、Python量化金融数据分析、Python机器学习。
新媒体数据分析 电子书
  • 王佳娴 编著
  • 本书讲解了新媒体数据分析的概念、方法、工具、数据指标及关键流程,介绍了微信公众号、微博、今日头条三大新媒体平台的数据分析技巧,还针对广告投放和活动策划这两大新媒体工作场景进行了数据分析过程的讲解。
Excel数据分析实务 电子书
  • 主编
  • 本书分为4篇,分别为概述、数据获取、数据处理,以及数据分析与可视化,共包括11个项目,分别为学生校园消费行为概述,获取文本数据,制作消费金额的描述性统计分析表,处理异常值,处理缺失值,处理重复值,使用PowerQuery方法处理数据,合并数据,分析食堂就餐情况,分析学生就餐消费行为,撰写分析报告。
大数据和大分析 电子书
  • 段云峰
  • 本书首先参阐述大数据出现的背景,解释数据资产、数据驱动等基本概念,剖析数据分析的重要性,介绍了大分析的内容和范围、关键点等;其次,阐述了大数据建设的基本内容和有关应用领域等,涉及收集、存储、标准、技术选择等内容,重点介绍了数据质量、安全管理等数据管控的内容;结尾,给出了大数据建设配套的人才、管理结构等方面的内容和经验,分享如何引入互联网思维,开辟新视野的理念。
大数据财务分析实务 电子书
  • 主编
  • 本书基于大数据、信息技术对企业财务分析产生的影响,梳理了企业财务分析的框架,内容主要包括大数据财务分析理论、财务数据分析可视化、企业战略分析、企业会计分析、企业盈利能力分析、企业营运能力分析、企业偿债能力分析、企业发展能力分析、企业综合财务分析、财务预警分析等。本书理论与实践紧密结合,依托网中网财务大数据平台的数据资源,以格力电器为背景,结合丰富的案例,帮助读者掌握大数据财务分析的方法与技巧,适合