大数据Hive离线计算开发实战 电子书

大数据Hive离线计算开发实战

9.9开通会员

内容简介

本书从数据处理平台数据库和数据仓库入手,帮助读者逐步搭建大数据Hive数据仓库平台,并介绍了这种传统数据分析方法在大数据平台成功应用的典型案例。本书通过对Hive数据定义语言、Hive数据操纵语言、Hive数据基本查询、Hive数据复杂查询的详细介绍,全面阐述了Hive大数据平台工具的应用与开发。另外,还介绍了Hive数据库对象、用户自定义函数以及Azkaban工作流作业调度器,帮助读者掌握Hive平台的强大功能和特性。最后,通过电商推荐系统、汽车销售数据分析系统以及微博数据分析系统3个实战开发项目案例,让读者对Hive大数据平台数据仓库工具的实战应用有更深的理解。

章节目录

展开全部

大数据Hive离线计算开发实战是2020年由人民邮电出版社出版,作者杨力。

温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《大数据Hive离线计算开发实战》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Hive大数据存储与处理 电子书
本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习
大数据开发项目实战 电子书
本书以项目案例为导向,贯穿讲解一个大数据的实战项目:广电大数据用户画像。全书共8章,具体内容包括大数据项目概述、Hadoop生态组件基础、广电大数据用户画像——需求分析、广电大数据用户画像——数据采集与预处理等。
云计算和大数据技术实战 电子书
本书是云计算与大数据技术教程的项目化教材,全书共11章,设计了6项主任务、34项子任务。以搭建云计算平台流程组织实训内容,全面介绍了CentOS操作系统的安装及网络配置方法、虚拟化技术KVM的使用、MPI的安装与部署、分布式处理系统Hadoop软件的编译、安装及部署、Hbase数据库的安装与配置以及大数据流处理系统Storm的安装与部署。本书突出上机操作,图文并茂且条理分明,实验丰富,把实验内容与
Hadoop大数据开发实战(慕课版) 电子书
本书共分11章,第1章对大数据及Hadoop进行总体介绍;第2章讲解了如何搭建Hadoop集群;第3-5章讲解了HDFS分布式文件系统、MapReduce分布式计算框架以及Zookeeper分布式协调服务;第6章讲解Hadoop2.0的新特性;第7-10章主要讲解了Hadoop生态圈中的相关辅助系统,包括Hive、HBase分布式存储系统、Flume、Saoop;第11章讲解了综合项目:电商精准营
基于Hadoop与Spark的大数据开发实战 电子书
大数据技术让我们以一种前所未有的方式,对海量数据进行分析,从中获得有巨大价值的产品和服务,最终形成变革之力。本书围绕Hadoop和Spark两个主流大数据技术进行讲解,主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数
MySQL数据库运维与管理(微课版) 电子书
随着企业数字化转型不断深化,企业对数据库工程师的需求越来越大。本书结合实际工作场景,将企业数据库运维的相关工作分为10个项目,内容包括了解数据库运维工作,安装和配置MySQL,管理MySQL权限与安全,分析MySQL日志,备份与恢复MySQL,监控、测试并优化MySQL性能,MySQL复制,搭建及运维MySQLCluster,结合Redis的MySQL运维,数据库自动化运维。本书配套教学PPT、题
Vulkan开发实战详解 电子书
本书共分为19章,介绍了Vulkan的诞生、特点、开发环境的搭建以及运行机制、渲染管线和调试技术,着色器编程语言—GLSL、投影及各种变换、光照、纹理映射、3D模型的加载、混合与雾、两种测试及片元丢弃、顶点着色器的妙用、片元着色器的妙用、真实光学环境的模拟、阴影及高级光照、几种高级着色器特效、骨骼动画、Vulkan的性能优化等,最后以一个休闲游戏—方块历险记的案例来展示Vulkan的功能与技术。本
基于机器学习的工作流活动推荐 电子书
随着云计算、大数据等的快速发展,越来越多的组织用信息化手段进行流程管理。如何提升流程执行的智能化程度、动态性和柔性,以提高对非标准业务的管理效率,是流程管理面临的一个重要问题。本书基于流程管理系统积累的日志,提出了3种流程管理的工作流活动推荐方法,分别为基于用户类别近邻的活动推荐方法、基于Pearson相关系数的活动推荐方法和基于协同过滤的活动推荐方法,并介绍了一种流程信息的可视化算法,实现了一个