Hive大数据存储与处理 电子书

Hive大数据存储与处理

9.9开通会员

内容简介

本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习和操作实践,帮助读者巩固所学的内容。

本书可以作为高等院校数据科学或大数据相关专业的教材,也可以作为大数据爱好者的自学用书。

章节目录

展开全部

Hive大数据存储与处理是2024年由人民邮电出版社出版,作者张良均。

温馨提示:
1.本电子书已获得正版授权,由出版社通过知传链发行。
2.该电子书为虚拟物品,付费之后概不接收任何理由退款。电子书内容仅支持在线阅读,不支持下载。
3.您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
得书感谢您对《Hive大数据存储与处理》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
大数据技术原理与应用——概念、存储、处理、分析与应用 电子书
全书共有13章,系统地论述了大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、分布式并行编程模型MapReduce、流计算、图计算、数据可视化以及大数据在互联网、生物医学和物流等各个领域的应用。在Hadoop、HDFS、HBase和MapReduce等重要章节,安排了入门级的实践操作,让读者更好地学习和掌握大数据关键技术。
数据存储架构与技术 电子书
本书介绍数据存储架构与技术,涵盖了存储盘与存储介质、存储阵列、存储协议、键值存储,文件系统、网络存储体系结构、分布式存储系统、存储可靠性、存储安全、数据保护等基础内容,对存储维护、存储解决方案、存储技术趋势与发展等主题进行了深入讨论,并提供目前新的研究成果作为案例,帮助读者加深对数据存储的理解与运用。本书内容丰富,适合计算机及相关专业高年级本科生或研究生阅读和学习,同时也可供专业技术人员参考。
大数据存储 电子书
本书共7个项目,内容包括了解大数据、结构化数据仓库——Hive、列存储数据库——HBase、文档存储数据库——MongoDB、文档存储数据库——ElasticSearch、数据传输工具——Sqoop,以及广电用户数据存储与分析。
数据存储技术 电子书
本书是华为ICT学院数据存储技术官方教材,旨在帮助学生学习数据存储技术的基本概念和原理、以及存储系统的搭建和使用。本书从信息传递方式的变迁引出数字化信息管理与存储的概念,进而概述存储系统构成和存储基础技术,再以磁盘阵列技术作为案例来阐述在同一存储设备上获得性能、容量、可用性三方面提升的设计思路;接下来从存储接口、传输协议、关键技术和功能支持等方面来讨论几类存储系统,包括直接连接存储、存储区域网络、
大数据Hive离线计算开发实战 电子书
本书从数据处理平台数据库和数据仓库入手,帮助读者逐步搭建大数据Hive数据仓库平台,并介绍了这种传统数据分析方法在大数据平台成功应用的典型案例。本书通过对Hive数据定义语言、Hive数据操纵语言、Hive数据基本查询、Hive数据复杂查询的详细介绍,全面阐述了Hive大数据平台工具的应用与开发。另外,还介绍了Hive数据库对象、用户自定义函数以及Azkaban工作流作业调度器,帮助读者掌握Hiv
数据存储架构与技术(第2版) 电子书
本书介绍数据存储架构与技术,涵盖存储盘与存储介质、存储阵列、存储协议、键值存储、文件系统、网络存储体系结构、分布式存储系统、存储可靠性、存储安全、数据保护等基础内容,对存储维护、存储解决方案、存储技术趋势与发展等主题进行了深入讨论,以新的研究成果作为案例,同时提供习题帮助读者加深对数据存储的理解与运用。本书适合计算机及相关专业高年级本科生或研究生阅读、学习,同时也可供相关专业技术人员参考。
Excel数据获取与处理 电子书
本书以项目为导向,由浅入深地介绍Excel2016在数据获取与处理中的应用。全书共14个项目,项目1简单介绍Excel2016的界面,以及工作簿、工作表、单元格的概念;项目2介绍各种类型数据的输入;项目3介绍如何美化工作表;项目4介绍如何使用Excel获取文本数据;项目5介绍如何使用Excel获取网站数据;项目6介绍如何使用Excel获取MySQL数据库中的数据;项目7介绍如何对数据进行排序;项目
数据采集与预处理 电子书
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机