数据存储

  • 李妹芳
  •   2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录!  交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。  成功创下这项纪录背后,有ODPS很大的功劳!  阿里巴巴集团副总裁刘振飞表示,云计算在今年双11起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。  ODPS(OpenDataProcessingService)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场  本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。  本书包括以下重要内容:  ODPS概览及其基本知识;  如何高效地使用ODPSSQL;  MapReduce编程和进阶应用;  ODPS机器学习算法;  ODPS权限、资源和数据管理;  深入了解ODPS体系结构和高级机制。  书中所有示例代码都可以通过https://github.com/duckrun/odps_book免费下载。

数据存储相关书籍

大数据存储 电子书
本书共7个项目,内容包括了解大数据、结构化数据仓库——Hive、列存储数据库——HBase、文档存储数据库——MongoDB、文档存储数据库——ElasticSearch、数据传输工具——Sqoop,以及广电用户数据存储与分析。
数据存储技术 电子书
本书是华为ICT学院数据存储技术官方教材,旨在帮助学生学习数据存储技术的基本概念和原理、以及存储系统的搭建和使用。本书从信息传递方式的变迁引出数字化信息管理与存储的概念,进而概述存储系统构成和存储基础技术,再以磁盘阵列技术作为案例来阐述在同一存储设备上获得性能、容量、可用性三方面提升的设计思路;接下来从存储接口、传输协议、关键技术和功能支持等方面来讨论几类存储系统,包括直接连接存储、存储区域网络、
大数据存储技术 电子书
本书由浅入深,层层深入,从基本原理着手,逐步过渡到大数据存储的新技术的发展。
数据存储架构与技术 电子书
本书介绍数据存储架构与技术,涵盖了存储盘与存储介质、存储阵列、存储协议、键值存储,文件系统、网络存储体系结构、分布式存储系统、存储可靠性、存储安全、数据保护等基础内容,对存储维护、存储解决方案、存储技术趋势与发展等主题进行了深入讨论,并提供目前新的研究成果作为案例,帮助读者加深对数据存储的理解与运用。本书内容丰富,适合计算机及相关专业高年级本科生或研究生阅读和学习,同时也可供专业技术人员参考。
Hive大数据存储与处理 电子书
本书以广电大数据案例为主线,系统介绍数据仓库Hive存储和初步处理方法的相关知识。本书条理清楚、重点突出,内容循序渐进、由浅入深。本书共8章,包括广电大数据用户画像需求分析、部署开发环境、广电用户数据存储、广电用户基本数据简单查询、广电用户账单与订单数据查询进阶、广电用户收视行为数据查询优化、广电用户数据清洗及数据导出,以及广电用户数据存储与处理的程序开发。本书大部分章包含实训和课后习题,通过练习
大规模存储系统数据消冗 电子书
近年来,云计算、物联网、区块链和边缘计算等多种新型应用产生了海量的、有价值的数据,而且呈现出持续增长的趋势。如何有效地存储和管理如此庞大数据是现代工业界和学术界共同关注的重点和难点问题。本书系统地介绍了数据消冗技术,该技术能够通过有效地检测和排除数据中的冗余部分,达到减轻存储系统的负担和降低成本的目标,从而应对海量数据增长带来的挑战。本书结合作者近十余年在与存储系统领域相关的国际学术会议和期刊上发