ODPS权威指南——阿里大数据平台应用开发实践 电子书

ODPS权威指南——阿里大数据平台应用开发实践

手机扫码阅读
  • 微信扫一扫

    关注微信公众号

编辑推荐

  2014年天猫双11购物狂欢节成交额创下了571.12亿元的纪录!

  交易创建峰值能力达到每秒钟8万笔,支付宝的支付峰值突破了每分钟285万笔。

  成功创下这项纪录背后,有ODPS很大的功劳!

  阿里巴巴集团副总裁刘振飞表示,云计算在今年双11 起到了非常重要的基础性作用。天猫、淘宝、支付宝的大数据处理,都是基于阿里云计算的大数据处理平台ODPS 完成,ODPS为天猫双十一的商品个性化推荐提供了技术支持,这是自主研发能力的一个很大提升。

  ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场

  本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。

  本书包括以下重要内容:

  ODPS概览及其基本知识;

  如何高效地使用ODPS SQL;

  MapReduce编程和进阶应用;

  ODPS机器学习算法;

  ODPS权限、资源和数据管理;

  深入了解ODPS体系结构和高级机制。

  书中所有示例代码都可以通过https://github.com/duckrun/odps_book免费下载。

内容简介

ODPS(Open Data Processing Service)是阿里巴巴自主研发的海量数据处理和分析的服务平台,主要应用于数据分析、海量数据统计、数据挖掘、机器学习和商业智能等领域。目前,ODPS不仅在阿里内部得到广泛应用,享有很好的口碑,正逐步走向第三方开放市场。

本书是学习和掌握ODPS的专业指南,作者来自阿里ODPS团队。全书共13章,主要内容包括:ODPS入门、整体架构、数据通道、MapReduce编程、SQL查询分析、安全,以及基于真实数据的各种场景分析实战。本书基于很多范例解析,通过在各种应用场景下的示例来说明如何通过ODPS完成各种需求,以期引导读者从零开始轻松掌握和使用ODPS。同时,本书不局限于示例分析,也致力于提供更多关于大数据处理的编程思想和经验分享。书中所有示例代码都可以在作者提供的网站上免费下载。

本书适合想要了解和使用ODPS的读者阅读学习,对于从事大数据存储和应用以及分布式计算的专业人士来说,也是很好的参考资料。

章节目录

展开全部

ODPS权威指南——阿里大数据平台应用开发实践是2014年由人民邮电出版社出版,作者李妹芳。

版权说明:本电子书已获得正版授权,由出版社通过知传链发行。
得书感谢您对《ODPS权威指南——阿里大数据平台应用开发实践》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
云数据中心网络架构与技术 电子书

由华为数据通信数字化信息开发部和数据通信架构与设计部联合编写 基于华为在全球范围的丰富商用交付经验 聚焦新一代网络技术的发展热点 聚集华为数据通信产品线的一线专家和技术人员的研发成果 提供性能高、体验优、组网强、应用很好创新解决方案 针对未来万物高速、实时互联的海量应用场景,为满足大变革时代全新的企业需求痛点,提供充分发挥AI算力的、业界领先的解决方案,介绍如何构建智简、弹性、开放的数据中心网络。
NoSQL数据库原理 电子书

1. 校企合 作典范。 2. 计算机教指委提供指导。 3. 华为公司提供技术支持和案例。 4. 作者水平高,层次高。 5. 是计算机类专业教指委-华为ICT产学合 作项目——大数据系列规划教材
IBM SPSS Modeler 18.0数据挖掘权威指南 电子书

联袂推荐 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌 本书特色 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内容; 讲解透彻:既有理论的讲解,又涵盖应用的实践,而且在工具的介绍上,尽可能包括每一个选项的内容和应用形式,力求让读者“吃透”每一章节的内容; 突出实战:集行业经验、项目实践、算法剖析、应用技巧于一身,配套提供数据文件以及数据模型文件,方便读者动手实践。
Spark海量数据处理:技术详解与平台实战 电子书

在数字经济时代,数据是重要的资源要素;同时,新的数据又在源源不断地产生,企业面临的一个基本问题就是如何管理和利用这些数据,这对传统的数据处理方法与分析框架提出了新的诉求和挑战,也是全球业界与学界为关心的问题。为了满足大数据时代对信息的快速处理的需求,一个分布式的开源计算框架Apache Spark应运而生。经过十年的发展,Spark已经成为目前大数据处理的标杆,在整个业界得到了广泛的使用。对大数据工程师来说,用Spark构建数据管道无疑是很好的选择,而对数据科学家来说,Spark也是高效的数据探索工具。 本书基于Spark发行版2.4.4写作而成,包含大量的实例与一个完整项目,技术理论与实战相结合,层次分明,循序渐进。本书不仅介绍了如何开发Spark应用的基础内容,包括Spark架构、Spark编程、SparkSQL、Spark调优等,还探讨了Structured Streaming、Spark机器学习、Spark图挖掘、Spark深度学习、Alluxio系统等高级主题,同时完整实现了一个企业背景调查系统,借鉴了数据湖与Lambda架构的思想,涵盖了批处理、流处理应用开发,并加入了一些开源组件来满足业务需求。学习该系统可以使读者从实战中巩固所学,并将技术理论与应用实战融会贯通。 本书适合准备学习Spark的开发人员和数据分析师,以及准备将Spark应用到实际项目中的开发人员和管理人员阅读,也适合计算机相关专业的高年级本科生和研究生学习和参考,对于具有一定的Spark使用经验并想进一步提升的数据科学从业者也是很好的参考资料。
SQL Server 2012数据库管理与开发(慕课版) 电子书

30小时慕课教学视频同步讲解,让学习更高效快捷 80个精彩课堂案例,12个课堂实验,1个综合案例,Java学习从入门到精通 66道习题,300道自测题,5套自测试卷,巩固所学知识 提供免费教学资源,包括精品教学PPT、案例源代码、自测题库、拓展综合案例
趣学数据结构 电子书

适读人群 :本书可作为程序员的学习用书,也适合没有太多编程经验但又对数据结构有强烈兴趣的初学者使用,同时也可作为高等院校计算机、数学及相关专业的师生用书,或学科竞赛的辅导用书和培训学校的教材。   (1)完美图解 丰富实例,复杂问题简单化   为基本操作配以图解,用数据结构解决生活中的实际问题,学习过程更加轻松有趣。   (2)原理分析 实战演练,真正地学以致用   通俗化讲解基础知识,在实战中体会数据结构的设计和操作,锻炼独立思考的能力。   (3)配套代码 在线答疑,为学习保驾护航   提供书中的范例程序源代码、练习题以及答案解析,并在博客和QQ群中答疑解惑。