Greenplum:从大数据战略到实现

Greenplum:从大数据战略到实现

我想读
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

类似推荐

编辑推荐

Greenplum核心研发团队精心撰写,全面解读开源MPP大数据平台开发与实践。从大数据战略到落地,多维度助力企业数字化转型。

内容简介

本书分为四个部分。

第一部分介绍大数据战略。其中,第1章将分享作者对于ABC(人工智能、大数据和云计算)之间关系的理解以及对人和人工智能的思考。第2章将介绍进取型企业为什么需要大数据战略以及如何建立大数据战略。

第二部分介绍大数据平台。其中,第3章将以数据平台演进历史和未来趋势为主题,描述三次整合的背景及影响,介绍选择大数据平台需要考虑的因素,以及为什么Greenplum是理想的大数据平台。第4章为Greenplum数据库快速入门指南。第5章将介绍Greenplum架构的主要特点和核心引擎。第6章将介绍数据加载、数据联邦和数据虚拟化。第7章将介绍Greenplum的资源管理以及对混合负载的支持。

第三部分介绍机器学习与数据分析。其中,第8章介绍Greenplum的各种过程化编程语言(用户自定义函数),用户可以使用Python、R、Java等语言实现用户自定义函数,还可以通过容器化技术实现自定义函数的安全性和隔离性。第9章将介绍Greenplum内建的机器学习库MADlib,数据科学家可以使用内建的50多种机器学习算法基于SQL对数据进行高级分析,并介绍如何扩展MADlib以实现新算法。第10章和第11章将分别介绍Greenplum如何对文本数据和时空数据(GIS)进行存储、计算和分析。第12章将介绍Greenplum丰富的图计算能力。

第四部分介绍运维管理和数据迁移。其中,第13章将介绍各种监控和管理工具及相关企业级产品。第14章介绍数据库备份、恢复和迁移。第15章和第16章将分别介绍如何从Oracle和Teradata迁移到Greenplum。

作者简介

作者冯雷,Pivotal中国常务董事(Managing Director)兼研发中心总经理。Pivotal中国成立至今,冯雷主持了近十亿人民币投资的中国运营和研发体系。作为Pivotal全球产品关键领导人,为Pivotal公司的数字化理念建立及其对应的Cloud Foundry和Greenplum产品提供战略输入。冯雷于2010年从美国硅谷归国,在世界500强公司EMC旗下组建了Pivotal中国。在归国之前,冯雷曾在500强企业甲骨文(Oracle)总部从事云计算产品研发。作为云计算早的一批从业人员,帮助甲骨文云计算资源调度领域成为意见领袖。拥有多项云计算专利。

章节目录

版权信息

编委会

前言

第一部分 大数据战略

第1章 ABC:人工智能、大数据和云计算

1.1 再谈云计算

1.2 大数据

1.3 人工智能

1.4 ABC之间的关系

1.5 AI和人

第2章 建立基于大数据的高阶数字化战略

2.1 基于云原生应用的数字化战略

2.2 大数据和AI:企业未来的终极竞争点

2.3 大数据战略的落地

2.4 大数据和AI的展望

第二部分 大数据平台

第3章 数据处理平台的演进

3.1 前数据处理时代

3.2 早期的电子数据处理

3.3 数据库

3.4 NoSQL数据库

3.5 SQL数据库的回归

3.6 集成数据处理和分析平台

3.7 数据平台的选型

3.8 小结

第4章 Greenplum数据库快速入门

4.1 Greenplum数据库的发展和现状

4.2 Greenplum数据库的特性

4.3 Greenplum数据库的组成

4.4 Greenplum数据库的安装与部署

4.5 Greenplum数据库的常用操作

4.6 Greenplum数据库的常用命令

4.7 小结

第5章 Greenplum的架构和核心引擎

5.1 Greenplum的架构

5.2 Greenplum查询计划

5.3 Greenplum数据库查询处理的过程

5.4 小结

第6章 从ETL到数据联邦和数据虚拟化

6.1 Greenplum中的ETL

6.2 Greenplum的数据联邦

6.3 Greenplum的数据虚拟化框架

6.4 小结

第7章 混合负载和资源管理

7.1 混合负载的机遇和挑战

7.2 混合负载的业务和技术要求

7.3 资源管理

7.4 并发管理

7.5 小结

第三部分 机器学习与数据分析

第8章 Greenplum中的过程化编程语言

8.1 PL/Python

8.2 PL/R

8.3 PL/Container

8.4 小结

第9章 MADlib机器学习库

9.1 MADlib入门

9.2 MADlib的架构

9.3 MADlib应用

9.4 小结

第10章 Greenplum半结构化文本数据分析

10.1 GPText文本分析概述

10.2 GPText内置的全文检索引擎:Apache SolrCloud

10.3 GPText架构:高速并行索引和查询

10.4 数据准备

10.5 GPText的使用:简单的SQL和UDF函数

10.6 GPText的安装

10.7 GPText索引

10.8 GPText简单查询

10.9 GPText高级查询

10.10 GPText分区表查询

10.11 GPText对自然语言处理的支持

10.12 GPText定制化索引

10.13 GPText管理工具

10.14 GPText用于文本挖掘和分析

10.15 小结

第11章 地理空间数据分析和处理

11.1 概述

11.2 Greenplum PostGIS

11.3 Greenplum PostGIS应用实例

11.4 小结

第12章 Greenplum数据库与图计算

12.1 图的概念

12.2 图的应用

12.3 图数据的处理

12.4 Greenplum对图数据的支持

12.5 MADlib中的图结构和算法

12.6 小结

第四部分 Greenplum的运维和迁移

第13章 Greenplum的监控和管理

13.1 监控Greenplum集群的状态

13.2 管理Greenplum集群

13.3 Greenplum指令中心(GPCC)

13.4 小结

第14章 Greenplum数据库的备份、恢复和迁移

14.1 非并行数据库备份

14.2 非并行数据库恢复

14.3 并行数据库备份

14.4 并行数据库恢复

14.5 高效的并行数据库备份和恢复工具gpbackup/gprestore

14.6 新一代Greenplum数据迁移工具GPCOPY

14.7 小结

第15章 从Oracle迁移到Greenplum

15.1 概述

15.2 Oracle与Greenplum的架构对比

15.3 从Oracle迁移到Greenplum的流程

15.4 小结

第16章 从Teradata迁移到Greenplum

16.1 Teradata产品和用户面临的问题

16.2 从Teradata迁移到Greenplum的可行性

16.3 如何从Teradata迁移到Greenplum

16.4 特殊场景

16.5 小结

附录A Greenplum社区

A.1 Greenplum的社区资源

A.2 向Greenplum贡献代码

A.2.1 Greenplum代码库

A.2.2 向Greenplum贡献代码有什么好处

A.2.3 如何向Greenplum提交代码

A.2.4 如何编译Greenplum代码

A.2.5 如何运行测试

A.2.6 从哪里开始

A.2.7 为何签署CLA协议

附录B 外部表实例

B.1 演示环境

B.2 GPFDIST实战

B.3 可执行外部表实战

B.4 S3使用实战

附录C Greenplum的SSL证书

C.1 准备工作

C.2 创建证书

术语表

Greenplum:从大数据战略到实现是2019年由机械工业出版社华章分社出版,作者冯雷。

得书感谢您对《Greenplum:从大数据战略到实现》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢