编辑推荐
深入Greenplum核心,透视分布式技术的工业级实践。
内容简介
在云计算和互联网快速发展的驱动下,分布式技术领域产生了很多新的热点,分布式数据库就是其中之一。但是,目前对分布式数据库的理解和研究多停留在理论层面,本书以Greenplum分布式数据库为例,深入剖析分布式技术在工业级产品里的实现细节,为读者呈现从理论到实践的“全景图”。
本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。
作者简介
作者王凤刚,分布式数据库开源项目Greenplum和HAWQ的贡献者;Greenplum相关产品工作经验9年;500强企业服务经验14年;云计算和分布式系统的开发和运维经验18年。
章节目录
版权信息
内容提要
推荐语
前言
资源与支持
第1篇 原理篇
第1章 云计算时代的数据库
1.1 数据库的历史和发展
1.2 云计算带来的挑战
1.3 云原生数据库的主要特点
第2章 分布式数据库基础理论和架构
2.1 分布式数据库理论概述
2.2 典型的分布式数据库
第3章 并发控制
3.1 概述
3.2 并发控制的分类
3.3 基于锁的并发控制
3.4 基于时间戳的并发控制
3.5 基于验证法的乐观并发控制
3.6 MVCC技术
3.7 快照隔离技术
3.8 可序列化快照隔离
3.9 死锁管理
3.10 B*树和LSM树
第2篇 Greenplum架构和源码分析
第4章 Greenplum总体架构
4.1 概述
4.2 数据库通信协议
4.3 Greenplum的架构和核心引擎
第5章 分布式事务的实现
5.1 分布式事务的原理和两阶段提交
5.2 steal/force和WAL协议
5.3 PostgreSQL事务处理和状态机介绍
5.4 分布式事务状态机
5.5 简单完整的分布式事务
5.6 分布式事务如何容错
第6章 分布式计算的实现
6.1 Greenplum的执行计划
6.2 运行执行器的算子
6.3 本地共享快照
6.4 分布式快照
6.5 共享内存
6.6 哈希和重分布
第7章 分布式存储的实现
7.1 Greenplum数据的分布方式
7.2 Greenplum数据库的高可用性
7.3 heap表和AO表
7.4 外部表存储
第3篇 数据库和新技术
第8章 云原生数据库
8.1 Greenplum的云原生尝试
8.2 VMware多云战略和Greenplum
8.3 HAWQ项目介绍
第9章 新技术的机遇
9.1 NVM存储技术
9.2 虚拟化技术
9.3 容器技术
深入浅出Greenplum分布式数据库:原理、架构和代码分析是2024年由人民邮电出版社出版,作者王凤刚。
得书感谢您对《深入浅出Greenplum分布式数据库:原理、架构和代码分析》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。