HBase入门与实践(第2版)

HBase入门与实践(第2版)

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

编辑推荐

本书以精练的语言介绍了HBase的基础知识。

内容简介

本书从企业常见的“用户行为日志管理系统”着手,介绍了HBase的基础知识,分析了HBase的核心思想(如数据读取和数据备份等)和HBase架构(如B 树、LSM树和WAL等),专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。

作者简介

作者彭旭,2009年毕业于武汉大学软件工程专业,近十年国内知名互联网企业工作经验,曾任阿里巴巴天猫技术部资深软件工程师、珠海市魅族科技有限公司架构师,现在在创业公司珠海市卓轩科技有限公司任合伙人。精通Java生态系统相关技术,对大数据存储、HBase系统调优有深刻理解,带领团队将云服务存储系统从MySQL迁移到HBase,每年为公司节省成本数百万元。

章节目录

版权信息

内容提要

对本书的赞誉

前言

资源与支持

第1章 HBase简介

1.1 背景

1.2 NoSQL与传统RDBMS

1.3 应用场景

1.3.1 Facebook用户交互

1.3.2 淘宝TLog

1.3.3 小米云服务

1.3.4 用户行为数据存储

第2章 HBase安装

2.1 单机部署

2.1.1 前置条件

2.1.2 下载HBase

2.1.3 配置HBase

2.1.4 启动HBase

2.1.5 HBase初体验

2.2 分布式部署

2.2.1 环境准备

2.2.2 ZooKeeper安装

2.2.3 Hadoop安装

2.2.4 HBase安装

2.2.5 启动集群

2.3 集群增删节点

2.3.1 增加节点

2.3.2 删除节点

第3章 HBase的数据模型

3.1 逻辑模型

3.2 物理模型

第4章 HBase Shell

4.1 数据定义语言

4.1.1 创建表

4.1.2 查看所有表

4.1.3 查看已创建的表

4.1.4 修改表

4.2 数据操纵语言

4.2.1 put命令

4.2.2 get命令

4.2.3 scan命令

4.2.4 delete命令、deleteall命令和truncate命令

4.3 其他常用的Shell命令

4.3.1 复制状态查看

4.3.2 分区拆分

4.3.3 分区大合并

4.3.4 负载均衡开关

4.3.5 分区手动迁移

4.3.6 HBase运行Ruby脚本

第5章 模式设计

5.1 行键设计

5.2 规避热点区间

5.3 高表与宽表

5.4 微信朋友圈设计

5.4.1 需求定义

5.4.2 问题建模

第6章 客户端API

6.1 Java客户端使用

6.2 数据定义语言

6.2.1 表管理

6.2.2 分区管理

6.3 数据操纵语言

6.3.1 Put操作

6.3.2 Get操作

6.3.3 Scan操作

6.3.4 Delete操作

6.3.5 Increment操作

6.4 过滤器

6.4.1 过滤器简介

6.4.2 过滤器使用

6.5 事务

6.5.1 原子性

6.5.2 隔离性

第7章 架构实现

7.1 存储

7.1.1 B+树

7.1.2 LSM树

7.1.3 预写入日志

7.2 数据写入与读取

7.2.1 定位分区服务器

7.2.2 数据修改流程

7.2.3 数据查询流程

7.3 合并策略

7.3.1 StripeCompaction策略

7.3.2 DateTieredCompaction策略

7.3.3 RatioBasedCompaction策略

7.3.4 ExploringCompaction策略

7.3.5 FIFOCompaction策略

第8章 协处理器

8.1 观察者类型协处理器

8.2 端点类型协处理器

8.3 加载/卸载协处理器

8.3.1 静态加载/卸载

8.3.2 动态加载/卸载

第9章 HBase性能调优

9.1 客户端调优

9.1.1 设置客户端写入缓存

9.1.2 设置合适的扫描缓存

9.1.3 跳过WAL写入

9.1.4 设置重试次数与间隔

9.1.5 选用合适的过滤器

9.2 服务器端调优

9.2.1 创建表语句的优化

9.2.2 禁止分区自动拆分与合并

9.2.3 开启机柜感知

9.2.4 开启短路本地读

9.2.5 开启补偿重试读

9.2.6 JVM内存调优

第10章 集群间数据复制

10.1 复制

10.1.1 集群拓扑

10.1.2 配置集群复制

10.1.3 验证复制数据

10.1.4 复制详解

10.2 快照

10.2.1 配置快照

10.2.2 管理快照

10.3 导出和导入

10.3.1 导出

10.3.2 导入

10.4 复制表

第11章 监控

11.1 Hadoop监控

11.1.1 Web监控页面

11.1.2 JMX监控接口

11.2 HBase监控

11.2.1 Web监控页面

11.2.2 JMX监控接口

11.2.3 客户端API监控

附录A 常见问题

A.1 垃圾回收超时导致分区服务器宕机

A.2 Scanner租期过期

A.3 分区迁移异常

A.4 Windows运行HBase程序缺少winutil.exe

A.5 误删表数据

A.6 RIT时间过长导致不同分区行键数据有重叠

HBase入门与实践(第2版)是2022年由人民邮电出版社出版,作者彭旭。

得书感谢您对《HBase入门与实践(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

你可能喜欢
Python基础教程(第3版) 电子书
手把手带你从零开始学习Python。
计算机网络技术(第4版) 电子书
12章详解计算机网络、技术、安全与应用
云数据中心网络架构与技术 电子书
由华为数据通信数字化信息开发部和数据通信架构与设计部联合编写 基于华为在全球范围的丰富商用交付经验 聚焦新一代网络技术的发展热点 聚集华为数据通信产品线的一线专家和技术人员的研发成果 提供性能高、体验优、组网强、应用很好创新解决方案 针对未来万物高速、实时互联的海量应用场景,为满足大变革时代全新的企业需求痛点,提供充分发挥AI算力的、业界领先的解决方案,介绍如何构建智简、弹性、开放的数据中心网络。
数据权益资产化与监管:大数据时代的个人信息保护与价值实现 电子书
本书从数据治理的本质出发,清晰核心问题、提出了理论与落地指导意见,并通过案例让读者可以轻松理解。
一本书读懂TCPIP 电子书
本书适合从事企业信息化建设和应用的技术人员、从事多媒体通信技术领域的初级科研和工程技术人员阅读,也可以供中高等院校相关专业师生参考。