编辑推荐
本书以精练的语言介绍了HBase的基础知识。
内容简介
本书从企业常见的“用户行为日志管理系统”着手,介绍了HBase的基础知识,分析了HBase的核心思想(如数据读取和数据备份等)和HBase架构(如B 树、LSM树和WAL等),专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。
作者简介
作者彭旭,2009年毕业于武汉大学软件工程专业,近十年国内知名互联网企业工作经验,曾任阿里巴巴天猫技术部资深软件工程师、珠海市魅族科技有限公司架构师,现在在创业公司珠海市卓轩科技有限公司任合伙人。精通Java生态系统相关技术,对大数据存储、HBase系统调优有深刻理解,带领团队将云服务存储系统从MySQL迁移到HBase,每年为公司节省成本数百万元。
章节目录
版权信息
内容提要
对本书的赞誉
前言
资源与支持
第1章 HBase简介
1.1 背景
1.2 NoSQL与传统RDBMS
1.3 应用场景
1.3.1 Facebook用户交互
1.3.2 淘宝TLog
1.3.3 小米云服务
1.3.4 用户行为数据存储
第2章 HBase安装
2.1 单机部署
2.1.1 前置条件
2.1.2 下载HBase
2.1.3 配置HBase
2.1.4 启动HBase
2.1.5 HBase初体验
2.2 分布式部署
2.2.1 环境准备
2.2.2 ZooKeeper安装
2.2.3 Hadoop安装
2.2.4 HBase安装
2.2.5 启动集群
2.3 集群增删节点
2.3.1 增加节点
2.3.2 删除节点
第3章 HBase的数据模型
3.1 逻辑模型
3.2 物理模型
第4章 HBase Shell
4.1 数据定义语言
4.1.1 创建表
4.1.2 查看所有表
4.1.3 查看已创建的表
4.1.4 修改表
4.2 数据操纵语言
4.2.1 put命令
4.2.2 get命令
4.2.3 scan命令
4.2.4 delete命令、deleteall命令和truncate命令
4.3 其他常用的Shell命令
4.3.1 复制状态查看
4.3.2 分区拆分
4.3.3 分区大合并
4.3.4 负载均衡开关
4.3.5 分区手动迁移
4.3.6 HBase运行Ruby脚本
第5章 模式设计
5.1 行键设计
5.2 规避热点区间
5.3 高表与宽表
5.4 微信朋友圈设计
5.4.1 需求定义
5.4.2 问题建模
第6章 客户端API
6.1 Java客户端使用
6.2 数据定义语言
6.2.1 表管理
6.2.2 分区管理
6.3 数据操纵语言
6.3.1 Put操作
6.3.2 Get操作
6.3.3 Scan操作
6.3.4 Delete操作
6.3.5 Increment操作
6.4 过滤器
6.4.1 过滤器简介
6.4.2 过滤器使用
6.5 事务
6.5.1 原子性
6.5.2 隔离性
第7章 架构实现
7.1 存储
7.1.1 B+树
7.1.2 LSM树
7.1.3 预写入日志
7.2 数据写入与读取
7.2.1 定位分区服务器
7.2.2 数据修改流程
7.2.3 数据查询流程
7.3 合并策略
7.3.1 StripeCompaction策略
7.3.2 DateTieredCompaction策略
7.3.3 RatioBasedCompaction策略
7.3.4 ExploringCompaction策略
7.3.5 FIFOCompaction策略
第8章 协处理器
8.1 观察者类型协处理器
8.2 端点类型协处理器
8.3 加载/卸载协处理器
8.3.1 静态加载/卸载
8.3.2 动态加载/卸载
第9章 HBase性能调优
9.1 客户端调优
9.1.1 设置客户端写入缓存
9.1.2 设置合适的扫描缓存
9.1.3 跳过WAL写入
9.1.4 设置重试次数与间隔
9.1.5 选用合适的过滤器
9.2 服务器端调优
9.2.1 创建表语句的优化
9.2.2 禁止分区自动拆分与合并
9.2.3 开启机柜感知
9.2.4 开启短路本地读
9.2.5 开启补偿重试读
9.2.6 JVM内存调优
第10章 集群间数据复制
10.1 复制
10.1.1 集群拓扑
10.1.2 配置集群复制
10.1.3 验证复制数据
10.1.4 复制详解
10.2 快照
10.2.1 配置快照
10.2.2 管理快照
10.3 导出和导入
10.3.1 导出
10.3.2 导入
10.4 复制表
第11章 监控
11.1 Hadoop监控
11.1.1 Web监控页面
11.1.2 JMX监控接口
11.2 HBase监控
11.2.1 Web监控页面
11.2.2 JMX监控接口
11.2.3 客户端API监控
附录A 常见问题
A.1 垃圾回收超时导致分区服务器宕机
A.2 Scanner租期过期
A.3 分区迁移异常
A.4 Windows运行HBase程序缺少winutil.exe
A.5 误删表数据
A.6 RIT时间过长导致不同分区行键数据有重叠
HBase入门与实践(第2版)是2022年由人民邮电出版社出版,作者彭旭。
得书感谢您对《HBase入门与实践(第2版)》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。