HBase应用实战与性能调优

HBase应用实战与性能调优

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

本书系统介绍了HBase基本原理与运行机制,旨在让HBase应用开发人员和系统管理人员能更好地理解大数据应用程序的部署。

内容简介

本书融入作者多年的开发经验与实践技巧,由浅入深地讲解了HBase的概念、安装、配置、部署,让读者先对HBase有一个感性认识,再从应用角度出发介绍高级用法和性能调优。

本书内容既兼顾了初学者,也适用于想要深入学习HBase的读者。

章节目录

版权信息

前言

第1章 大数据时代的必然产物

1.1 HBase的发展历程

1.2 HBase的特征

1.3 HBase的优缺点

1.3.1 HBase的优点

1.3.2 HBase的缺点

1.4 HBase与关系数据库的区别

1.5 使用HBase的时机

1.6 HBase的应用场景

1.7 HBase的数据模型

1.8 HBase的逻辑视图

第2章 HBase基本架构与快速入门

2.1 HBase基本架构

2.2 HBase分布式环境搭建

2.2.1 设置服务器名称

2.2.2 Hadoop单机安装

2.2.3 Hadoop集群安装

2.2.4 ZooKeeper集群安装

2.2.5 HBase集群安装

2.3 HBase容器化技术搭建

2.3.1 CentOS环境下安装Docker

2.3.2 Windows 10环境下安装Docker

2.3.3 利用Docker安装HBase

2.4 HBase快速入门

2.4.1 使用HBase Shell

2.4.2 使用create命令

2.4.3 使用alter命令

2.4.4 使用list命令

2.4.5 使用describe命令

2.4.6 使用put命令

2.4.7 使用get命令

2.4.8 使用scan命令

2.4.9 使用deleteall命令

第3章 HBase基本操作

3.1 help命令

3.2 常规命令

3.2.1 查询集群状态信息(status命令)

3.2.2 查看如何操作表(table_help命令)

3.2.3 查询HBase版本信息(version命令)

3.2.4 查看当前用户(whoami命令)

3.2.5 查看进程列表(processlist命令)

3.3 DDL命令

3.3.1 创建表(create命令)

3.3.2 修改表信息(alter命令)

3.3.3 异步修改表信息(alter_async命令)

3.3.4 获取表的详细信息(describe命令)

3.3.5 获取HBase中所有的表(list命令)

3.3.6 判断表是否存在(exists命令)

3.3.7 以对象的方式操作表(get_table命令)

3.3.8 启用表(enable命令)

3.3.9 启用所有满足正则表达式的表(enable_all命令)

3.3.10 判断表是否被启用(is_enabled命令)

3.3.11 禁用表(disable命令)

3.3.12 禁用所有满足正则表达式的表(disable_all命令)

3.3.13 判断表是否被禁用(is_disabled命令)

3.3.14 删除表(drop命令)

3.3.15 删除所有满足正则表达式的表(drop_all命令)

3.3.16 获取RowKey所在的区域(locate_region命令)

3.3.17 显示HBase支持的过滤器(show_filters命令)

3.4 命名空间

3.4.1 创建命名空间(create_namespace命令)

3.4.2 修改命名空间(alter_namespace命令)

3.4.3 获取命名空间详情(describe_namespace命令)

3.4.4 获取命名空间下所有表的名称(list_namespace_tables命令)

3.4.5 获取所有的命名空间(list_namespace命令)

3.4.6 删除命名空间(drop_namespace命令)

3.5 DML命令

3.5.1 新增或者修改数据(put命令)

3.5.2 全表扫描数据(scan命令)

3.5.3 获取表中数据的总行数(count命令)

3.5.4 获取表中的数据(get命令)

3.5.5 删除列族中的某个列(delete命令)

3.5.6 删除整行数据(delete命令)

3.5.7 列值自增(incr命令)

3.5.8 获取自增后的列值(get_counter命令)

3.5.9 获取表所对应的Region数量(get_splits命令)

3.5.10 清空整个表数据,不保留分区(truncat命令)

3.5.11 清空整个表数据,保留分区(truncat_ preserve命令)

第4章 Java对接HBase

4.1 从“HelloWorld”开始

4.2 创建表

4.3 添加数据

4.4 批量添加数据

4.5 内容追加

4.6 修改数据

4.7 删除数据

4.8 批量删除

4.9 原子性操作

4.10 批量操作

4.11 自增

4.12 判断数据是否存在

4.13 代码封装

第5章 客户端API进阶

5.1 数据查询

5.2 数据扫描

5.3 过滤器快速实战

5.4 RowKey过滤器

5.5 RowKey前缀过滤器

5.6 RowKey模糊过滤器

5.7 列族过滤器

5.8 列过滤器

5.9 多列前缀过滤器

5.10 首次列键过滤器

5.11 列键过滤器

5.12 列值过滤器

5.13 单列值过滤器

5.14 列值排除过滤器

5.15 随机行过滤器

5.16 分页过滤器

5.17 多个过滤器综合查询

第6章 HBase批量加载

6.1 HBase批量加载简介

6.2 海量交易记录数据存储案例

6.2.1 案例开发准备工作

6.2.2 编写实体类

6.2.3 创建读取数据的Mapper类

6.2.4 编写驱动类

6.2.5 上传数据到HDFS

6.2.6 将导入的HDFS数据与HBase进行关联

第7章 协处理器

7.1 协处理器简介

7.2 协处理器分类

7.3 Coprocessor接口

7.4 协处理器的加载

7.4.1 使用配置文件加载

7.4.2 从表描述器中加载

7.5 RegionObschmerver类

7.5.1 Region状态

7.5.2 处理客户端API事件

7.6 自定义Obschmerver案例

第8章 Phoenix在HBase中的整合应用

8.1 Phoenix简介

8.2 安装Phoenix

8.2.1 下载

8.2.2 安装

8.3 连接Phoenix

8.4 Phoenix快速入门

8.4.1 创建表

8.4.2 删除表

8.4.3 插入数据

8.4.4 分页查询

第9章 HBase架构原理解析

9.1 HBase架构原理

9.1.1 RegionServer流程解析

9.1.2 StoreFile和HFile结构

9.1.3 MemStore和StoreFile

9.2 HBase写流程

9.3 HBase读流程

9.4 HBase如何进行增删改查

9.5 数据刷写

9.5.1 刷写操作的触发时机

9.5.2 刷写流程

9.6 数据合并

9.7 数据拆分

第10章 HBase性能优化

10.1 表设计优化

10.1.1 预分区

10.1.2 RowKey设计优化

10.1.3 列族数量优化

10.1.4 版本优化

10.2 HBase提升写效率

10.3 MemStore调优

10.4 合并调优

10.5 WAL调优

10.6 HBase读取优化

HBase应用实战与性能调优是2022年由机械工业出版社华章分社出版,作者张文亮 编著。

得书感谢您对《HBase应用实战与性能调优》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
入局:短视频策划与运营实战 电子书
·在短视频红利爆发的时代,抓住了短视频,就等于抓住了商机。 ·本书是一本抖音短视频策划与运营书籍,深度剖析短视频运营思维、短视频定位、内容策划与制作、推广与引流、打造爆款短视频、营销与变现等多种实战技能,涵盖短视频运营的各种玩法,让你轻松秒变短视频运营达人。 ·本书结构清晰,通俗易懂,图文并茂,适合短视频行业领域的从业人员、短视频进行营销的企业和商家、短视频实现快速引流的新媒体从业者,以及专注短视频风口的创业者等人士阅读,也适合对短视频创作、运营感兴趣的广大读者学习。
网络营销与推广:策略、方法与实战 电子书
本书可作为网络创业人士、个人站长、网络店主、网络营销从业者的参考用书,也可作为普通高校网络营销相关课程的教材,以及相关培训课程的培训教材。
岗位管理与岗位胜任力模型构建实战 电子书
本书主要介绍岗位管理和岗位胜任力模型在人力资源管理实战中的应用方法。
成本管理与控制全流程实战指南 电子书
什么是成本?成本管理包括哪些内容?成本核算如何进行?怎样才能做好成本分析与控制?本书以图文并茂的形式,将成本管理与控制中的基础概念和基本理论知识、成本管理与控制过程进行了全面介绍。书中不仅梳理了成本的概念、成本管理的内容、成本核算过程,而且专门介绍了生产成本管理,并且介绍了当前的成本管理新思路与新方法,对成本控制与成本报表分析做了系统介绍,为读者全面掌握成本管理与核算的技能与方法,提升企业管理水平
ERP原理与应用(微课版) 电子书
本书从ERP的概念和理论出发,对ERP所蕴含的管理思想和计划层次进行了剖析。