HBase不睡觉书

HBase不睡觉书

查阅电子书
手机扫码
  • 微信扫一扫

    关注微信公众号

因版权原因待上架

编辑推荐

感性严谨,全面深入解析HBase。

内容简介

这是一本既感性又严谨的书。本书共分为10章,由浅入深的讲解HBase概念、安装、配置、部署。让读者对Hbase先有一个感性认识,再从应用角度,介绍了高级用法、监控和性能调优。既兼顾了初学者也适用于想要深入学习Hbase的读者。

章节目录

封面页

书名页

版权页

内容简介

前言

目录

第1章 ◄ 初识HBase ►

1.1 海量数据与NoSQL

1.1.1 关系型数据库的极限

1.1.2 CAP理论

1.1.3 NoSQL

1.2 HBase是怎么来的

1.3 为什么要用HBase

1.4 你必须懂的基本概念

1.4.1 部署架构

1.4.2 存储架构

1.4.3 跟关系型数据库的对比

第2章 ◄ 让HBase跑起来 ►

2.1 本书测试环境

2.2 配置服务器名

2.3 配置SSH免密登录

2.4 安装Hadoop

2.4.1 安装Hadoop单机模式

2.4.2 安装Hadoop集群模式

2.4.3 ZooKeeper

2.4.4 配置Hadoop HA

2.4.5 让Hadoop可以开机自启动

2.4.6 最终配置文件

2.5 安装HBase

2.5.1 单机模式

2.5.2 伪分布式模式

2.5.3 关于ZooKeeper不得不说的事

2.5.4 完全分布式模式

2.5.5 HBase Web控制台(UI)

2.5.6 让HBase可以开机自启动

2.5.7 启用数据块编码(可选)

2.5.8 启用压缩器(可选)

2.5.9 数据块编码还是压缩器(可选)

第3章 ◄ HBase基本操作 ►

3.1 hbase shell的使用

3.1.1 用create命令建表

3.1.2 用list命令来查看库中有哪些表

3.1.3 用describe命令来查看表属性

3.1.4 用put命令来插入数据

3.1.5 用scan来查看表数据

3.1.6 用get来获取单元格数据

3.1.7 用delete来删除数据

3.1.8 用deleteall删除整行记录

3.1.9 用disable来停用表

3.1.10 用drop来删除表

3.1.11 shell命令列表

3.2 使用Hue来查看HBase数据

3.2.1 准备工作

3.2.2 安装Hue

3.2.3 配置Hue

3.2.4 使用Hue来查看HBase

第4章 ◄ 客户端API入门 ►

4.1 10分钟教程

4.2 30分钟教程

4.3 CRUD一个也不能少

4.3.1 HTable类和Table接口

4.3.2 put方法

4.3.3 append方法

4.3.4 increment方法

4.3.5 get方法

4.3.6 exists方法

4.3.7 delete方法

4.3.8 mutation方法

4.4 批量操作

4.4.1 批量put操作

4.4.2 批量get操作

4.4.3 批量delete操作

4.5 BufferedMutator(可选)

4.6 Scan扫描

4.6.1 用法

4.6.2 缓存

4.7 HBase支持什么数据格式

4.8 总结

第5章 ◄ HBase内部探险 ►

5.1 数据模型

5.2 HBase是怎么存储数据的

5.2.1 宏观架构

5.2.2 预写日志

5.2.3 MemStore

5.2.4 HFile

5.2.5 KeyValue类

5.2.6 增删查改的真正面目

5.2.7 数据单元层次图

5.3 一个KeyValue的历险

5.3.1 写入

5.3.2 读出

5.4 Region的定位

第6章 ◄ 客户端API的高阶用法 ►

6.1 过滤器

6.1.1 过滤器快速入门

6.1.2 比较运算快速入门

6.1.3 分页过滤器

6.1.4 过滤器列表

6.1.5 行键过滤器

6.1.6 列过滤器

6.1.7 单元格过滤器

6.1.8 装饰过滤器

6.1.9 自定义过滤器

6.1.10 如何在hbase shell中使用过滤器

6.2 协处理器

6.2.1 协处理器家族

6.2.2 快速入门

6.2.3 如何加载

6.2.4 协处理器核心类

6.2.5 观察者

6.2.6 终端程序

第7章 ◄ 客户端API的管理功能 ►

7.1 列族管理

7.2 表管理

7.3 Region管理

7.4 快照管理

7.5 维护工具管理

7.5.1 均衡器

7.5.2 规整器

7.5.3 目录管理器

7.6 集群状态以及负载(ClusterStatus & ServerLoad)

7.7 Admin的其他方法

7.8 可见性标签管理

7.8.1 快速入门

7.8.2 可用标签

7.8.3 用户标签

7.8.4 单元格标签

第8章 ◄ 再快一点 ►

8.1 Master和RegionServer的JVM调优

8.1.1 先调大堆内存

8.1.2 可怕的Full GC

8.1.3 Memstore的专属JVM策略MSLAB

8.2 Region的拆分

8.2.1 Region的自动拆分

8.2.2 Region的预拆分

8.2.3 Region的强制拆分

8.2.4 推荐方案

8.2.5 总结

8.3 Region的合并

8.3.1 通过Merge类合并Region

8.3.2 热合并

8.4 WAL的优化

8.5 BlockCache的优化

8.5.1 LRUBlock Cache

8.5.2 SlabCache

8.5.3 Bucket Cache

8.5.4 组合模式

8.5.5 总结

8.6 Memstore的优化

8.6.1 读写中的Memstore

8.6.2 Memstore的刷写

8.6.3 总结

8.7 HFile的合并

8.7.1 合并的策略

8.7.2 compaction的吞吐量限制参数

8.7.3 合并的时候HBase做了什么

8.7.4 Major Compaction

8.7.5 总结

8.8 诊断手册

8.8.1 阻塞急救

8.8.2 朱丽叶暂停

8.8.3 读取性能调优

8.8.4 案例分析

第9章 ◄ 当HBase遇上MapReduce ►

9.1 为什么要用MapReduce

9.2 快速入门

9.3 慢速入门:编写自己的MapReduce

9.3.1 准备数据

9.3.2 新建项目

9.3.3 建立MapReduce类

9.3.4 建立驱动类

9.3.5 打包、部署、运行

9.4 相关类介绍

9.4.1 TableMapper

9.4.2 TableReducer

9.4.3 TableMapReduceUtil

HBase不睡觉书是2018年由清华大学出版社出版,作者杨曦。

得书感谢您对《HBase不睡觉书》关注和支持,如本书内容有不良信息或侵权等情形的,请联系本网站。

购买这本书

你可能喜欢
Python高手修炼之道:数据处理与机器学习实战 电子书
适读人群 :1.没有编程知识的新手 不同于一般的基础语法讲解教程,本书并未将Python 开发限定于某个集成开发工具(IDE)中,而是采用交互式编程的方式来强化读者对语言特性的理解,帮助新手读者真正理解Python 语言和Python 编程。2.从未接触过Python 语言,但了解一点编程知识的初学者 本书通过对基础知识高度的提炼和概括,以避免初学者陷入低级且冗长的细节知识点而心生懈怠;同时,本书为初学者规划了从初级到高级的编程技能提升路线图。3.具有一定基础的Python 程序员 本书可以作为案头工具书来使用。本书从基础语法、基本技能讲起,涵盖了科学计算、数据处理、机器学习等领域,示例代码涉及30 余个模块的使用。 构建从Python入门到数据分析到机器学习的路线图,入门有章可循; 1.讲解独到,常见盲点趣解析 作者基于多年的经验积累,善于总结概括初学Python过程中的误区。 2.内容全面,常用工具全涵盖 书中介绍的Python工具包覆盖Numpy、Matplotlib、Pandas、SciPy、Scikit-Learn,方便读者拓展实用技能、掌握工作利器。 3.拓展训练,重点知识有强化 语感训练100题、Python内置函数(类)手册、从新手到高手的100个模块,强化知识点的掌握。 4.代码完整,随时动手可复现 本书提供了完整、可验证的代码,方便读者动手练习并强化理解。
新基建:数据中心创新之路 电子书
本书旨在帮助读者深入了解行业和技术趋势,推动科研院所对新技术新业务的研究,促进厂商更好地把握市场需求和技术方向。
抖音运营2.0:进阶方法论与实战攻略 电子书
适读人群 :抖音玩家,电商运营者,品牌运营者,营销人员 编辑推荐 抖音已经全面进入2.0时代,电商、直播、Vlog、网红等营销和变现模式不断更新换代。赶上2.0时代的风口红利,只有两个秘诀,一是专注于内容生产,二是深耕垂直领域。本书从“内容”到“流量”再到“营销变现”,提供了一整套抖音2.0时代的进阶方法论,并含有大量的实战案例。不管是抖音玩家、实体店铺,还是品牌运营商,阅读本书,都会获得更多关于布局未来抖音商业生态的全新启发。 内 容 内容定位法则|好内容,先定位 内容生产框架|高质量、高转化内容的五大逻辑 内容价值模型|爆款内容的标准化思路与模板 流 量 精品推荐池|抖音推荐算法大揭秘 裂变涨粉法|涨粉的四大法则 快引流法|抖音矩阵打造 营 销 品牌运营|品牌抖音营销的玩法 精准营销|7种带有营销目的的抖音玩法 强变现|抖音网红的带货宝典
新媒体平台运营实战从入门到精通 电子书
本书结构清晰,内容精炼,适合从事企业营销和新媒体营销的人员使用,可作为院校市场营销类、企业管理类、商务贸易类专业的课程教材。
王牌导购大讲堂:情景演示+错误分析+正确示范(销售高手大讲堂系列) 电子书
专为导购人员量身定制的口才实操指南,教你如何成为一名商品导购的高手。