一、了解hbase的存储体系。
hbase的存储体系核心的有Split机制,Flush机制和Compact机制。
1、split机制
每一个hbase的table表在刚刚开始的时候,只有一个region,随着数据的不断插入到表中,region开始增大,当增大到一定的阀值以后,region就会等分两个新的region。
当table表中的行数越多,就会有越来越多的region。
region是hbase中分布式存储和负载均衡的最小单元,相当于HDFS中的block。
2、Flush机制
HStore存储是HBase存储的核心,其中由两部分组成,MemStore和StoreFiles。MemStore是Sorted Memory Buffer,
用户写入的数据首先会写入MemStore,就返回了,所以写性能很高。当MemStore满了以后会Flush成一个StoreFile。
3、Compact机制
当StoreFile文件数量增长到一定阈值,会触发Compact合并操作,将多个StoreFiles合并成一个StoreFile,合并过程中会对Cell进行版本合并和数据删除。