一、HBase简介
HBase是一个基于Hdfs的、分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
二、HBase基本概念介绍
表:HBase采用表来组织数据,表里横向为行,纵向为列族,一个列族又包含很多列。
行:每个表由若干行组成,每行由行键来标识。
列族:表的纵向被分成许多列族,是基本的访问控制单元。
列:列族通过列限定符(列)来定位。
单元格:由行和列来定位单元格,单元格数据没有数据类型。
时间戳:每一个单元格都保存着同一份数据的多个版本,这些版本通过时间戳进行索引。若要进行修改,并不会覆盖旧的数据,而是新生成一份数据及时间戳,指针指向新的时间戳多对应的数据。