HBase学习

总结:

HBase是一个分布式的数据库
主要作用: 海量数据的存储和海量数据的准实时查询

一、HBase的应用场景

应用场景交通、金融、电商、移动

HBase特点 (重点): 针对特点去思考容量大(针对TB级别的数据,千万起步) 列式存储(根据数据自动增加列),建表时不需要指定列多版本(针对具体列,进行管理) 扩展性(在分布式文件系统,不需要停掉集群,可在集群中动态的添加节点,就可以增加存储空间) 稀疏性(节省空间) 高性能(读性能,写性能) 指定列,去读写高可靠性(副本数,通过日志信息)进行数据的恢复

二、HBase的定义和定位

官方对于HBase的概念描述 Hadoop生态系统中对于HBase的定位

三、HBase的架构体系和设计模型

服务架构体系 1) HBase的主要进程: master(管理regionserver) regionserver(向master发送心跳,管理region) 2) HBase所依赖的两个外部的服务: zookeeper HDFS

设计模型 1) 表结构 2) 表数据

四、HBase的安装部署

HBase的部署前置条件 1) JDK1.7 以上版本 2) Hadoop 2.5.x 以上的版本 3) Zookeeper 3.4.x 以上的版本 (对于zookeeper的部署,都是集群的,基本都是三台以上)

五、HBase shell

DDL操作 create describe list disable enable drop is_enabled is_disabled ... DML操作 put get delete count scan ...

  start-hbase.sh        先启动hbase 
    hbase shell         进入hbase 命令行
    
    
    Hbase表操作命令介绍并演示  DML

    create      创建表     create 'test','info'.  指定表名和列族名
    describe    列出表的详细信息
    drop        先把表禁用了,才可以进行删除
    list        列出所有表

    enable      启用表
    disable     禁用表
    is_enabled  列出可用的表
    is_disable  不可用的表


    HBase表数据操作命令介绍并演示. DDL
        
    count.      求和      count 'test'    对行就和
    delete      删除  delete 'test' ,'0001','info:age'
    get         获取      get 'test' ,'0001','info:username'
    put         插入  put 'test','0001','info:age','30'
    scan        扫描      scan 'test'
    truncate    组合.  删除后,在创建,就是表的初始化.   truncate 'test'

相关阅读:
2.2 范式和反范式
1.7 关系数据库设计理论
2.1 选择优化的数据类型
1.6 间隙锁（next-key locking）
1.5 MySQL的存储引擎
1.4 多版本并发控制
1.3 事物和并发一致性问题
1.2 并发控制
1.1 MySQL逻辑架构
php自定义函数及内部函数----数组处理函数

原文地址：https://www.cnblogs.com/suixingc/p/hbase.html