• HBase(基于HDFS)的使用


    补充:使用secure CRT操作hbase

    (一)修改secureCRT配置环境

    (二)使用hbase,查看所有命令

    一:create建表(创建user表,包括base_info、extra_info两个列族)

    create 'user',{NAME=>'base_info',VERSIONS=>3},{NAME=>'extra_info'}

    可以使用list命令查看所有数据表: 

    可以使用describe命令,查看数据表结构:

    二:数据表的删除drop 

     注意在删除表之前,需要先使得表状态为disable

    三:向表中插入数据

    向user表中插入信息,row key为rk0001,列族base_info中添加name列标示符,值为zhangsan

    put 'user', 'rk0001', 'base_info:name', 'zhangsan'

    向user表中插入信息,row key为rk0001,列族base_info中添加gender列标示符,值为female

    put 'user', 'rk0001', 'base_info:gender', 'female'

    向user表中插入信息,row key为rk0001,列族base_info中添加age列标示符,值为20

    put 'user', 'rk0001', 'base_info:age', 20

    向user表中插入信息,row key为rk0001,列族extra_info中添加pic列标示符,值为picture

    put 'user', 'rk0001', 'extra_info:pic', 'picture'

    四:get获取表数据

    (一)获取user表中row key为rk0001的所有信息

    get 'user', 'rk0001'

    (二)获取user表中row key为rk0001,base_info列族的所有信息

    get 'user', 'rk0001', 'base_info'

    (三)获取user表中row key为rk0001,base_info列族的name、age列标示符的信息

    get 'user', 'rk0001', 'base_info:name', 'base_info:age'

    (四)获取user表中row key为rk0001,base_info、extra_info列族的信息

    get 'user', 'rk0001', 'base_info', 'extra_info'
    get 'user', 'rk0001', {COLUMN => ['base_info', 'extra_info']}
    
    get 'user', 'rk0001', {COLUMN => ['base_info:name', 'extra_info:pic']}

    (五)获取user表中row key为rk0001,列族为base_info,版本号最新5个的信息

    get 'user', 'rk0001', {COLUMN => 'base_info', VERSIONS => 2}
    get 'user', 'rk0001', {COLUMN => 'base_info:name', VERSIONS => 5}
    get 'user', 'rk0001', {COLUMN => 'base_info:name', VERSIONS => 5, TIMERANGE => [xxx时间戳, xxx时间戳]}

    五:条件查询 

    (一)ValueFilter值过滤---获取user表中row key为rk0001,cell的值包含zh的信息

    get 'user', 'rk0001', {FILTER => "ValueFilter(=, 'substring:zh')"}

    (二)QualifierFilter键过滤---获取user表中row key为rk0001,列标示符中含有a的信息

    get 'user', 'rk0001', {FILTER => "(QualifierFilter(=,'substring:a'))"}

    (三)ValueFIlter值过滤,使用=进行值查询时:注意数据存储是按照二进制存储,所有使用binary 

    put 'user', 'rk0002', 'base_info:name', 'fanbingbing'
    put 'user', 'rk0002', 'base_info:gender', 'female'
    put 'user', 'rk0002', 'base_info:nationality', '中国'
    get 'user', 'rk0002', {FILTER => "ValueFilter(=, 'binary:中国')"}

    六:Scan查询操作 

    会一块查询HLog中的数据

    (一)查询user表中的所有信息

    scan 'user'

    (二)查询user表中列族为base_info的信息

    scan 'user', {COLUMNS => 'base_info'}
    scan 'user', {COLUMNS => 'base_info', RAW => true, VERSIONS => 5}

    (三)查询user表中列族为base_info和extra_info的信息

    scan 'user', {COLUMNS => ['base_info', 'extra_info']}
    scan 'user', {COLUMNS => ['base_info:name', 'extra_info:pic']}

    (四)查询user表中列族为base_info、列标示符为name的信息

    scan 'user', {COLUMNS => 'base_info:name'}

    (五)查询user表中列族为base_info、列标示符为name的信息,并且版本最新的5个

    scan 'user', {COLUMNS => 'base_info:name', VERSIONS => 5}

     注意:scan查询版本时,有时可以比get多查询出一个。因为我们新写入的数据存放在HLog中,没有写入HFile中,所以scan将数据全部获取,get只获取3个最新版本

    (六)查询user表中列族为base_info和extra_info且列标示符中含有a字符的信息

    scan 'user', {COLUMNS => ['base_info', 'extra_info'], FILTER => "(QualifierFilter(=,'substring:a'))"}

    (七)查询user表中列族为base_info,rk范围是[rk0001, rk0003)的数据

    scan 'user', {COLUMNS => 'base_info', STARTROW => 'rk0001', ENDROW => 'rk0003'}

    (八)查询user表中row key以rk字符开头的

    scan 'user',{FILTER=>"PrefixFilter('rk')"}

    (九)查询user表中指定范围的数据

    scan 'user', {TIMERANGE => [xxx时间戳, xxx时间戳]}

    七:数据修改 

    (一)delete删除数据

    删除user表row key为rk0001,列标示符为base_info:name,timestamp为1583222243421的数据

    delete 'user', 'rk0001', 'base_info:name', 1583222243421

    删除user表row key为rk0001,列标示符为base_info:name的数据

    delete 'user', 'rk0001', 'base_info:name'

    (二)清空user表中的数据

    truncate 'user'

    (三)修改表结构---添加列族

    首先停用user表(新版本不用)

    disable 'user'

    添加两个列族f1和f2

    alter 'user', NAME => 'f1'
    alter 'user', NAME => 'f2'

    启用表

    enable 'user'

    (四)修改表结构---删除列族

    ###disable 'user'(新版本不用)

    删除一个列族:

    alter 'user', NAME => 'f1', METHOD => 'delete' 或 alter 'user', 'delete' => 'f1'

    添加列族f1同时删除列族f2

    alter 'user', {NAME => 'f1'}, {NAME => 'f2', METHOD => 'delete'}

    将user表的f1列族版本号改为5

    alter 'user', NAME => 'info', VERSIONS => 5

    启用表

    enable 'user'
  • 相关阅读:
    解决GitHub下载速度太慢的问题
    java监测硬盘空间大小
    @SuppressWarnings注解用法详解
    No goals have been specified for this build.
    java新建excel文件导出(HSSFWorkbook)
    mysql日志文件路径
    获取select框下option所有值
    jquery获取select选中的值
    mysql查看查询缓存是否启用
    Kafka消息重新发送
  • 原文地址:https://www.cnblogs.com/ssyfj/p/12402988.html
Copyright © 2020-2023  润新知