• ambari之hbase数据迁移


    一、hbase原理剖析

    Base是一个构建在HDFS上的分布式列存储系统;
    HBase是基于Google BigTable模型开发的,典型的key/value系统;
    HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储;
    从逻辑上讲,HBase将数据按照表、行和列进行存储。
    与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。
    Hbase表的特点
    大:一个表可以有数十亿行,上百万列;
    无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;
    面向列:面向列(族)的存储和权限控制,列(族)独立检索;
    稀疏:空(null)列并不占用存储空间,表可以设计的非常稀疏;
    数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳;
    数据类型单一:Hbase中的数据都是字符串,没有类型。

    注:网络有三种hbase迁移模式,因群集之间网络不通,采用手动方式迁移

    1、从源HBase集群中复制出HBase数据库表到本地目录。

    su - hdfs 
    hadoop fs -get /apps/hbase/data/data/dpa /本地目录

    2、复制本地目录数据到新群集中本地目录中(scp)

    3、新群集目录导入数据

    su - hdfs 
    hadoop fs -put /本地目录 /apps/hbase/data/data/dpa

    4、新群集中设置权限并修复.META.

    su - hdfs 
    hadoop fs -chmod -R 777 /apps/hbase/data/data/dpa su - hbase
    hbase hbck
    -fixMeta

    注:权限问题整了我两天时间,各种问题搜索、请教高人后无果,查看日志发现(日志观察很重要)

    5、重新分配数据到各RegionServer

    su - hbase 
    hbase hbck -fixAssignments

    PS:此方法优势灵活,安全;其它两种方法未测试,无法做出评价.

  • 相关阅读:
    6.数字三角形
    5.分组背包问题
    1.商品模块表结构分析
    AUTH_USER_MODEL refers to model 'user.User' that has not been installed
    发布品论接口
    查询指定课程评论接口
    1.评论模块表结构
    上传视频课程到七牛云后存储到django后端接口
    5.上传视频到七牛云django端实现
    4.七牛云上传前台页面
  • 原文地址:https://www.cnblogs.com/patrick0715/p/5993338.html
Copyright © 2020-2023  润新知