• HBase数据的导入和导出


    查阅了几篇中英文资料,发现有的地方说的不是很全部,总结在此,共有两种命令行的方式来实现数据的导入导出功能,即备份和还原。

    1 HBase本身提供的接口
    其调用形式为:
    1)导入
    ./hbase org.apache.hadoop.hbase.mapreduce.Driver import 表名    数据文件位置
    其中数据文件位置可为本地文件目录,也可以分布式文件系统hdfs的路径。
    当其为前者时,直接指定即可,也可以加前缀file:///
    而当其伟后者时,必须明确指明hdfs的路径,例如hdfs://mymaster:9000/path
    2)导出
    ./hbase org.apache.hadoop.hbase.mapreduce.Driver export 表名    数据文件位置
    同上,其中数据文件位置可为本地文件目录,也可以分布式文件系统hdfs的路径。
    另外,该接口类还提供了一些其它的方法,例如表与表之间的数据拷贝,导入tsv文件等,可回车键查看
    2 hadoop提供的工具(hadoop tool interface)

    使用该工具的话,需要首先配置hadoop-env.sh,否则在执行时会提示缺少jar包或者class文件。
    1)配置
    切换到hadoop安装目录下,
    vim hadoop-env.sh,加以下语句
    export HADOOP_CLASSPATH="hbasejar包路径:zookeeper的jar包路径:hbase的config目录"
    2)使用
      导入:
      hadoop jar /../hbase/hbase-*.jar import mytest /export/mybakup
     导出:
      hadoop jar /../hbase/hbase-*.jar import mytest /import/mybackup
     直接将数据导出到hdfs目录中,当不指定file前缀时。

    另外: 
    export,fs的参数为hdfs上的路径时,该路径必须不能已经存在,否则会报错。
    import的表必须是hbase中已经创建好的,否则会报错。
  • 相关阅读:
    阿里云Centos7安装和启动nginx
    mysql安装配置、主从复制配置详解
    php 文件大小计算转换
    tp5.0 生成二维码 + 合并海报图
    iTerm2 + Oh My Zsh
    linux 安装 卸载 命令
    php两个时间日期相隔的天数,时,分,秒.
    PhpStorm下载 + 破解
    php 地区三级联动
    PhpSpreadsheet 引入类库 导出 excel
  • 原文地址:https://www.cnblogs.com/1130136248wlxk/p/5141559.html
Copyright © 2020-2023  润新知