• sqoop


    官网

    http://sqoop.apache.org/

    简介

    Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中 

    安装

    官方安装地址:http://sqoop.apache.org/docs/1.99.7/admin/Installation.html#server-installation

    sqoop由两个部分组成,SeverClient
    Server: 在集群中的某个节点安装,它是客户端的入口
    Client:可以被安装在任何地方

    Server端安装

    1、下载包:sqoop-1.99.7-bin-hadoop200.tar.gz,注意下载带bin的不要下载源码包
    2、解压sqoop安装包

    tar -zxvf sqoop-1.99.7-bin-hadoop200.tar.gz -C apps/

    3、重命名:

    mv sqoop-1.99.7-bin-hadoop200/ sqoop

    4、hadoop依赖配置,设置HADOOP_HOME环境变量即可

    export HADOOP_HOME=/home/hadoop/apps/hadoop
    source /etc/profile

    5、hadoop配置,在hadoop core-site.xml中添加支持代理用户机制,主要是添加一下两个属性hadoop.proxyuser.$SERVER_USER.hosts和 hadoop.proxyuser.$SERVER_USER.groups,$SERVER_USER就是我们启动sqoop的用户(hadoop),一般值设置为*即可

    <property>
    <name>hadoop.proxyuser.hadoop.hosts</name>
    <value>*</value>
    </property>
    <property>
    <name>hadoop.proxyuser.hadoop.groups</name>
    <value>*</value>
    </property>

    配置好后,分发到其他的节点
    scp core-site.xml m2:$PWD
    scp core-site.xml m3:$PWD
    4、第三方jar的支持,创建一个目录,里面存放第三方jar,然后配置环境变量SQOOP_SERVER_EXTRA_LIB指向它

    mkdir extlib
    export SQOOP_SERVER_EXTRA_LIB=/home/hadoop/apps/sqoop/extlib
    source /etc/profile

    5、添加bin目录到系统环境变量中

    export PATH=/home/hadoop/apps/sqoop/bin:$PATH
    source /etc/profile

    6、配置Server,配置文件在conf目录下,根据具体情况进行调整,此处修改sqoop.properties中org.apache.sqoop.submission.engine.mapreduce.configuration.directory,指定为具体的hadoop安装目录下的配置文件目录

    org.apache.sqoop.submission.engine.mapreduce.configuration.directory=/home/hadoop/apps/hadoop/etc/hadoop

    7、校验配置是否正确,使用如下的命令

    sqoop2-tool verify

    8、初始化,第一次启动的时候需要初始化,使用下面的命令进行初始化

    sqoop2-tool upgrade

    9、启动服务器

    sqoop2-server start

    10、停止服务器

    sqoop2-server stop

    Client端安装

    客户端安装,拷贝安装包到其他机器即可,同时拷贝环境变量文件/etc/profile

    source /etc/profile

    启动客户端
    sqoop2-shell

  • 相关阅读:
    Oracle-11g ASM Fast Mirror Resync特性
    Oracle
    Oracle-19C中的DML重定向(DML Redirection)
    Oracle-重建oraInventory仓库
    Oracle-输出存储在ASM中当前数据库客户端未打开的文件列表
    Oracle-19c特性之刷新数据库缓存中的密码文件信息
    Oracle-DG环境进行failover故障演练
    Oracle-switchover转换DG角色
    论衡中校长郗会锁儿子高考移民西藏事件反映出的诸多问题
    退役后记:春夏篇
  • 原文地址:https://www.cnblogs.com/heml/p/6085591.html
Copyright © 2020-2023  润新知