1.什么是Sqoop
Sqoop是sql-to-hadoop 的部分单词字母汇总.它是作为Hadoop(广义,包括但不限于HDFS)与结构化存储(RDBMS),相互的导入导出桥梁.
Sqoop是Apache的顶级项目,所以其有独立官网 http://sqoop.apache.org/
Sqoop有两大版本 1.4.x(Sqoop1) 和 1.99.x(Sqoop2) (这是两大不兼容版本,具体区别请自行了解),一般使用的还是Sqoop1
2.部署
解压 # tar -xzvf ~/software/sqoop-1.4.6-cdh5.7.0.tar.gz -C ~/app/
配置环境变量 # vi ~/.bash_profile
export SQOOP_HOME=/home/hadoop/app/sqoop-1.4.6-cdh5.7.0
export PATH=$SQOOP_HOME/bin:$PATH
Sqoop配置文件
# cp /home/hadoop/app/sqoop-1.4.6-cdh5.7.0/conf/sqoop-env-template.sh /home/hadoop/app/sqoop-1.4.6-cdh5.7.0/conf/sqoop-env.sh
# vi /home/hadoop/app/sqoop-1.4.6-cdh5.7.0/conf/sqoop-env.sh
修改如下:
export HADOOP_COMMON_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0
export HADOOP_MAPRED_HOME=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0
export HIVE_HOME=/home/hadoop/app/hive-1.1.0-cdh5.7.0
export HADOOP_CLASSPATH=/home/hadoop/app/hive-1.1.0-cdh5.7.0/lib/*
如果使用Hive ,拷贝Hive的配置
cp ~/app/hive-1.1.0-cdh5.7.0/conf/hive-site.xml ~/app/sqoop-1.4.6-cdh5.7.0/conf/hive-site.xml
放入需要的数据库驱动包至lib文件夹
Mysql驱动等