• Sqoop一些常用命令及参数


    常用命令列举

    这里给大家列出来了一部分Sqoop操作时的常用参数,以供参考,需要深入学习的可以参看对应类的源代码。

    命令&参数详解

    首先来我们来介绍一下公用的参数,所谓公用参数,就是大多数命令都支持的参数。

    导入>import

     命令&参数:import

      将关系型数据库中的数据导入到HDFS(包括HiveHBase)中,如果导入的是Hive,那么当Hive中没有对应表时,则自动创建。

     command:

    导入数据到hive中 :

    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop002:3306/company 
    --username root 
    --password root
    --table tableName 
    --hive-import

    >增量导入数据到hive中,mode=append

    append导入:
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop002:3306/test
    --username root 
    --password root
    --table students
    --num-mappers 1 
    --fields-terminated-by "	" 
    --target-dir /user/hive/warehouse/t_students 
    --check-column id 
    --incremental append 
    --last-value 3

    说明: append不能与--hive-等参数同时使用(Append mode for hive imports is not yet supported. Please remove the parameter --append-mode)

    >增量导入数据到hdfs中,mode=lastmodified

    先在mysql中建表并插入几条数据:
    mysql> create table test.students(id int(4), name varchar(255), sex varchar(255), last_modified timestamp DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP);
    mysql> insert into test.students (id, name, sex) values(1, 'jack', 'man');
    mysql> insert into test.students(id, name, sex) values(2, 'tom', 'man');
    先导入一部分数据:
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop002:3306/test 
    --username root 
    --password root 
    --table students 
    --delete-target-dir 
    --m 1
    再增量导入一部分数据:
    mysql> insert into test.students (id, name, sex) values(3, 'jms', 'women');
    $ bin/sqoop import 
    --connect jdbc:mysql://hadoop002:3306/test 
    --username root 
    --password root
    --table test.students
    --check-column last_modified 
    --incremental lastmodified 
    --last-value "2020-05-28 12:22:32" 
    --m 1 
    --append

    说明: 使用lastmodified方式导入数据要指定增量数据是要--append(追加)还是要--merge-key(合并)

    parameters:

     导出>export

     

    命令&参数:export

      从HDFS(包括HiveHBase)中奖数据导出到关系型数据库中。

    command :

    $ bin/sqoop export 
    --connect jdbc:mysql://hadoop002:3306/test 
    --username root 

    --password root

    --table students

    --export-dir /user/test/students

    --input-fields-terminated-by " "

    --num-mappers 1

    parameters:

     

    使用hive是常用的函数:

  • 相关阅读:
    ios8消息快捷处理——暂无输入框
    animateWithDuration 动画的速度选择
    对网页进行修改js代码
    如何对网页进行长截图
    centos快速配置yum源
    No module named 'Crypto.PublicKey' 完美解决办法
    Virtualenv 环境配置
    Python逻辑运算符的本质
    Django 使用Contenttype组件创建多关联数据库表
    Django Rest Framework url注册器组件 | 响应器组件 | 分页器组件
  • 原文地址:https://www.cnblogs.com/linbo3168/p/14170386.html
Copyright © 2020-2023  润新知