• DataX学习指南(四) 项目运行


      上篇文章介绍了源码的打包,这篇文章就主要介绍如何将程序运行起来,并实现数据的同步。

      对于DataX程序运行,有两种方式,上文介绍的自定义插件开发并打包运行是比较复杂的一种;

      而相对简单地一种方式就是直接将datax编译后的文件下载下来。DataX下载地址

      下载后解压至本地某个目录,进入bin目录,即可运行同步作业:

    • $ cd  {YOUR_DATAX_HOME}/bin
      $ python datax.py {YOUR_JOB.json}

      自检脚本:    python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json

      一般情况下,我们会用的数据库读写工具包里面都已经编译好,这种情况下,就只要写job.json了。

      程序启动

      

      运行结果。(在时间同步作业中可将同步结果处理入库,这里默认为打印到控制台)

      

    补充

       oracle2pgsql.json上篇文章已经完整提供了。需要注意的一点就是不同数据库的jdbcUrl不一样,在此我简单整理了一下。有需要的同学可以参考下

      另外附上Nosql的默认端口信息

      MongoDB --- 27017
      Redis --- 6379
      Memcached --- 11211
     关于个类数据库的字段映射关系,参考:常见数据库常用数据类型、默认端口

     

      

      

  • 相关阅读:
    python 类函数
    scala 排序
    php基础-面向对象
    PHP基础-常用的数组相关处理函数
    PHP基础-PHP中预定义的超全局数组
    PHP基础-数组
    装饰器
    Python3.x 文件操作练习
    Python3.x 文件操作
    Python3 内置函数
  • 原文地址:https://www.cnblogs.com/JackpotHan/p/16188901.html
Copyright © 2020-2023  润新知