上篇文章介绍了源码的打包,这篇文章就主要介绍如何将程序运行起来,并实现数据的同步。
对于DataX程序运行,有两种方式,上文介绍的自定义插件开发并打包运行是比较复杂的一种;
而相对简单地一种方式就是直接将datax编译后的文件下载下来。DataX下载地址
下载后解压至本地某个目录,进入bin目录,即可运行同步作业:
-
$ cd {YOUR_DATAX_HOME}/bin $ python datax.py {YOUR_JOB.json}
自检脚本: python {YOUR_DATAX_HOME}/bin/datax.py {YOUR_DATAX_HOME}/job/job.json
一般情况下,我们会用的数据库读写工具包里面都已经编译好,这种情况下,就只要写job.json了。
程序启动
运行结果。(在时间同步作业中可将同步结果处理入库,这里默认为打印到控制台)
补充
oracle2pgsql.json上篇文章已经完整提供了。需要注意的一点就是不同数据库的jdbcUrl不一样,在此我简单整理了一下。有需要的同学可以参考下
另外附上Nosql的默认端口信息
MongoDB --- 27017
Redis --- 6379
Memcached --- 11211
关于个类数据库的字段映射关系,参考:常见数据库常用数据类型、默认端口