• DataX部署安装


    一、准备
    系统环境:Windows Server 2008
    Python2.7.14.msi
    datax.tar.gz
    二、安装
    Python


    打开cmd,输入python回车进行测试
    DataX
    解压datax.tar.gz到指定文件夹。
    三、配置
    JOB
    到D:dataxjob创建*.json文件,配置需要进行数据抽取的表
    {
        "job":{
            "content":[
                {
                    "reader":{
                        "parameter":{
                            "password":"phisphis",
                            "connection":[
                                {
                                    "querySql":[
                                        "select PERSON_NAME, HOUSEHOLD_TYPE, ADDR_AREA from phis.EHR_BASE where ID > $stID"
                                    ],
                                    "jdbcUrl":[
                                        "jdbc:db2://172.16.19.116:50000/phis"
                                    ]
                                }
                            ],
                            "username":"phis2"
                        },
                        "name":"db2reader"
                    },
                    "writer":{
                        "parameter":{
                            "password":"123456",
                            "column":[
                                "`PERSON_NAME`",
                                "`HOUSEHOLD_TYPE`",
                                "`ADDR_AREA`"
                            ],
                            "connection":[
                                {
                                    "jdbcUrl":"jdbc:mysql://11.105.26.130:3306/gw?useUnicode=true&characterEncoding=utf-8",
                                    "table":[
                                        "EHR_BASE"
                                    ]
                                }
                            ],
                            "writeMode":"replace",
                            "batchSize":1000,
                            "username":"root"
                        },
                        "name":"mysqlwriter"
                    }
                }
            ],
            "setting":{
                "speed":{
                    "byte":1048576
                }
            }
        }
    }
    BAT脚本
    创建D:dataxat目录,在目录下创建bat脚本
    @echo off
    setlocal enabledelayedexpansion
    set TITLE=EHR_BASE
    cd bin
    (
      echo use gw;
      echo select ID from EHR_BASE order by ID desc LIMIT 1;
    ) | mysql -uroot -p123456 >EHR_BASE.txt
    set line=
    rem stID是变量,获取前置机gw数据库中最大的ID,如果DB2数据库中ID>stID,则抽取大余stID的数据
    set stID=
    for /f "tokens=1" %%i in (EHR_BASE.txt) do (
    set /a line+=1
    if !line!==2 set stID=%%i
    )
    set /a stID+=0
    set p=" -DstID=%stID%"
    :0
    rem 下面是暂停5分钟之后再继续执行的命令
    ping -n 300 127.0.0.1>nul
    rem 下面是python调用datax中的job进行抽数的命令
    python D:dataxindatax.py -p %p% D:dataxjobEHR_BASE.json && goto 0
    四、运行
    双击编辑好的bat脚本,开始运行

  • 相关阅读:
    [转]解读Unity中的CG编写Shader系列4——unity中的圆角矩形shader
    [转]解读Unity中的CG编写Shader系列5——理论知识
    [转]解读Unity中的CG编写Shader系列3——表面剔除与剪裁模式
    [转]解读Unity中的CG编写Shader系列二
    [转]解读Unity中的CG编写Shader系列1——初识CG
    使用 GPU 加速计算
    [转] Draw Call未被批处理?告诉你在Unity 5.6中如何查找原因 [复制链接]
    程序员,如何从平庸走向理想?
    SDUT-2122_数据结构实验之链表七:单链表中重复元素的删除
    SDUT-2121_数据结构实验之链表六:有序链表的建立
  • 原文地址:https://www.cnblogs.com/Memories-off/p/10435613.html
Copyright © 2020-2023  润新知