win10 安装DataX
1.资源准备
2.环境变量配置(以自己安装目录为准)
3.在cmd窗口中输入CHCP 65001 防止中文乱码
4.测试(从stream读取数据并打印到控制台)
1.资源准备
JDK1.8
Python2.7
DataX(点击下载)
2.环境变量配置(以自己安装目录为准)
%DATAX_HOME%in
D:Program FilesPython27
D:Program FilesJavajdk1.8.0_131in
3.在cmd窗口中输入CHCP 65001 防止中文乱码
书写配置文件
文件名:stream2stream.json
内容如下:
{
"job": {
"content": [
{
"reader": {
"name": "streamreader",
"parameter": {
"sliceRecordCount": 10,
"column": [
{
"type": "String",
"value": "helle DataX"
},
{
"type": "string",
"value": "你吃完晚饭了吗?"
},
{
"type": "string",
"value": "不要在写代码了,太累了"
}
]
}
},
"writer": {
"name": "streamwriter",
"parameter": {
"encoding": "GBK",
"print": true
}
}
}
],
"setting": {
"speed": {
"channel": 5
}
}
}
}
c.执行配置文件
python datax.py ..json