KETTLE有三大块:
Spoon:转换/工作(transform/job)设计工具,主要是GUI方式。
Kitchen:工作(job)执行器,是一个作业执行引擎,通过命令行的方式带参数执行,参数说明如下:
-rep:Repositoryname 任务包所在存储名
-user:Repositoryusername 执行人
-pass:Repositorypassword 执行人密码
-job:Thenameofthejobtolaunch 任务包名称
-dir:Thedirectory(don’tforgettheleading/or)
-file:Thefilename(JobXML)tolaunch
-level:Thelogginglevel(Basic,Detailed,Debug,Rowlevel,Error,Nothing)指定日志级别
-log:Theloggingfiletowriteto 指定日志文件
-listdir:Listthedirectoriesintherepository 列出指定存储中的目录结构。
-listjobs:Listthejobsinthespecifieddirectory 列出指定目录下的所有任务
-listrep:Listthedefinedrepositories 列出所有的存储
-norep:Don’tlogintotherepository 不写日志
Span:转换(transform)执行器,是一个转换执行引擎,通过命令行的方式带参数执行,参数说明如下:
-version 显示版本信息
-file=filename 运行 xml 文件
-param:key=value 指定命名参数
-log=logging filename 设置日志文件
-level=logging level 设置日志级别,日志级别参数有:
Error:只显示错误
Nothing:不显示任何输出
Minimal:只使用最少的记录
Basic:这是默认的基本日志记录级别
Detailed:详细的日志输出
Debug:以调试为目的,非常详细的输出
Rowlevel:使用行级记录,会产生大量的数据
使用windows设置计划任务来定期执行KETTLE的JOB作业进行数据的全库更新
新建一个bat脚本来执行Kitchen.bat,通过Kitchen在执行对应的作业文件,设置日志格式和保存日志路径
bat代码如下:
cd E:pdi-ce-7.1.0.0-12data-integration kitchen.bat /file E:cfjkettle_demojob0816.kjb /level Detailed /logfile E:cfjkettle_demo est.log
注意:如果任务本身设置的日志输出的地方(也就是说在图形化界面里面job0816.kjb已经勾选了日志,并且设置了日志存储的地方 )那么不会往bat文件中设置的日志地址输出日志。
windows10 设置任务计划
1 创建基本任务
注意:起始于:一定要标注,否则可能导致任务执行不成功,找不到路径
2 等待任务运行