• pentaho data-integration(kettle) 资源库备份


    网上抄来的,验证过,好用,哈哈

    https://blog.csdn.net/zhoujianfeng3/article/details/53667327?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-2.control

    pentaho data-integration (又称kettle ,后面简称PDI )关于资源库备份这块有很多方法,将我有用到的几种方法分享给大家。

    1. 如果资源库是保存在传统数据库中,如mysql、oracle等,可直接备份资源库相关的几张表。(把整个数据库或者scheme的对应数据库备份成文件)

    2. 不定时手动导出资源库,把数据库类型的资源库导出来成文本类型资源库。(常见情况就是把公司资源库作业导出道本机)

    3. 使用PDI 作业中自带的组件进行自动导出。

    前面两种就不介绍了,重点讲下第三种方式。

    打开 PDI 工具界面,创建 一个 JOB ,然后在 JOB 的组件中选中 ‘导出资源库倒xml文件’,如下

     

    这个组件中,导出支持多种形式,你可以导出整个资源库文件,也可以导出某一个文件夹的文件,亦或者某个单独文件。我这测试导出某个文件夹的文件。如下

    然后运行这个job ,就可以生成一个资源库文件了。文件内容如下

    <?xml version="1.0" encoding="UTF-8"?>
    <repository>


    <transformations>
    <transformation>
      <info>
        <name>ktr_field_test_dealing</name>
        <description/>
        <extended_description/>
        <trans_version/>
        <trans_type>Normal</trans_type>
        <trans_status>0</trans_status>
        <directory>&#x2f;</directory>
        <parameters>
        </parameters>

    这个一个xml格式的内容。然后使用PDI 中的资源库导入功能导入即可。

    导入功能:   工具-》资源库-》导入资源库  (后面具体的操作我就不细述了)

    导入之前,我的资源库文件目录如下:

    导入之后我的资源库文件目录如下

  • 相关阅读:
    centos7 主从dns配置 bind服务
    Linux的启动流程
    shell脚本编程数组
    shell脚本编程进阶
    计划任务
    进程管理
    Linux网络配置
    计算机网络基础
    磁盘存储和文件系统
    软件包管理
  • 原文地址:https://www.cnblogs.com/gina11/p/14331289.html
Copyright © 2020-2023  润新知