Kettle作用
Kettle是一种ETL(抽取,加载,转换)工具,使用图形界面的方式进行数据转换。
Kettle安装
安装下载Kettle 下载路径:
http://community.pentaho.com/projects/data-integration/
下载pdi-ce-6.1.0.1-196.zip
建议不要使用最新版本的包
Kettle使用:
解压上述的资源包,启动Spoon.bat文件。
启动可能出错:
解决方法:
Ketttle的Spoon脚本中,默认是PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m"。而2048是超过32bit的最大值,将PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m"。
Kettle用过的术语
Sqoon:kettle的设计器
Kettle使用:
连接数据库:
会出现的问题:提示连接数据库加载驱动失败或者连接失败
Kettle默认是没有mysql数据库jar包的,需要添加Mysql驱动jar包 添加位置:pdi-ce-6.1.0.1-196data-integrationlib和pdi-ce-6.1.0.1-196data-integrationData Service JDBC Driver目录下。Oracle的jar包同理
遇到的问题,在转化的过程中,如果数据源的数据存在空值,转换失败,解决方法如下:
在D:Usersex-hudashu.kettle目录中找到kettle.properties文件,增加:
KETTLE_EMPTY_STRING_DIFFERS_FROM_NULL=Y
重启Kettle