kettle教程(⼀):简介及⼊门
介绍
kettle 是纯 java 开发,开源的 ETL⼯具,⽤于数据库间的数据迁移 。可以在 Linux、windows、unix 中运⾏。有图形界⾯,也有命令脚本还可以⼆次开发。
安装
这边以 windows 下的配置为例,linux 下配置类似。
jdk 安装及配置环境变量
由于 kettle 是基于 java 的,因此需要安装 java 环境,并配置 JAVA_HOME 环境变量。
建议安装 JDK1.8 及以上,7.0以后版本的 kettle 不⽀持低版本 JDK。
下载 kettle
从 官⽹ 下载 kettle ,解压到本地即可。
下载相应的数据库驱动
由于 kettle 需要连接数据库,因此需要下载对应的数据库驱动。
例如 MySQL 数据库需要下载 mysql-connector-java.jar,oracle 数据库需要下载 ojdbc.jar。下载完成后,将 jar 放⼊ kettle 解压后路径的 lib ⽂件夹中即可。
注意:本⽂基于 pdi-ce-7.0.0.0-25 版本进⾏介绍,低版本可能有区别。
启动
双击 Spoon.bat 就能启动 kettle 。
转换
转换包括⼀个或多个步骤,步骤之间通过跳(hop)来连接。跳定义了⼀个单向通道,允许数据从⼀个步骤流向另⼀个步骤。在Kettle中,数据的单位是⾏,数据流就是数据⾏从⼀个步骤到另⼀个步骤的移动。
1、打开 kettle,点击⽂件->新建->转换。
2、在左边 DB 连接处点击新建。
3、根据提⽰配置数据库,配置完成后可以点击测试进⾏验证,这边以 MySQL 为例。
4、在左侧到表输⼊(核⼼对象->输⼊->表输⼊),拖到右⽅。
mysql下载jar包5、双击右侧表输⼊,进⾏配置,选择数据源,并输⼊ SQL。可以点击预览进⾏预览数据。
6、在左侧到插⼊/更新(核⼼对象->输出->插⼊/更新),拖到右⽅。
7、按住 Shift 键,把表输⼊和插⼊/更新⽤线连接起来。
8、双击插⼊/更新进⾏配置。
9、点击运⾏,就可以运⾏这⼀个转换。
10、运⾏结束后,我们可以在下⽅看到运⾏结果,其中有⽇志,数据预览等,我们可以看到⼀共读取了多少条数据,插⼊更新了多少数据等等。
这样就完成了⼀个最简单的转换,从⼀个表取数据,插⼊更新到另⼀个表。
作业
如果想要定时运⾏这个转换,那么就要⽤到作业。
1、新建⼀个作业。
2、从左侧依次拖动 START 、转换、成功到右侧,并⽤线连接起来。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论