Kettle的安装及简单使⽤Kettle的安装及简单使⽤
⽬录
⼀、kettle概述
1、什么是kettle
Kettle是⼀款开源的ETL⼯具,纯java编写,可以在Window、Linux、Unix上运⾏,绿⾊⽆需安装,数据抽取⾼效稳定。
2、Kettle⼯程存储⽅式
(1)以XML形式存储
(2)以资源库⽅式存储(数据库资源库和⽂件资源库)
3、Kettle的两种设计
4、Kettle的组成
5、kettle特点
⼆、kettle安装部署和使⽤
Windows下安装
(1)概述
在实际企业开发中,都是在本地环境下进⾏kettle的job和Transformation开发的,可以在本地运⾏,也可以连接远程机器运⾏(2)安装步骤
1、安装jdk
2、下载kettle压缩包,因kettle为绿⾊软件,解压缩到任意本地路径即可
3、双击Spoon.bat,启动图形化界⾯⼯具,就可以直接使⽤了
案例1:MySQL to MySQL
把stu1的数据按id同步到stu2,stu2有相同id则更新数据
1、在mysql中创建testkettle数据库,并创建两张表
create database testkettle;
use testkettle;
create table stu1(id int,name varchar(20),age int);
create table stu2(id int,name varchar(20));
2、往两张表中插⼊⼀些数据
insert into stu1 values(1001,'zhangsan',20),(1002,'lisi',18), (1003,'wangwu',23);
insert into stu2 values(1001,'wukong');
3、把pdi-ce-8.2.0.0-342.zip⽂件拷贝到win环境中指定⽂件⽬录,解压后双击Spoon.bat,启动图形化界⾯⼯具,就可以使⽤了
主界⾯:
在kettle中新建转换--->输⼊--->表输⼊-->表输⼊双击
在data-integration\lib⽂件下添加mysql驱动
在数据库连接栏⽬点击新建,填⼊mysql相关配置,并测试连接
建⽴连接后,选择刚刚建好的连接,填⼊SQL,并预览数据:
以上说明stu1的数据输⼊ok的,现在我们需要把输⼊stu1的数据同步到stu2输出的数据
注意:拖出来的线条必须是深灰⾊才关联成功,若是浅灰⾊表⽰关联失败
转换之前,需要做保存
执⾏成功之后,可以在mysql查看,stu2的数据
mysql> select * from stu2;
hbase应用案例+------+----------+
| id  | name    |
+------+----------+
| 1001 | zhangsan |
| 1002 | lisi    |
| 1003 | wangwu  |
+------+----------+
3 rows in set (0.00 sec)
案例2:使⽤作业执⾏上述转换,并且额外在表stu2中添加⼀条数据
1、新建⼀个作业
2、按图⽰拉取组件
3、双击Start编辑Start
4、双击转换,选择案例1保存的⽂件
5、在mysql的stu1中插⼊⼀条数据,并将stu2中id=1001的name改为wukong mysql> insert into stu1 values(1004,'stu1',22);
Query OK, 1 row affected (0.01 sec)
mysql> update stu2 set name = 'wukong' where id = 1001;
Query OK, 1 row affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0
6、双击SQL脚本编辑
7、加上Dummy,如图所⽰:

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。