Kettle的部署与配置详细步骤
⼀、ETL简介
ETL,是英⽂Extract-Transform-Load的缩写,⽤来描述将从来源端经过抽取(extract)、(transform)、加载(load)⾄⽬的端的过程。ETL⼀词较常⽤在,它是构建数据仓库的重要环节,但其对象并不限于数据仓库。
注:数据仓库是⾯向主题的、集成的、稳定的且随时间不断变化的数据集合,⽤以⽀持经营管理中的决策制定过程。
⼆、Kettle简介
(1)含义:Kettle的中⽂名称叫做⽔壶,该项⽬的主程序员Matt,希望把各种数据放到⼀个壶⾥,然后以⼀种指定的格式流出。
(2)背景:国外开源的ETL⼯具,纯Java编写
(3)运⾏平台:
服务器端⽀持:, , ,
开发客户端⽀持:, Ubuntu Desktop,
浏览器端⽀持:, , , , Edge
可以在本地运⾏,也可以连接远程机器运⾏
(4)操作界⾯:图形化操作界⾯,同时也⽀持脚本编写开发
三、Kettle安装步骤
1.Java环境准备
由于 Kettle 是基于 java 的,因此需要安装 java 环境,并配置 JAVA_HOME 环境变量。
改变网页背景颜代码建议安装 JDK1.8 及以上,7.0以后版本的 Kettle 不⽀持低版本 JDK。
java下载过程(1)如不知道⾃⼰电脑是否配置了java环境,可以先通过命令窗⼝检验,在键盘上同时按住Win+R,弹出运⾏窗⼝,输⼊cmd,回车进⼊
(2)输⼊java -version,看是否显⽰出版本信息,如未出现以下截图中的内容,说明未安装
已安装截图:
(3)下载jdk安装包,以window64为例
(4)打开安装包,开始安装,⼀直点击下⼀步即可,直到显⽰安装完成,退出即可(5)配置环境中⼼(以win10为例)
点击我的电脑->属性->⾼级系统设置->环境变量
【1】新建JAVA_HOME变量,变量值为jdk的安装⽬录
【2】编辑CLASSPATH变量,变量值为:
.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tool.jar
php手机编译器【3】编辑Path变量,添加变量的值为%JAVA_HOME%\bin
(6)测试:再次重复(1)~(2)步,在命令框⾥输⼊java -version,回车后显⽰版本信息则说明安装成功
2.Kettle下载与安装
(2)进⼊⽹站,可以选择现最新版本,也可以选择历史版本,选择最新版下载即可(此步将花费较长时间,建议⾄少空出3个⼩时以上的时间进⾏下载)
(3)将压缩包解压,到spoon.bat,双击即可启动,如果经常⽤,建议右键创建快捷⽅式⾄桌⾯
从零开始学python网络爬虫(2)进⼊⽹站后可以选择下载版本以及操作系统
Product Version:选择你想下载的版本及可
Operating System :选择Platform Independen
(3)下载下⽅的zip⽂件,进⾏解压
(4)到kettle的安装路径,再进⼊到lib⽂件夹下,将驱动包放到lib⽂件夹中
四、测试
(1)双击Spoon.bat,即启动Kettlematlab audiowrite函数
(2)双击会显⽰以下界⾯,要等待较长时间
(3)进去后选择File(⽂件)->New(新建)->Database Connection(数据库连接)帝国网站管理系统后台
填写所要连接的数据库的基本信息,点击下⽅test,弹出测试成功的对话框即为成功
以上,Kettle就已安装配置完毕,连接好数据库后就可以根据你的需要来建⽴转换和作业啦
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论