Kettle数据同步和抽取

落日映苍穹つ 2022-05-23 23:13 394阅读 0赞

Kettle是一款国外开源的ETL工具,纯java编写,数据抽取高效稳定。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle的简单使用

下载Kettle并解压,设置环境变量新增KETTLE_HOME,指向kettle路径

Center

window下运行Spoon.bat,启动Kettle

首先数据库里有user_1表如下

Center 1

再新建一直目标表user_2

[html] view plain copy

  1. create table user_2 as select * from user_1 where 1=2

则完成了新表的创建

Center 2

Kettle启动界面如下

Center 3

新建一个转换,选择主对象树-新建DB连接,新建DB连接前先下载相应的oracle数据库驱动ojdbc6.jar,并放在Kettle下的lib文件夹里

Center 4

Center 5

创建DB连接后,选择核心对象-输入-新建一个表输入,并设置其属性

Center 6

选择核心对象-输出-新建一个插入/更新,并设置其属性

Center 7

目标模式为用户名
查询关键字ID用于插入时判断是新增还是更新,点击确定后并保存改新建的转换文件。

新建一个job,选择核心对象-通用-分别新建一个START和转换,并设置其属性。

Center 8Center 9

转换文件名的文件指向之前保存的转换1.点击运行即可。运行结果如下

Center 10

再看user_2表,可以发现user_1中的数据同步到user_2表了

Center 11

发表评论

表情:
评论列表 (有 0 条评论,394人围观)

还没有评论,来说两句吧...

相关阅读