Pentaho Data Integration(Kettle) 使用仓库

接上篇Pentaho Data Integration(Kettle) 简单上手,现在我们来看看如何与Pentaho Business Analytics Server(BA Server)配合使用仓库功能。

连接BA Server

确保启动了BA Server,然后点击右上角connect按钮新建一个仓库连接:

Pentaho Data Integration(Kettle) 使用仓库_第1张图片
Paste_Image.png

确保填写正确的URL,然后点击finish:


Pentaho Data Integration(Kettle) 使用仓库_第2张图片
Paste_Image.png

再次选择右上角的仓库进行登录:

Pentaho Data Integration(Kettle) 使用仓库_第3张图片
Paste_Image.png

登录成功后的连接变成这样了:

Paste_Image.png

之后便可以在仓库里面新建转换和作业,方法跟本地类似。

BA Server中执行

可以再BA Server中查看创建的转换和作业:

Pentaho Data Integration(Kettle) 使用仓库_第4张图片
Paste_Image.png

双击可以执行一个转换或作业:

Pentaho Data Integration(Kettle) 使用仓库_第5张图片
Paste_Image.png

显示执行成功。
还可以通过BA Server上传转换和作业文件,不过默认上传后的文件是隐藏起来的(可能是为了保护文件),可以按照如下操作显示隐藏文件:

Pentaho Data Integration(Kettle) 使用仓库_第6张图片
Paste_Image.png

然后就可以查看到刚上传的文件了。

BA Server设置定时任务

在网上看到许多人推荐的方法是使用cron任务,并配合kitchen.shpan.sh脚本使用,这是一种方法,但更好的方式是通过BA Server来完成,因为BA Server有更直观的定时任务创建与管理。
首先选中要定时执行的文件,然后点击Schedule:

Pentaho Data Integration(Kettle) 使用仓库_第7张图片
Paste_Image.png

填写名称,选择位置:

Pentaho Data Integration(Kettle) 使用仓库_第8张图片
Paste_Image.png

选择执行周期:

Pentaho Data Integration(Kettle) 使用仓库_第9张图片
Paste_Image.png

Finish,结束。

管理定时任务

Pentaho Data Integration(Kettle) 使用仓库_第10张图片
Paste_Image.png

这里可以管理我们新建的定时任务,包括修改、删除、暂停、过滤、刷新、立即执行等。功能是不是比命令更强大?

以上。

你可能感兴趣的:(Pentaho Data Integration(Kettle) 使用仓库)