ETL数据抽取---Apache Hop

下载Apache Hop

演示环境为:2.0.0版本 官网下载连接
ETL数据抽取---Apache Hop_第1张图片

运行前准备

1.将下载的安装包解压
文件夹结构如下:
ETL数据抽取---Apache Hop_第2张图片
2.将hop文件夹覆盖(或剪切)到其他路径
演示环境将该文件夹剪切至D:\Program Files (x86)文件夹下(也可以保留默认路径),hop中文件夹结构如下:
ETL数据抽取---Apache Hop_第3张图片
3.添加数据库连接驱动包
演示环境为连接MySQL 8.0.*,故将mysql-connector-java-8.0.18.jar复制到D:\Program Files (x86)\hop\lib文件夹下。不添加会导致无法连接数据库。
ETL数据抽取---Apache Hop_第4张图片

mysql-connector-java-8.0.18.jar,提取码:sv81

未添加驱动会提示以下报错信息

ETL数据抽取---Apache Hop_第5张图片

4.Hop连接数据库前准备
需将数据库默认时区进行修改:

-- 修改前查询
SHOW VARIABLES LIKE '%time_zone%';

ETL数据抽取---Apache Hop_第6张图片

-- 修改后查询
set GLOBAL time_zone = '+8:00';
set time_zone = '+8:00';
SHOW VARIABLES LIKE '%time_zone%';

ETL数据抽取---Apache Hop_第7张图片

为避免重启数据库后,参数失效,建议在my.ini[mysqld]中,添加default-time_zone = ‘+8:00’ 参数,手动重启MySQL服务。

未修改默认时区会提示以下报错信息

ETL数据抽取---Apache Hop_第8张图片

运行使用

1.运行Hop
在D:\Program Files (x86)\hop文件夹下,双击hop-gui.bat启动Hop。
ETL数据抽取---Apache Hop_第9张图片
使用过程中,命令行窗口不能关闭。

2.数据库连接
2.1 点击左上角“+”号,选择“Relational Database Connection”进入数据库连接界面
ETL数据抽取---Apache Hop_第10张图片
2.2 参照下图输入数据库连接相关信息
ETL数据抽取---Apache Hop_第11张图片

参考JDBC URL信息:jdbc:mysql://127.0.0.1:3306/v81?autoReconnection=true&useSSL=false

2.3 测试连接及保存当前数据库连接

ETL数据抽取---Apache Hop_第12张图片
2.4 保存完成后,在左侧“Relational Database Connection”中,会出现新建的数据库连接信息

你可能感兴趣的:(kettle,etl)