Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常

前言


最近需要做仪表盘相关的项目,用到了ETL工具Kettle,下载链接:data-integration-kettle,这是一款基于Java开发的工具,当然,Java环境变量相关配置就不在这里说明了,不过相信大家电脑上一般也都配好了环境变量,那么理论上来说应该解压Kettle即可用才对。然而在进行数据库连接时,测试连接抛出了一个报错:

错误连接数据库 [xxx] : org.pentaho.di.core.exception.KettleDatabaseException: 
Error occurred while trying to connect to the database

Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver

org.pentaho.di.core.exception.KettleDatabaseException: 
Error occurred while trying to connect to the database

Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver
    at org.pentaho.di.core.database.Database.normalConnect(Database.java:477)
    at org.pentaho.di.core.database.Database.connect(Database.java:373)
    at org.pentaho.di.core.database.Database.connect(Database.java:344)
    ...

解决办法


问题很明显,数据库驱动问题,相信大家在遇到这个问题查找解决方案时,肯定会搜索到千篇一律的答案,即在data-integration\lib目录下放入mysql-connector-java.jar包即可。

可能大部分人这样操作问题会得到解决,但是很遗憾,本人在lib目录下放入各个版本的jar包后,均不起作用,进而开始思考原因。找了许久,在jdk目录C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext下,我发现不知道什么时候被我放入了一个mysql-connector-java-8.0.16.jar包,然后有了个推测:

  • Kettle基于Java启动
  • 数据连接的jar包首先从jdk目录读取
  • 若jdk目录不存在数据库驱动包,则从安装目录的lib目录下读取

进过测试,测试结果如下:

  • 删除jdk目录下的所有数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库失败。
  • 删除jdk目录下的所有数据库驱动包,在data-integration\lib放入mysql-connector-java-5.1.48.jar数据库驱动包,重启Kettle,连接数据库成功。
  • 在jdk目录下放入mysql-connector-java-5.1.48.jar数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库成功。
  • 删除jdk目录下的所有数据库驱动包,在data-integration\lib放入mysql-connector-java-8.0.16.jar数据库驱动包,重启Kettle,连接数据库失败。
  • 在jdk目录下放入mysql-connector-java-8.0.16.jar数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库失败。
  • 在jdk目录下放入mysql-connector-java-8.0.16.jar、mysql-connector-java-5.1.48.ja数据库驱动包,删除data-integration\lib下的所有数据库驱动包,重启Kettle,连接数据库成功。

其实到了这一步,问题的解决方案已经出来了,总结如下(后续结果为分析探讨为什么8.0+版本的jar包会失效):

  1. Kettle工具安装目录data-integration\lib放入mysql-connector-java-5.1.48.jar。
  2. Jdk目录C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext放入mysql-connector-java-5.1.48.jar。
  3. 重启Kettle。
  4. 下载链接:mysql-connector-java-5.1.48 mysql-connector-java-8.0.16

后续分析


所以,问题现在变成了,为什么Kettle读取了mysql8.0+版本的数据库驱动包,仍然提示'org.gjt.mm.mysql.Driver' could not be found

使用解压工具将mysql-connector-java-5.1.48.jar与mysql-connector-java-8.0.16.jar包解压,可以很明显看到二者的目录结构差别:

Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常_第1张图片
mysql-5.1.48.png
Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常_第2张图片
mysql-8.0.16.png

显而易见,在5.0+的版本中,数据库驱动jar包提供了org.gjt.mm.mysql.Driver.class文件,然而在8.0+版本的数据库驱动jar包中,则根本没有这个路径,所以上述的测试中,在单独使用8.0+版本的jar包时,数据连接失败的原因也找到了,MySQL官方在新版本中更改了类文件的路径,而为了兼容性问题,Kettle仍然采用了老的路径,所以出现了可以使用低版本的jar包连接高版本数据库的情况。

那么有没有办法使用8.0+的jar包呢,或者说Kettle工具为什么要以这种方式读取数据库驱动呢,可以更改吗?继续查。

我们可以在Kettle数据库连接设置时,选择MySQL(因为本人需要连接的数据库是MySQL),点击下方特征列表,可看到对应的参数:

Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常_第3张图片
driverClass.png

可以看到这里已经被定义好了,以org.gjt.mm.mysql.Driver读取,其实,在Java与MySQL数据库连接中,5.0+版本的连接连接是这样定义的:

driverClassName=com.mysql.jdbc.Driver
url=jdbc:mysql://localhost:3306/db3?userSSL=false

8.0+版本的连接连接是这样定义的:

driverClassName=com.mysql.cj.jdbc.Driver
url=jdbc:mysql://localhost:3306/db3?userSSL=false&serverTimezone=UTC

与Kettle这里预定义的class路径并不一致,那么我们要怎样才能修改这个路径呢?在特征列表里面可以直接修改,但是并没有保存的按钮,修改了也不会生效,有另外一种办法。

在Kettle设置数据库连接时,不选择MySQL,而选择Generic database的连接类型,如下:

Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常_第4张图片
generic.png

该连接类型为自定义数据库URL,一看便知,此时和Java定义数据连接时几乎一致,所以填写自定义连接URL,自定义驱动名称即可,这里需要注意的是,8.0+版本的MySQL在连接时需要指定时区,这是上述两个版本的连接url不一致的原因,而class类文件的路径也略有不同,稍作注意即可。

使用自定义连接,终于在使用8.0+jar包的同时,正确连接到了数据库。

至此,问题应该算是圆满解决,虽然花了大量的时间,但是遇到问题,就得解决、看透问题。希望能对大家提供一点小小的帮助。

欢迎访问我的个人博客:Lemon - 万事顺遂

你可能感兴趣的:(Kettle-Pentaho-Data-Integration-连接数据库之数据库驱动异常)