dolphinscheduler3.1.3版本代码编译运行方法

说明

该文档适用于dolphinscheduler 3.1.3-release版本。

一 环境准备

需要使用的环境包括JDK1.8,以及Maven 3.6以上的版本,这里使用低于3.6版本的Maven也可以调试运行,不过在打包的时候会有报错,最好使用高版本的maven。

二 导入源码并修改配置

2.1 导入项目

项目地址:

DolphinScheduler: Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度平台,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作。已经有IBM、阿里、腾讯、360 等 1000 多家公司生产上使用,下载安装包请去官网

将项目导入到自己的编译器中。

2.2 处理报错

项目的pom.xml文件第588行会有报错,如图所示。这里我的处理方法为注释掉587-589行

dolphinscheduler3.1.3版本代码编译运行方法_第1张图片

 

2.3 修改配置文件

2.3.1 修改数据库

项目的启动文件分别在dolphinscheduler-master,dolphinscheduler-worker和dolphinscheduler-api中,其中master和api中需要进行数据库配置,配置文件在src-main-resources下的application.yaml文件中,我这里已经修改成了所需的mysql的数据库,并写好了配置,如图所示。各位在实际使用中配置成自己的数据库即可。

2.3.2 修改zookeeper

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,在dolphinscheduler中也有相应的配置,如果需要使用的话,可以配置成一个有效的地址;如果仅仅为了快速启动dolphinscheduler,那么使用原来的localhost就可以(master,worker和api均有配置文件;在启动前,需要保证对应的zookeeper已经启动)。配置文件如图所示。

dolphinscheduler3.1.3版本代码编译运行方法_第2张图片

2.3.3 配置HDFS(可选)

如果不配置HDFS,则默认文件存储为本地。

如果需要配置HDFS,则需要进入到dolphinscheduler-common中,修改src-main-resource下的common.properties文件。如图所示。

dolphinscheduler3.1.3版本代码编译运行方法_第3张图片

dolphinscheduler3.1.3版本代码编译运行方法_第4张图片 

其中27行为设置存储类型,29行为上传文件的文件夹,是HDFS中真实存在的目录,70行为HDFS用户,72行为地址。

三 启动前准备

3.1 导入数据表

dolphinscheduler-dao的src-main-resource-sql文件夹下,有对应的数据表的sql文件,在上述配置的数据库中导入数据库即可。(也可以先建库导入表,再进行数据库配置)。

dolphinscheduler3.1.3版本代码编译运行方法_第5张图片

 

3.2 安装并运行zookeeper

Zookeeper下载地址:Apache ZooKeeper

dolphinscheduler3.1.3版本代码编译运行方法_第6张图片

 

这里下载箭头所指的包(编译过的)。然后解压下载的文件,将conf文件夹下的zoo_sample.cfg文件改名为zoo.cfg。

因为当前为单机模式,所以只需修改dataDir和logDir即可,如图所示。我这里是在zookeeper的目录下新建了两个文件夹,

dolphinscheduler3.1.3版本代码编译运行方法_第7张图片

修改完成后,执行bin目录下的zkServer.cmd文件,即可启动zookeeper。

3.3 安装Node16.13+和Pnpm

Node下载地址:Download | Node.js

Pnpm下载安装,需要在powershell下使用命令 iwr https://get.pnpm.io/install.ps1 -useb | iex

四 启动服务

4.1启动

在项目的.idea/workspace.xml文件中在标签中可以添加,可以防止启动时报错:命令太长。

在MasterServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):

-Dlogging.config=classpath:logback-spring.xml -Ddruid.mysql.usePingMethod=false -Dspring.profiles.active=mysql

在WorkerServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):

-Dlogging.config=classpath:logback-spring.xml -Ddruid.mysql.usePingMethod=false -Dspring.profiles.active=mysql

在ApiServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):

-Dlogging.config=classpath:logback-spring.xml -Dspring.profiles.active=api,mysql

4.2 验证

启动完成可以浏览 Open API 文档,地址为

 http://localhost:12345/dolphinscheduler/swagger-ui/index.html

4.3 启动前端

使用命令行进入到dolphinscheduler-ui目录中,使用命令pnpm install编译,使用pnpm run dev命令启动。

浏览器访问 http://localhost:5173,使用用户名密码admin/dolphinscheduler123 即可完成登录。

你可能感兴趣的:(大数据)