CentOS7 部署DataX及DataX-web

一、基础环境安装

  • JDK
  • MySQL
  • Python2(本文使用默认2.x)

JDK安装:CentOS安装JDK

Python安装:CentOS安装Python

MySQL安装:CentOS安装MySQL

注:MySQL必须允许dataX-web所在的服务器访问,否则会连不上mysql一直报错。

二、安装DataX

1、下载并解压datax

wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
tar -zxvf datax.tar.gz
  1. 调试
#进入相应目录
cd /opt/datax/bin
python datax.py../job/job.json

CentOS7 部署DataX及DataX-web_第1张图片

# 这里有reader和writer会显示报错,需要执行删除相应的文件即可(文件没看见,但还是执行一下)
CentOS7 部署DataX及DataX-web_第2张图片
执行 # rm -rf/opt/datax/plugin/reader/._*
CentOS7 部署DataX及DataX-web_第3张图片

执行 # python datax.py…/job/job.json
CentOS7 部署DataX及DataX-web_第4张图片
报错后再删除writer的相应目录

# rm -rf/opt/datax/plugin/writer/._*

最后再执行datax验证任务就能成功

# python datax.py…/job/job.json

出现以下信息说明datax安装成功
CentOS7 部署DataX及DataX-web_第5张图片

三、datax-web安装配置

1、下载免编译包(在git地址上)
CentOS7 部署DataX及DataX-web_第6张图片

  1. 解压安装
# 解压
tar -zxvf datax-web-2.1.2.tar.gz
# 安装
cd datax-web-2.1.2/bin
sh install.sh
#一直Y确认,即可安装完成
  1. 创建数据库执行脚本
datax-web-2.1.2/bin/db/datax_web.sql
  1. 修改admin配置
vim datax-web-2.1.2/modules/datax-admin/conf/bootstrap.properties

DB_HOST=mysql
DB_PORT=3306
DB_USERNAME=datax
DB_PASSWORD=datax
DB_DATABASE=datax_web
  1. 配置executor
#配置datax.py运行脚本位置
vim /datax-web-2.1.2/modules/datax-executor/bin/datax-executor.sh

  1. 启动
cd /datax-web-2.1.2/bin
./start-all.sh
  1. 访问web页面

http://host:9527/index.html 账密(admin/123456)

DataX配置Mysql8访问

datax源码内引入的MySQL驱动是5的版本,因此只支持连接mysql5版本,如果我们想要连接mysql8需要自己下载源码更改驱动并重新编译打包

  1. 下载源码

  2. idea打开项目,进入mysqlreadermysqlwriter模块修改pom.xml内的mysql驱动版本

<properties>
	<mysql.driver.version>8.0.30mysql.driver.version>
properties>

<dependency>
    <groupId>mysqlgroupId>
    <artifactId>mysql-connector-javaartifactId>
    <version>${mysql.driver.version}version>
dependency>
  1. 进入plugin-rdbms-util模块找到DataBaseType类,修改
1.全文替换 convertToNull 为 CONVERT_TO_NULL
2.全文替换mysql驱动类com.mysql.jdbc.Driver 为 com.mysql.cj.jdbc.Driver
  1. 进行maven打包
mvn -U clean package assembly:assembly -Dmaven.test.skip=true

注:如果maven打包失败,提示test失败,可以吧对应的test包删除重新打包即可

  1. 将对应的jar包上传到mysqlReader和mysqlWriter模块
#mysqlreader
cd datax/plugin/reader/mysqlreader/libs/
#删除mysql5的驱动jar,去自己maven仓库吧mysql8的驱动上传
#上传并覆盖原有文件 mysqlreader-0.0.1-SNAPSHOT.jar 和 plugin-rdbms-util-0.0.1-SNAPSHOT.jar 

#mysqlwirter
cd datax/plugin/writer/mysqlwriter/libs/
#删除mysql5的驱动jar,去自己maven仓库吧mysql8的驱动上传
#上传并覆盖原有文件 mysqlreader-0.0.1-SNAPSHOT.jar 和 plugin-rdbms-util-0.0.1-SNAPSHOT.jar 

你可能感兴趣的:(大数据,大数据)