datax参数设置_DataX使用

解决问题?

DataX简介?

DataX使用?

DataX配置文件?

1. DataX简介?

DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。

使用DataX能实现什么功能呢?例如,把MySQL数据库里的某张表导入到Oracle数据库说是HBase数据库中。还可以通过编写Transfer插件,实现数据转换的功能,比如字符串遮蔽的功能。

详情参见:https://github.com/alibaba/DataX

2. DataX使用?

运行环境:

2.1 直接安装(安装方法一)

直接下载DataX工具包:DataX下载地址 ,下载以后解压至本地某个目录,进入bin目录,即可使用:

$ cd {YOUR_DATAX_HOME}/bin

$ python datax.py {YOUR_JOB.json}

YOUR_DATAX_HOME:DataX解压目录。

YOUR_JOB.json:DataX运行需要的配置文件。

2.2 源码编译(安装方法二)

2.2.1 下载DataX源码:

$ git clone [email protected]:alibaba/DataX.git

2.2.2 通过maven打包

$ cd {D

你可能感兴趣的:(datax参数设置)