DataX的部署与安装

刚来公司的第二天做的事就是把cd的数据导到bj来,因为不能按照原来一模一样的去导所以就用到了datax,而datax帮我搞定了这个难题,有道是花时间想办法解决,不如找工具研究。


首先我们得先下载datax 
https://github.com/alibaba/DataX 
下面开始 
解压到虚拟机上 tar -zxvf datax.tar.gz 修改权限为755 进入bin 
目录即可操作同步作业

tar zxvf datax.tar.gz
 sudo chmod -R 755 {YOUR_DATAX_HOME}
 cd  {YOUR_DATAX_HOME}/bin
 python datax.py ../job/job.json
  • 1
  • 2
  • 3
  • 4

把写好的配置文件(eg:cdshop2bjshop)放到 bin目录下 
把写好的配置文件(eg:cdshop2bjshop)放到 bin目录下 
修改配置文件的地址 
修改配置文件的地址
运行命令 在bin目录下 python datax.py cdshop2bjshop(配置文件)成功后会显示如下内容 
success 
详细:https://github.com/alibaba/DataX

需要注意俩表同步之间 字段名可以不同 但字段数量和类型必须一样


因dataX其内部庞大,所以建议了解后,去攻读源代码,在github上,链接就给大家了,有什么疑问可以给我留言,我是黑猫,我在这里。

你可能感兴趣的:(db)