datax debug远程调试

datax是一个高效的,支持多种数据源的ETL离线工具,阿里巴巴通过他每天导入3PB的数据,但是由于功能比较属于大众化,有一些不太满足各自的业务场景(如我们的需求在导入的过程中,需要kill掉回滚等),这时候就需要自己更改阿里的源码,需要下载源码,修改源码,调试,才便于定位问题。本文主要说idea怎么开启datax远程调试。供各位同行分析源码。

datax详细介绍及源码下载

开发新的插件数据源

datax开启远程debug模式

/apps/datax/bin/datax.py /apps/datax/job/237724067.json -d

即在后面添加-d 即可,默认端口为9999,也可以自行修改datax.py文件第35行

 REMOTE_DEBUG_CONFIG = "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=9999"

datax debug远程调试_第1张图片

idea远程监听9999端口

datax入口类:com.alibaba.datax.core.Engine
以下依次点击:
在这里插入图片描述

datax debug远程调试_第2张图片

datax debug远程调试_第3张图片
点击apply ,ok ,回到Engine类:

datax debug远程调试_第4张图片
需要的地方打断点测试:

datax debug远程调试_第5张图片
至此完成~!

你可能感兴趣的:(经验分享)