【知识】ETL大数据集成工具Sqoop、dataX、Kettle、Canal、StreamSets大比拼
1.摘要对于数据仓库,大数据集成类应用,通常会采用ETL工具辅助完成。ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。当前的很多应用也存在大量的ELT应用模式。常见的ETL工具或类ETL的数据集成同步工具很多,以下对开源的Sqoop、dataX、Kettle、Cana