kettle数据采集三大流程-全量采集

kettle数据采集之对账流程配置

一、全量采集流程

  表对表数据的快速抽取,实现历史数据简单、高效、快速抽取,并实现字典及数据的抽取、清洗、转换、入库等功能。可以从备份库(镜像库)获取数据,大大降低了对原业务库的影响。支持多种数据库、并发执行。图中并发数量可以根据实际情况进行调整设置。具体流程参考如下:

kettle数据采集三大流程-全量采集_第1张图片

二、导入或备份kettle资源仓库

1、导出备份资源仓库:

  建立job流程,利用导出资源库到XML文件插件,将资源仓库中的采集流程脚本进行导出备份,便于后面导入使用,建议采用此方法备份、导入导出。

kettle数据采集三大流程-全量采集_第2张图片

kettle数据采集三大流程-全量采集_第3张图片

2、导入资源仓库:

将1中备份的资源仓库文件,导入到新的资源仓库地址中。

kettle数据采集三大流程-全量采集_第4张图片

你可能感兴趣的:(Kettle数据采集,大数据,java,etl)