kettle 数据同步

数据同步一般要与 排序记录、合并记录 两个对象同时使用

kettle 数据同步_第1张图片

首先确保数据流的字段是一样的,可利用 字段选择 的移除和排序功能

kettle 数据同步_第2张图片

排序,保证排序结果唯一

kettle 数据同步_第3张图片

合并行

kettle 数据同步_第4张图片
  • 新旧数据源:新数据源的数据同步至旧数据源,最后旧数据源的表会改变,新数据源的表不会有任何变化
  • 标志字段: 起一个变量名,保存数据对比的结果。有 new、changed、deleted、identical 4种结果,对应 插入、更新、删除、相同 4种含义
  • 关键字段:合并数据时的依据
  • 数据字段:对比数据源时使用的字段

      此对象开始后,发现两行数据源的 关键字段 一致,就会进行合并,如果 数据字段 完全一致,标志字段 的值设为 identical;
      如果 数据字段 不一致,标志字段 的值设为 changed,这一行数据会和 新数据源 保持一致,丢弃 旧数据源 的数据;
      如果在 旧数据源 中没有找到 新数据源 的关键字段,标志字段 的值设为 new,这一行数据会和 新数据源 保持一致;
      如果在 新数据源 中没有找到 旧数据源 的关键字段,标志字段 的值设为 deleted,这一行数据会和 旧数据源 保持一致;

注:可在流程中修改此字段

数据同步

将前面处理好的数据流最终通过数据同步更新至数据库

kettle 数据同步_第5张图片
  • 用来查询的关键字:数据流同步至数据库的依据
  • 更新字段:此处添加上的字段都会在新增时同步至数据库,但只有在 更新 标签中选择 N 的字段才会在更新时同步至数据库

数据同步-高级标签页

kettle 数据同步_第6张图片
  • 操作字段名:将 合并行 对象中的 标志字段填入
  • 插入、更新、删除:分别对应 合并行 对象中的 new、changed、deleted 字段,identical 字段无需任何操作

你可能感兴趣的:(kettle 数据同步)