kettle实现整库迁移

kettle实现整库迁移

文章目录

  • kettle实现整库迁移
    • 1 背景
    • 2 思路
      • 2.1 获取表名
      • 2.2 循环建表和同步
        • 2.2.1 如何设置循环
        • 2.2.2 建表和同步
          • 2.2.1 获取变量
          • 2.2.2 建表
          • 2.2.3 单个表同步
    • 3 数据库连接共享
    • 4 其他

1 背景

  • 库与库之间做数据同步
  • 结构不变
  • 原始是数据库和目标数据库都是MySQL

2 思路

鉴于是整个库进行数据同步,表结构和表名都不需要变化。因此,在转换过程中并不需要做太多的清洗工作,主要是在目标数据库建表和导入操作。需要注意点:

  • 1,对于原始库中新的数据表需要在目标库中新建
  • 2,数据需要进行全量更新
    整体的工作流如下:
    kettle实现整库迁移_第1张图片
    • 获取表名转换处同时获取原始数据库中的表名和建表语句,备用
    • 循环建表和同步工作处是对所有表的循环处理

2.1 获取表名

kettle实现整库迁移_第2张图片

  • 必须使用复制记录到结果控件来保存记录
  • 获取表名处注意勾选sql语句字段
  • 该转换得到了数据库里面所有表的名字和所有建表语句,备用,后面赋值到相关变量中供其他控件使用

2.2 循环建表和同步

2.2.1 如何设置循环

kettle实现整库迁移_第3张图片

  • 双击循环建表和同步job,勾选执行没有一个输入。

2.2.2 建表和同步

kettle实现整库迁移_第4张图片

  • 这是一个完整的job,在整个job流中的循环建表和同步循环的就是这个job
  • 这个job主要是获取变量-建表-同步数据
2.2.1 获取变量

kettle实现整库迁移_第5张图片

  • 从以前的结果获取记录,获取的就是2.1步记录中的结果
  • 设置环境变量时,直接选择获取字段就行,不用手动输入,变量活动类型默任
2.2.2 建表

kettle实现整库迁移_第6张图片

  • 注意勾选变量替换
  • 用${SQL_RESULT}来引用上一步设置的变量
2.2.3 单个表同步

kettle实现整库迁移_第7张图片

  • 表输入时sql语句中的表名用变量代替
  • 表输出时注意勾选剪裁表批量导入

3 数据库连接共享

因为在这整个的工作中,包含了4个ktr和两个job,数据库连接在多个地方出现,因此将数据库连接设置成共享的,避免重复设置数据库连接
kettle实现整库迁移_第8张图片
这是已经共享完成的,在数据库连接上右键鼠标,在弹出框中就可以看见共享/停止共享的按钮

4 其他

参考:https://jingyan.baidu.com/article/e3c78d64a2bfcb3c4d85f56b.html

你可能感兴趣的:(KETTLE)