在数据迁移中,我们经常需要比较两个表,以便在一个表中标识另一个表中没有相应记录的记录。
例如,我们有一个新的数据库,其架构与旧数据库不同。我们的任务是将所有数据从旧数据库迁移到新数据库,并验证数据是否正确迁移。要检查数据,我们必须比较两个表,一个在新数据库中,一个在旧数据库中,并标识不匹配的记录。
假设有两个表:t1
和t2
。使用以下步骤比较两个表,并确定不匹配的记录,按着常用的思路就是,我们先查t1
,完事呢,拿着数据结果集来循环,一条一条的去另一张表中查询,能查到数据,就是正确的,查询不到,就是数据有丢失的现象。
如果真的这样的话,那你可就真的是啊,too young too simple了。这次呢,咱们来介绍一个比较简单的数据对比方案,那就是使用union all关联两张表,完事使用临时表或者说派生表的方式来进行数据对比。先来看下union all的sql实例吧:
SELECT t1.pk, t1.c1
FROM t1
UNION ALL
SELECT t2.pk, t2.c1
FROM t2
完事咱们就先来建立两张表,再插入一些数据,完事就可以进行测试了,先来看建表:
CREATE TABLE t1(
id int auto_increment primary key,
title varchar(255)
);
CREATE TABLE t2(
id int auto_increment primary key,
title varchar(255),
note varchar(255)
);
完事先在t1
中插入数据:
INSERT INTO t1(title)
VALUES('row 1'),('row 2'),('row 3');
再来在t2
中插入数据:
INSERT INTO t2(title)
VALUES('row 1'),('row 2'),('row 3');
好,咱们接下来就是要使用派生表的方式来对比数据了哦:
SELECT id,title
FROM (
SELECT id, title FROM t1
UNION ALL
SELECT id,title FROM t2
) tbl
GROUP BY id, title
HAVING count(*) = 1
ORDER BY id;
运行之后当然是没有任何返回数据的,因为它们是没有什么差别的。不着急哈,咱们再来在t2
表中插入一行数据:
INSERT INTO t2(title,note)
VALUES('new row 4','new');
完事我们再次比较两个表中的title
列的值,因为新行是不匹配的行将会返回,我们来看下结果:
mysql> SELECT id,title
FROM (
SELECT id, title FROM t1
UNION ALL
SELECT id,title FROM t2
) tbl
GROUP BY id, title
HAVING count(*) = 1
ORDER BY id;
+----+-----------+
| id | title |
+----+-----------+
| 4 | new row 4 |
+----+-----------+
1 row in set
好啦,这次小技巧就到这里了哦。如果感觉不错的话,请多多点赞支持哦。。。