关于oracle有关重复的问题经常遇到,不管是在面试还是在平常工作中,如果表中有重复记录很可能影响到一些业务的正常运行,每次遇到这样的问题,老是记不住该怎么办,这次下决心写个文章,来记录一下。
文中只是简单的写了2个例子,我感觉肯定还有更多的方式去处理这样的问题,但是现在水平有限也只是写了一点皮毛。
表jintest
create table JINTEST
(
ID VARCHAR2(10),
NAME VARCHAR2(10),
AGE NUMBER
);
插入几条记录
insert into jintest (ID, NAME, AGE)
values ('1', '名字', 30);
insert into jintest (ID, NAME, AGE)
values ('2', '名字', 30);
insert into jintest (ID, NAME, AGE)
values ('3', '名字', 30);
insert into jintest (ID, NAME, AGE)
values ('4', '名字2', 30);
insert into jintest (ID, NAME, AGE)
values ('5', '名字3', 30);
insert into jintest (ID, NAME, AGE)
values ('6', '名字3', 30);
insert into jintest (ID, NAME, AGE)
values ('7', '名字3', 30);
如果id列为(UNIQUE)约束或主键(PRIMARY KEY)约束,我们可以通过分组,然后取最大最小值来解决。
比如现在要删除表中name,age相同的记录。
delete from jintest t1
where t1.id not in (select max(id) from jintest t group by t.name, t.age);
或者
delete from jintest t1
where t1.id not in (select min(id) from jintest t group by t.name, t.age);
如果删除id,name,age都重复的记录该怎么做呢?
我们可以使用oracle自带的一个关键字rowid,那这样就变成了
delete from jintest t1
where rowid not in
(select max(rowid) from jintest t group by t.id, t.name, t.age);
或者
delete from jintest t1
where rowid not in
(select min(rowid) from jintest t group by t.id, t.name, t.age);
这样应该也是挺简单的啊!