在Oracle中常常遇到这样的问题,有一张表a,其中存在多条id不同但是信息相同的数据。需求是删除多余的重复数据。
1.准备表 test
create table test(
id number not null primary key,
day date not null);
2.准备数据
insert into test(id, day) values(4, to_date('2006-10-08','yyyy-mm-dd'));
insert into test(id, day) values(5, to_date('2006-10-08','yyyy-mm-dd'));
insert into test(id, day) values(6, to_date('2006-10-10','yyyy-mm-dd'));
insert into test(id, day) values(7, to_date('2006-10-08','yyyy-mm-dd'));
insert into test(id, day) values(8, to_date('2006-10-10','yyyy-mm-dd'));
insert into test(id, day) values(9, to_date('2006-10-11','yyyy-mm-dd'));
insert into test(id, day) values(10, to_date('2006-10-11','yyyy-mm-dd'));
insert into test(id, day) values(11, to_date('2006-10-12','yyyy-mm-dd'));
insert into test(id, day) values(12, to_date('2006-10-12','yyyy-mm-dd'));
下面我们通过最常见的分组函数的方法进行处理这样的问题。
核心是通过Oracle自带的Rowid进行删除操作。(Oracle确实强大,提供了伪列的概念。伪列是在insert操作时给当条数据进行唯一标识。)
废话不多说,上干货:
delete from test a
where a.day in
(select day from test group by day having count(*) > 1)
and rowid not in
(select min(rowid) from test group by day having count(*) > 1)
上述是本讲的结果SQL代码,该代码可实现多余重复数据的删除操作。
where a.day in
(select day from test group by day having count(*) > 1) 对当前表进行分组找出重复项。
and rowid not in
(select min(rowid) from test group by day having count(*) > 1)
找出重复项,在进行重复同时利用伪列rowid显示最小(或最大)的伪列。 通过唯一标识的伪列进行删除操作。