如转载请注明出处:http://www.cnblogs.com/xd502djj/archive/2010/08/18/1802130.html
以前的一篇删除重复记录的虽然还不错 但是在我遇到重量级的大表时还是显的力不从心,不小心想到一种新的方法
思路1、保存不重复的记录
2、保存重复记录中的一个rowid
//3、删除原表中rowid不为步骤2中rowid的记录 ,留下重复数据中的一条
3.找出记录中rowid为步骤2中rowid的记录
4 、1和3数据连接就是所要的数据了
具体操作例子
第一步:
SQL> create table xxfgs_sig as (select imeid imeid,max(dn) dn,max(xlh) xlh,max(pro_name) pro_name,max(area_name) area_na
me,max(brand) brand,max(m_type) m_type from xxfgs group by imeid having count(*)<2);
第二步:
SQL> create table xxfgs_row as (select max(rowid) rowdata,imeid from xxfgs group by imeid having count(*)>1);
//第三步:////可以考虑给meid建索引
//SQL>delete from xxfgs where rowid not in (select rowdata from xxfgs_row);
//或者
//SQL>delete from xxfgs a where a.rowid <>(select rowdata from xxgs_row b where a.meid=b.meid);
第三步:
SQL>create table xxfgs_dub as (select * from xxfgs where rowid in (select rowdata from xxfgs_row));
第四步:
SQL>insert into xxfgs_sig select * from xxfgs_dub;
////熟练了三四步就可以合成一步了
再来个效率更高的 使用partition 就更加灵活 和强大 效率高了
CREATE TABLE zzcpt_imei_log_sig
AS
SELECT IMEID,
DN,
XLH,
PRO_NAME,
AREA_NAME,
BRAND,
M_TYPE,
reg_time
FROM (SELECT ROW_NUMBER ()
OVER (PARTITION BY A.IMEID ORDER BY a.reg_time DESC)
rn,
a.IMEID,
A.DN,
A.XLH,
a.PRO_NAME,
a.AREA_NAME,
A.BRAND,
A.M_TYPE,
a.reg_time
FROM zzcpt_imei_log a)
WHERE rn = 1;