最近做一个项目用到distinct去除重复的数据,但是多字段的去重复不好用。
mysql里可以用
select *,count(distinct name) from table group by name
来欺骗下
oracle里可以用 row_number()连子查询进行处理
select distinct table1.id,table1.name
from (select a.id,b.name, row_number() over (partition by c.wzbah order by b.id desc) rn
from T1 a,T2 b
where a.id = b.id ) table1
where rn = 1
ps:
partition by 是用后面字段进行分割, rn是行号这样就只取到行号为1的那一行了
可以用到max()函数
1、要求,在一个表中,某一字段为重复字段。需要去除重复字段。同时将所有字段显示出来。
SELECT * FROM (select a1,a2,a3,
Row_number() OVER (PARTITION BY a1 ORDER BY a1) rn
from a
) where RN = 1
Row_number() OVER (PARTITION BY a1 ORDER BY a1)作用Oracle分析函数RANK(),ROW_NUMBER(),LAG()等的使用方法
ROW_NUMBER() OVER (PARTITION BY COL1 ORDER BY COL2)表示根据COL1分组,在分组内部根据 COL2排序,而这个值就表示每组内部排序后的顺序编号(组内连续的唯一的)
RANK() 类似,不过RANK 排序的时候跟派名次一样,可以并列2个第一名之后 是第3名
LAG 表示 分组排序后 ,组内后面一条记录减前面一条记录的差,第一条可返回 NULL
BTW: EXPERT ONE ON ONE 上讲的最详细,还有很多相关特性,文档看起来比较费劲
row_number()和rownum差不多,功能更强一点(可以在各个分组内从1开时排序)
rank()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内)
dense_rank()l是连续排序,有两个第二名时仍然跟着第三名。
相比之下row_number是没有重复值的
lag(arg1,arg2,arg3):
arg1是从其他行返回的表达式
arg2是希望检索的当前行分区的偏移量。是一个正的偏移量,时一个往回检索以前的行的数目。
arg3是在arg2表示的数目超出了分组的范围时返回的值。
2.-------------------------------------------------
oracle 多字段查询数据排重,除了row_number()over(partition by )还能怎么实现
2010-7-21 13:07
如题,distinct和group by不适用,只对表中某一字段排重但是查询结果中要包含所有的字段信息。
select * from (select id,userid,gjzy,xhsj,lrsj,wlbm,wlmc,wldw,wldj,wlnum,xhyy,jhdep,jx,qk ,
row_number()over(partition by gjzy order by userid desc,lrsj desc) rm from cb_rqrj_djclhs
where 1=1 and jhdep = '100110011013' )a where a.rm=1
and userid = '1kwxdlxq' and substr(lrsj,1,4) between '2010' and '2010'
除了上面的实现方法还有什么方法能实现,通过子查询或内查询能实现么?!
2010-7-21 13:58最佳答案
对重复字段只取包括其中一个的记录的方法就这样,还可以通过唯一id(如果存在的话,没有的话,用row_number)比较
如
select * from cb_rqrj_djclhs a
where ID in (select min(id) from cb_rqrj_djclhs where gjzy=a.gjzy)
row_num()over()里面那个order by 很难把握,我把查出的数据放临时表里用主键排重的。