阅读更多
ROW_NUMBER()的使用方法:
ROW_NUMBER() OVER (PARTITION BY COL1 ORDER BY COL2)
详细说明:
根据COL1分组
在分组内部根据 COL2排序
而这个值就表示每组内部排序后的顺序编号(组内连续的唯一的)
RANK():排序的时候跟派名次一样,可以并列2个第一名之后 是第3名
LAG:分组排序后 ,组内后面一条记录减前面一条记录的差,第一条可返回 NULL
BTW: EXPERT ONE ON ONE 上讲的最详细,还有很多相关特性,文档看起来比较费劲
row_number()和rownum差不多,功能更强一点(可以在各个分组内从1开时排序)
rank()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内)
dense_rank()l是连续排序,有两个第二名时仍然跟着第三名。
相比之下row_number是没有重复值的
lag(arg1,arg2,arg3):
arg1是从其他行返回的表达式
arg2是希望检索的当前行分区的偏移量。是一个正的偏移量,时一个往回检索以前的行的数目。
arg3是在arg2表示的数目超出了分组的范围时返回的值。
以下为通过row_number() over(...)删除重复数据的例子,仅供参考:
delete from acc_fundnav
where rowid in (select row1
from (select rowid row1,
row_number() over(partition by HOST_ID order by rowid) lev
from acc_fundnav)
where lev > 1)