在我的应用中使用了Rownumber函数,由于我的非正常理解造成了排序混乱。现在晒出来讨论。
一、初识rownumber
rownumber() 函数允许开发人员动态地将行号指定给结果集。 如果去掉 row_next 子句( ROW_NEXT BETWEEN ? and ? ),那么将返回所有匹配选择标准的行。 上面使用的 SELECT * FROM 子句可以看作一个
临时表,里面存有匹配选择标准的整个结果集,然后从这个临时表中返回落在给定行范围内的结果集。
使用 rownumber() 功能时对系统会有额外的
性能影响,因为数据库首先要获取所有匹配选择标准的行,然后再返回落在给定范围内的那些行。
我们遇到的性能问题就是系统在排序时建的临时表过大,我们采用建一个裸设备的表空间。
二、犯错展示
所以呢,我直观的认为rownumber是对我传的结果集取分页游标。我就将结果集排好序给不减少临时表利用空间吗。sql如下:
select * from (select .... rownumber() over() as rn from photo_ref where ... [b]order by storetime desc [/b])as a1 where a1.rn between 0 and 3000
出来的结果有问题了,分页起始游标每次都不在一个位置,但结果集是正确排序的。
比较正确用法的sql:
select * from (select .... rownumber() over([b]order by storetime desc[/b]) as rn from photo_ref where ... )as a1 where a1.rn between 0 and 3000
可见必须在over()中排序,那就好好查查原因吧。
三、找到原因
db2有3个排序函数,rank如果出現两个相同的数据,那么后面的数据就会直接跳过这个排名,而dense_rank则不会,差別更大的是,row_number哪怕是两个数据完全相同,排名也会不一样。
1、rank
rank 函数本身没有参数。这是因为 rank 函数不对任何参数执行任何计算。相反,rank 函数只是着眼于行集合--以及每一行在集合中的位置--正如排序方式所定义的那样。
对排列函数的而言, 分区(partition) 和 集合(set)这两个术语是等价的。在 PARTITION 子句后面,我们有一个 ORDER BY 子句,这个子句定义了分区内的排序方式。
2、row_number
Row_number 也执行一次排列,但是当碰到有结的情况时,结中的行要进行任意的(也就是说,不是确定的)排序。这在对有重复值的数据进行分析时很有用。row_number 函数一个有趣的方面是它是惟一不要求提供排序方式的排列函数。如果在没有指定排序方式的情况下调用 row_number 函数,则所有的行都将被当作结中的行来对待,因而这些行是
任意排序的。这对于在输出中给行排序来说很有用。
四、结论
所以,我开始的想法错了。不错、努力、继续、希望。