1、ROWNUM 的使用——TOP-N分析:
使用SELECT语句返回的结果集,若希望按特定条件查询前N条记录,可以使用伪列ROWNUM, ROWNUM是对结果集加的一个伪列,即先查到结果集之后再加上去的一个列 (强调:先要有结果集)。简单的说ROWNUM是符合条件结果的序列号.
它总是从1开始排起的, 使用ROWNUM时,只能使用<、<=、!=符号.
举例:
student(学生)表,表结构为:
ID CHARr(6) --学号
name VARCHAR2(10) --姓名
--建表
create table student(ID char(6), name VARCHAR2(10));
--添加测试记录
insert into student values('200001','张一');
insert into student values('200002','王二');
insert into student values('200003','李三');
insert into student values('200004','赵四');
commit;
--测试
SQL> select * from student;
ID NAME
------------------------------
200001 张一
200002 王二
200003 李三
200004 赵四
(1) rownum对于等于某值的查询条件
如果希望找到学生表中第一条学生的信息,可以使用rownum=1作为条件。但是想找到学生表中第二条学生的信息,使用rownum=2结果查不到数据。因为rownum都是从1开始,但是1以上的自然数在rownum做等于判断时认为都是false条件,所以无法查到rownum = n(n>1的自然数).
SQL> select rownum,id,name from student where rownum=1;
ROWNUM ID NAME
---------- ---------------------------------------------------------
1 200001 张一
SQL> select rownum,id,name from student where rownum =2;
未选定行
(2) rownum对于大于某值的查询条件
如果想找到从第二行记录以后的记录,当使用rownum>2是查不出记录的,原因是由于rownum是一个总是从1开始的伪列,Oracle 认为rownum> n(n>1的自然数)这种条件依旧不成立,所以查不到记录.
SQL> select rownum,id,name from student where rownum >2;
未选定行
那如何才能找到第二行以后的记录呢?可以使用子查询方法来解决。注意子查询中的rownum必须要有别名,否则还是不会查出记录来,这是因为rownum不是某个表的列,如果不起别名的话,无法知道rownum是子查询的列还是主查询的列。
SQL>select *from(select rownum no ,id,name from student) where no>2;
NO ID NAME
---------- ---------------------------------------------------------
3 200003 李三
4 200004 赵四
SQL> select *from(select rownum,id,name from student)where rownum>2;
未选定行
(3) rownum对于小于某值的查询条件
如果想找到第三条记录以前的记录,当使用rownum<3是能得到两条记录的。显然rownum对于rownum
SQL> selectrownum,id,name from student where rownum <3;
ROWNUM ID NAME
-------------------------- ---------------------------------------------------
1 200001 张一
2 200002 王二
综上几种情况,可能有时候需要查询rownum在某区间的数据,可以看出rownum对小于某值的查询条件是为true的,rownum对于大于某值的查询条件直接认为是false的,但是可以间接的让它转为认为是true的。那就必须使用子查询。例如要查询rownum在第二行到第三行之间的数据,包括第二行和第三行数据,那么我们可以写以下语句,先让它返回小于等于3的记录行,然后在主查询中判断新的rownum的别名列大于等于2的记录行。但是这样的操作会在大数据集中影响速度。
SQL> select * from(select rownum no,id,name from student where rownum<=3 ) where no >=2;
NO ID NAME
---------- ------ ---------------------------------------------------
2 200002 王二
3 200003 李三
(4) rownum和排序
Oracle中的rownum是在取数据的时候产生的序号,所以想对指定排序的数据指定rowmun行数据就必须注意了。
SQL> select rownum,id,name from student order by name;
ROWNUM ID NAME
---------- ---------------------------------------------------------
3 200003 李三
2 200002 王二
1 200001 张一
4 200004 赵四
可以看出,rownum并不是按照name列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid也是顺序分配的。为了解决这个问题,必须使用子查询
SQL> select rownum,id,name from (select * from student order by name);
ROWNUM ID NAME
---------- ---------------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 张一
4 200004 赵四
这样就成了按name排序,并且用rownum标出正确序号(由小到大)。order by name 如果name是主键或有索引,查询出来的rownum完全按照1,2,3.....的次序。
SQL> alter table student add constraint pk_stu primary key(name);
SQL> select rownum,id,name from student order by name;
ROWNUM ID NAME
---------- ---------------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 张一
4 200004 赵四
2、ROWID的使用——快速删除重复的记录
ROWID是数据的详细地址,通过rowid,oracle可以快速的定位某行具体的数据的位置。
ROWID可以分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid,索引组织表(IOT)的rowid是逻辑rowid。
当表中有大量重复数据时,可以使用ROWID快速删除重复的记录。
举例:
--建表tbl
SQL> create table stu(no number,name varchar2(10),sexchar(2));
--添加测试记录
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'bb',’女’);
SQL> insert into stu values(1, 'ab',’男’);
SQL> insert into stu values(1, 'ab',’男’);
SQL>commit;
删除重复记录方法很多,列出两种。
(1) 通过创建临时表
可以把数据先导入到一个临时表中,然后删除原表的数据,再把数据导回原表,SQL语句如下:
SQL>create table stu_tmpas select distinct* from stu;
SQL>truncate tablesut;//清空表记录
SQL>insert into stuselect * from stu_tmp;//将临时表中的数据添加回原表
这种方法可以实现需求,但是很明显,对于一个千万级记录的表,这种方法很慢,在生产系统中,这会给系统带来很大的开销,不可行。
(2) 利用rowid结合max或min函数
使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。
SQL>delete from stua where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name= b.name and a.sex = b.sex);
或者用下面的语句
SQL>delete from stua where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name =b.name and a.sex = b.sex);//这里如果把max换成min的话,前面的where子句中需要把"<"改为">"
跟上面的方法思路基本是一样的,不过使用了group by,减少了显性的比较条件,提高效率.
SQL>delete from stu where rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex);
思考:若在stu表中唯一确定任意一行数据(1,'ab',’男’),把sex字段更新为”女”,怎么做?
SQL>update stu set sex=’女’where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);
oracle伪列 rowid和rownum
一、什么是伪列RowID?
1,首先是一种数据类型,唯一标识一条记录物理位置的一个id,基于64位编码的18个字符显示。
2,未存储在表中,可以从表中查询,但不支持插入,更新,删除它们的值。
二、RowID的用途
1、在开发中使用频率应该是挺多的,特别在一些update语句中使用更加频繁。所以oracleERP中大部份的视图都会加入rowid这个字段, 在一些cursor定义时也少不了加入rowid。但往往我们在开发过程中,由于连接的表很多,再加上程序的复制,有时忽略了rowid对应的是那一个表中rowid,所以有时过程出错,往往花上很多时间去查错,最后查出来既然是update时带的rowid并非此表的rowid,所以在发现很多次的错误时,重视rowid起来了,开发中一定要注意rowid的匹配.
2、能以最快的方式访问表中的一行。
3、能显示表的行是如何存储的。
4、作为表中唯一标识。
三、RowID的组成
rowid确定了每条记录是在Oracle中的哪一个数据对象,数据文件、块、行上。
ROWID 的格式如下:
数据对象编号 文件编号 块编号 行编号
OOOOOO FFF BBBBBB RRR
由 data_object_id# + rfile# + block#+ row# 组成,占用10个bytes的空间,
32bit的data_object_id#,
10 bit 的 rfile#,
22bit 的 block#,
16 bit 的 row#.
所以每个表空间不能超过1023个 数据文件.
四、RowID的应用
1、查找和删除重复记录
当试图对库表中的某一列或几列创建唯一索引时,
系统提示 ORA-01452 :不能创建唯一索引,发现重复记录。
/*conn scott/tiger
Create table empa as select * from emp;
插入重复记录
insert into empa select * from emp where empno = 7369;
insert into empa select * from emp where empno = 7839;
insert into empa select * from emp where empno = 7934;
*/
查找重复记录的几种方法:
..查找大量重复记录
select empno from empa group by empno having count(*) >1;
Select * From empa Where ROWID Not In(Select Min(ROWID) From empa GroupBy empno);
..查找少量重复记录
select * from empa a where rowid<>(select max(rowid) from empawhere empno=a.empno );
删除重复记录的几种方法:
1、适用于有大量重复记录的情况(列上建有索引的时候,用以下语句效率会很高):
Delete empa Where empno In (Select empno From empa Group By empno HavingCount(*) > 1)
And ROWID Not In (Select Min(ROWID) From empa Group By empno HavingCount(*) > 1);
Delete empa Where ROWID Not In(Select Min(ROWID) From empa Group Byempno);
2、适用于有少量重复记录的情况(注意,对于有大量重复记录的情况,用以下语句效率会很低):
Delete empa a where rowid<>(select max(rowid) from empa whereempno=a.empno );