转自oracle 高水位线详解
一、什么是水线(High Water Mark)?
所有的oracle段(segments,在此,为了理解方便,建议把segment作为表的一个同义词) 都有一个在段内容纳数据的上限,我们把这个上限称为"high water mark"或HWM。这个HWM是一个标记,用来说明已经有多少没有使用的数据块分配给这个segment。HWM通常增长的幅度为一次5个数据块,原则上HWM只会增大,不会缩小,即使将表中的数据全部删除,HWM还是为原值,由于这个特点,使HWM很象一个水库的历史最高水位,这也就是HWM的原始含义,当然不能说一个水库没水了,就说该水库的历史最高水位为0。但是如果我们在表上使用了truncate命令,则该表的HWM会被重新置为0。
二、HWM数据库的操作有如下影响:
a) 全表扫描通常要读出直到HWM标记的所有的属于该表数据库块,即使该表中没有任何数据。
b) 即使HWM以下有空闲的数据库块,键入在插入数据时使用了append关键字,则在插入时使用HWM以上的数据块,此时HWM会自动增大。
三、如何知道一个表的HWM?
创建数据:
CREATE TABLE TB_USER ( ID INTEGER PRIMARY KEY, USER_NAME VARCHAR2(20) NOT NULL, USER_AGE INTEGER NOT NULL ); CREATE SEQUENCE SEQ_USER INCREMENT BY 1 START WITH 1 NOMAXVALUE NOCYCLE CACHE 10; CREATE OR REPLACE TRIGGER TR_USER BEFORE INSERT ON TB_USER FOR EACH ROW BEGIN SELECT SEQ_USER.NEXTVAL INTO :NEW.ID FROM DUAL; END; DECLARE V_AGE TB_USER.USER_AGE%TYPE; V_NAME TB_USER.USER_NAME%TYPE; BEGIN FOR I IN 1..10000 LOOP SELECT DBMS_RANDOM.value(1, 100) INTO V_AGE FROM DUAL; V_NAME := 'USER_' || V_AGE; INSERT INTO TB_USER(USER_NAME, USER_AGE) VALUES (V_NAME, V_AGE); END LOOP; COMMIT; END;
create or replace procedure pr_space_usage(p_tabname in varchar2) as l_fs1_bytes number; l_fs2_bytes number; l_fs3_bytes number; l_fs4_bytes number; l_fs1_blocks number; l_fs2_blocks number; l_fs3_blocks number; l_fs4_blocks number; l_full_bytes number; l_full_blocks number; l_unformatted_bytes number; l_unformatted_blocks number; begin dbms_space.space_usage( segment_owner => user, segment_name => p_tabname, segment_type => 'TABLE', fs1_bytes => l_fs1_bytes, fs1_blocks => l_fs1_blocks, fs2_bytes => l_fs2_bytes, fs2_blocks => l_fs2_blocks, fs3_bytes => l_fs3_bytes, fs3_blocks => l_fs3_blocks, fs4_bytes => l_fs4_bytes, fs4_blocks => l_fs4_blocks, full_bytes => l_full_bytes, full_blocks => l_full_blocks, unformatted_bytes => l_unformatted_bytes, unformatted_blocks => l_unformatted_blocks ); dbms_output.put_line('0-25% Free = ' || l_fs1_blocks || ' Bytes = ' || l_fs1_bytes); dbms_output.put_line('25-50% Free = ' || l_fs2_blocks || ' Bytes = ' || l_fs2_bytes); dbms_output.put_line('50-75% Free = ' || l_fs3_blocks || ' Bytes = ' || l_fs3_bytes); dbms_output.put_line('75-100% Free = ' || l_fs4_blocks || ' Bytes = ' || l_fs4_bytes); dbms_output.put_line('Full Block = ' || l_full_blocks || ' Bytes = ' || l_full_bytes); end;
BLOCKS是总的,BLOCK_CT是含有数据的BLOCK
SQL> set serveroutput on SQL> select blocks from user_segments where segment_name = 'TB_USER'; BLOCKS ---------- 32 SQL> select count(distinct (dbms_rowid.rowid_block_number(rowid))) block_ct from TB_USER; BLOCK_CT ---------- 28 SQL> call pr_space_usage('TB_USER'); 0-25% Free = 0 Bytes = 0 25-50% Free = 0 Bytes = 0 50-75% Free = 1 Bytes = 8192 75-100% Free = 0 Bytes = 0 Full Block = 27 Bytes = 221184 调用完成。
SQL> delete from tb_user; 已删除10000行。 SQL> select blocks from user_segments where segment_name = 'TB_USER'; BLOCKS ---------- 32 SQL> select count(distinct (dbms_rowid.rowid_block_number(rowid))) block_ct from TB_USER; BLOCK_CT ---------- 0 SQL> call pr_space_usage('TB_USER'); 0-25% Free = 0 Bytes = 0 25-50% Free = 0 Bytes = 0 50-75% Free = 0 Bytes = 0 75-100% Free = 28 Bytes = 229376 Full Block = 0 Bytes = 0 调用完成。 SQL>
SQL> truncate table tb_user; 表被截断。 SQL> select blocks from user_segments where segment_name = 'TB_USER'; BLOCKS ---------- 8 SQL> select count(distinct (dbms_rowid.rowid_block_number(rowid))) block_ct from TB_USER; BLOCK_CT ---------- 0 SQL> call pr_space_usage('TB_USER'); 0-25% Free = 0 Bytes = 0 25-50% Free = 0 Bytes = 0 50-75% Free = 0 Bytes = 0 75-100% Free = 0 Bytes = 0 Full Block = 0 Bytes = 0 调用完成。 SQL>
在Oracle数据的存储中,可以把存储空间想象为一个水库,数据想象为水库中的水。水库中的水的位置有一条线叫做水位线,在Oracle中,这条线被称为高水位线(High-warter mark, HWM)。在数据库表刚建立的时候,由于没有任何数据,所以这个时候水位线是空的,也就是说HWM为最低值。当插入了数据以后,高水位线就会上涨,但是这里也有一个特性,就是如果你采用delete语句删除数据的话,数据虽然被删除了,但是高水位线却没有降低,还是你刚才删除数据以前那么高的水位。也就是说,这条高水位线在日常的增删操作中只会上涨,不会下跌。
下面我们来谈一下Oracle中Select语句的特性。Select语句会对表中的数据进行一次扫描,但是究竟扫描多少数据存储块呢,这个并不是说数据库中有多少数据,Oracle就扫描这么大的数据块,而是Oracle会扫描高水位线以下的数据块。现在来想象一下,如果刚才是一张刚刚建立的空表,你进行了一次Select操作,那么由于高水位线HWM在最低的0位置上,所以没有数据块需要被扫描,扫描时间会极短。而如果这个时候你首先插入了一千万条数据,然后再用delete语句删除这一千万条数据。由于插入了一千万条数据,所以这个时候的高水位线就在一千万条数据这里。后来删除这一千万条数据的时候,由于delete语句不影响高水位线,所以高水位线依然在一千万条数据这里。这个时候再一次用select语句进行扫描,虽然这个时候表中没有数据,但是由于扫描是按照高水位线来的,所以需要把一千万条数据的存储空间都要扫描一次,也就是说这次扫描所需要的时间和扫描一千万条数据所需要的时间是一样多的。所以有时候有人总是经常说,怎么我的表中没有几条数据,但是还是这么慢呢,这个时候其实奥秘就是这里的高水位线了。
那有没有办法让高水位线下降呢,其实有一种比较简单的方法,那就是采用TRUNCATE语句进行删除数据。采用TRUNCATE语句删除一个表的数据的时候,类似于重新建立了表,不仅把数据都删除了,还把HWM给清空恢复为0。所以如果需要把表清空,在有可能利用TRUNCATE语句来删除数据的时候就利用TRUNCATE语句来删除表,特别是那种数据量有可能很大的临时存储表。
在手动段空间管理(Manual Segment Space Management)中,段中只有一个HWM,但是在Oracle9iRelease1才添加的自动段空间管理(Automatic Segment Space Management)中,又有了一个低HWM的概念出来。为什么有了HWM还又有一个低HWM呢,这个是因为自动段空间管理的特性造成的。在手段段空间管理中,当数据插入以后,如果是插入到新的数据块中,数据块就会被自动格式化等待数据访问。而在自动段空间管理中,数据插入到新的数据块以后,数据块并没有被格式化,而是在第一次在第一次访问这个数据块的时候才格式化这个块。所以我们又需要一条水位线,用来标示已经被格式化的块。这条水位线就叫做低HWM。一般来说,低HWM肯定是低于等于HWM的。