数据库-聚簇索引和非聚簇索引

聚簇索引和非聚簇索引


聚簇是个什么东西?
聚簇是指:如果一组表有一些共同的列,则将这样一组表存储在相同的数据库块中;聚簇还表示把相关的数据存储在同一个块上。利用聚簇,一个块可能包含多个表的数据。概念上就是如果两个或多个表经常做链接操作,那么可以把需要的数据预先存储在一起。聚簇还可以用于单个表,可以按某个列将数据分组存储。更加简单的说,比如说,EMP表和DEPT表,这两个表存储在不同的segment中,甚至有可能存储在不同的TABLESPACE中,因此,他们的数据一定不会在同一个BLOCK里。而我们有会经常对这两个表做关联查询,比如说:select * from emp,dept where emp.deptno = dept.deptno .仔细想想,查询主要是对BLOCK的操作,查询的BLOCK越多,系统IO就消耗越大。如果我把这两个表的数据聚集在少量的BLOCK里,查询效率一定会提高不少。 比如我现在将值deptno=10的所有员工抽取出来,并且把对应的部门信息也存储在这个BLOCK里(如果存不下了,可以为原来的块串联另外的块)。这就是索引聚簇表的工作原理。


聚簇索引和非聚簇索引的差异性:
在聚簇索引中,索引树的叶级页包含实际的数据:记录的索引顺序与物理顺序相同。聚簇索引非常象目录表,目录表的顺序与实际的页码顺序是一致的。
在非聚簇索引中,叶级页指向表中的记录:记录的物理顺序与逻辑顺序没有必然的联系。非聚簇索引则更象书的标准索引表,索引表中的顺序通常与实际的页码顺序是不一致的。一本书也许有多个索引。例如,它也许同时有主题索引和作者索引。同样,一个表可以有多个非聚簇索引。 


聚簇索引和非聚簇索引的优缺点:
通常情况下,使用的是聚簇索引。 
每个表只能有一个聚簇索引,因为一个表中的记录只能以一种物理顺序存放
通常要对一个表按照标识字段建立聚簇索引。但是,也可以对其它类型的字段建立聚簇索引,如字符型,数值型和日期时间型字段。 
可以对一个表同时建立聚簇索引和非聚簇索引
非聚簇索引需要大量的硬盘空间和内存。
非聚簇索引可以提高从表中取数据的速度,它也会降低向表中插入和更新数据的速度。每当你改变了一个建立了非聚簇索引的表中的数据时,必须同时更新索引。
因此你对一个表建立非聚簇索引时要慎重考虑。如果你预计一个表需要频繁地更新数据,那么不要对它建立太多非聚簇索引。
如果硬盘和内存空间有限,也应该限制使用非聚簇索引的数量。 
 
 
聚簇索引和非聚簇索引的属性:
   两种类型的索引都可以同时对多个字段建立索引:可以对多个字段建立一个复合索引,甚至是复合的聚簇索引。假如有一个表记录了网点访问者的姓和名字。如果希望根据完整姓名从表中取数据,你需要建立一个同时对姓字段和名字字段进行的索引。这和分别对两个字段建立单独的索引是不同的。当希望同时对不止一个字段进行查询时,应该建立一个对多个字段的索引。如果希望对各个字段进行分别查询,应该对各字段建立独立的索引。
   两种类型的索引都可以指定为唯一索引:两种类型的索引都可以被指定为唯一索引。如果对一个字段建立了唯一索引,将不能向这个字段输入重复的值。一个标识字段会自动成为唯一值字段,但也可以对其它类型的字段建立唯一索引。假设用一个表来保存你的网点的用户密码,当然不希望两个用户有相同的密码。通过强制一个字段成为唯一值字段,可以防止这种情况的发生。
 

你可能感兴趣的:(自动化测试)