09. 约束与索引的联系

之所以把约束和索引放到一起来看,主要是因为主键约束和唯一键约束,它们会自动创建一个对应的索引,先分别看下数据库中的几个约束。

一 约束

在关系型数据库里,通常有5种约束,示例如下:

use tempdb

go

create table s

(

sid     varchar(20),

sname   varchar(20),

ssex    varchar(2)  check(ssex='' or ssex='') default '',

sage    int         check(sage between 0 and 100),

sclass  varchar(20) unique,

constraint PK_s primary key (sid,sclass)

)

create table t

(

teacher  varchar(20) primary key,

sid      varchar(20) not null,

sclass   varchar(20) not null,

num      int,

foreign key(sid,sclass) references s(sid,sclass)

)

单独定义在某一列上的约束被称为列级约束,定义在多列上的约束则称为表级约束。

 

1.主键约束

在表中的一列或者多列上,定义主键来唯一标识表中的数据行,也就是数据库设计3范式里的第2范式;

主键约束要求键值唯一且不能为空:primary key = unique constraint + not null constraint

 

2.唯一键约束

唯一约束和主键约束的区别就是:允许NULL,SQL Server 中唯一键列,仅可以有一行为NULL,ORACLE中可以有多行列值为NULL。

 一个表只能有一个主键,但可以有多个唯一键:unique index = unique constraint

 

在一个允许为NULL的列上,想要保证非NULL值的唯一性,该怎么办?

从SQL Server 2008开始,可以用筛选索引(filtered index)

use tempdb

GO

create table tb5

(

id int null

)

create unique nonclustered index un_ix_01

on tb5(id)

where id is not null

GO

 

3.外键约束

表中的一列或者多列,引用其他表的主键或者唯一键。外键定义如下:

use tempdb

GO

--drop table tb1,tb2

create table tb1

(

col1 int Primary key,

col2 int

)

insert into tb1 values (2,2),(3,2),(4,2),(5,2)

GO

create table tb2

(

col3 int primary key,

col4 int constraint FK_tb2 foreign key  references tb1(col1)

)

GO

select * from tb1

select * from tb2

select object_name(constraint_object_id) constraint_name,

       object_name(parent_object_id) parent_object_name,

       col_name(parent_object_id,parent_column_id) parent_object_column_name,

       object_name(referenced_object_id) referenced_object_name,

       col_name(referenced_object_id,referenced_column_id) referenced_object_column_name

 from sys.foreign_key_columns

where referenced_object_id = object_id('tb1')

 

外键开发维护过程中,常见的问题及解决方法:

(1) 不能将主表中主键/唯一键的部分列作为外键,必须是全部列一起引用

create table tb3

(

c1 int,

c2 int,

c3 int,  

constraint PK_tb3 primary key (c1,c2)

);

                                                                                                                              

create table tb4

(

c4 int constraint FK_tb4 foreign key references tb3(c1),

c5 int,

c6 int

);

/*

Msg 1776, Level 16, State 0, Line 1

There are no primary or candidate keys in the referenced table 'tb3' that match the referencing column list in the foreign key'FK_tb4'.

Msg 1750, Level 16, State 0, Line 1

Could not create constraint. See previous errors.

*/

 

(2) 从表插入数据出错

insert into tb2 values (1,1)

/*

Msg 547, Level 16, State 0, Line 1

The INSERT statement conflicted with the FOREIGN KEY constraint "FK_tb2". The conflict occurred in database "tempdb", table "dbo.tb1", column 'col1'.

*/

--从表在参照主表中的数据,可以先禁用外键(只是暂停约束检查)

alter table tb2 NOCHECK constraint FK_tb2

alter table tb2 NOCHECK constraint ALL

--从表插入数据后,再启用外键

insert into tb2 values (1,1),(3,3),(4,4)

alter table tb2 CHECK constraint FK_tb2

 

(3) 主表删除/更新数据出错

--先删除从表tb2的数据或禁用外键,才能删除主表tb1中的值,否则报错如下

--未被引用的行可被直接删除

insert into tb2 values (2,2)

delete from tb1

GO

/*

Msg 547, Level 16, State 0, Line 3

The DELETE statement conflicted with the REFERENCE constraint "FK_tb2". The conflict occurredin database "tempdb", table "dbo.tb2", column 'col4'.

*/

 

(4) 清空/删除主表出错

--清空主表时,即便禁用外键,但外键关系依然存在,所以任然无法truncate

truncate table tb1

/*

Msg 4712, Level 16, State 1, Line 2

Cannot truncate table 'tb1' because it is being referenced by a FOREIGN KEY constraint.

*/

--删除主表也不行

drop table tb1

/*

Msg 3726, Level 16, State 1, Line 2

Could not drop object 'tb1' because it is referenced by a FOREIGN KEY constraint.

*/

--先truncate从表,再truncate主表也不行

truncate table tb2

truncate table tb1

--唯一的办法删掉外键,truncate将不受控制

alter table tb2 drop constraint FK_tb2

truncate table tb1

--最后再加上外键,注意with nocheck选项,因为主从表里数据不一致了,所以不检查约束,否则外键加不上

alter table tb2 WITH NOCHECK

add constraint FK_tb2 foreign key(col4) references tb1(col1)

 最后,虽然一个表上可以创建多个外键,但通常出于性能考虑,不推荐使用外键,数据参照完整性可以在程序里完成;

 

4.CHECK约束

可定义表达式以检查列值,通常出于性能考虑,不推荐使用。

 

5.NULL 约束

用于控制列是否允许为NULL。使用NULL时有几个注意点:

(1) SQL SERVER中聚合函数是会忽略NULL值的;

(2) 字符型的字段,如果not null,那这个字段不能为null值,但可以为'',这是空串,和null是不一样的;

(3) NULL值无法直接参与比较/运算;

declare @c varchar(100)

set @c = null

if @c<>'abc' or @c  = 'abc'

    print 'null'

else

    print 'I donot know'

GO

declare @i int

set @i = null

print @i + 1

在开发过程中,NULL会带来3值逻辑,不推荐使用,对于可能为NULL的值可用默认值等来代替。

 

6.DEFAULT约束

从系统视图来看,default也是被SQL Server当成约束来管理的。

select * from sys.default_constraints

(1) 常量/表达式/标量函数(系统,自定义、CLR函数)/NULL都可以被设置为默认值;

(2) 利用默认值,向表中添加一个NOT NULL的列,如下:

create table tb6(c1 int not null)

insert into tb6 select 1

alter table tb6 add c2 int default 35767 not null

select * from tb6

--在alter table完成前,表一直处于锁定状态;

--如果向大型表添加列,对数据页的操作需要一些时间,最好事先做好评估。

 

二 索引

定义约束时,并没有定义数据库实现约束的方法,目前的关系型数据库系统,主键和唯一键约束借助唯一索引来实现,所以在创建主键/唯一键时,都会自动生成一个同名的索引。

那么由约束产生的唯一索引,和单独创建的唯一索引有什么联系和区别?

 

1.创建主键或唯一键约束时,数据库自动创建唯一索引

自动生成的该索引是无法删除的,因为这个索引要用于实现约束,在删除约束的时候,该索引也被删除。演示脚本如下:

--create table

CREATE TABLE TEST_CONS

(

ID             int,

CODE           varchar(100)

)

--insert data

INSERT INTO TEST_CONS

SELECT 1,'test1'

--add unique constraint

ALTER TABLE TEST_CONS

  ADD CONSTRAINT UQ_TEST_CONS_ID UNIQUE NONCLUSTERED(ID)

--retrieve constraint

SELECT *

  FROM sys.objects

 WHERE parent_object_id = object_id('TEST_CONS') AND type = 'UQ'

--查看约束,返回如下结果:

/*

name    object_id

UQ_TEST_CONS_ID 1243151474

*/

--retrieve index

SELECT *

  FROM sys.indexes

 WHERE object_id = object_id('TEST_CONS') AND type = 2  --2为非聚集索引

--查看约束产生的索引,返回如下结果:

/*

object_id   name

1227151417  UQ_TEST_CONS_ID

*/

--check constraint

INSERT INTO TEST_CONS

SELECT 1,'test1'

--如果插入重复值提示:UNIQUE KEY 约束,返回如下错误:

/*

消息,级别,状态,第行

违反了UNIQUE KEY 约束'UQ_TEST_CONS_ID'。不能在对象'dbo.TEST_CONS' 中插入重复键。

*/

 --drop index

 DROP INDEX UQ_TEST_CONS_ID ON TEST_CONS

--如果删除由约束产生的索引,返回如下错误:

/*

消息,级别,状态,第行

不允许对索引'TEST_CONS.UQ_TEST_CONS_ID' 显式地使用DROP INDEX。该索引正用于UNIQUE KEY 约束的强制执行。

*/

 --drop constraint

 ALTER TABLE TEST_CONS

  DROP CONSTRAINT UQ_TEST_CONS_ID

--如果删除约束,索引也被删除,以下查询返回空结果集:

--retrieve constraint

SELECT *

  FROM sys.objects

 WHERE parent_object_id = object_id('TEST_CONS') AND type = 'UQ'

--retrieve index

SELECT *

  FROM sys.indexes

 WHERE object_id = object_id('TEST_CONS') AND type = 2  --2为非聚集索引

--drop table

DROP TABLE TEST_CONS

 

另外,约束生成的索引,有些属性也是无法被修改的,比如:开关IGNORE_DUP_KEY,唯一的办法是:先删除约束,再重新定义约束/索引;单独定义的索引,则没有这个限制,如下例:

use tempdb

GO



create table tb_cons(ID int constraint pk_tb_cons primary key)

create unique clustered index pk_tb_cons on tb_cons(id) with(DROP_EXISTING = ON, FILLFACTOR = 90)



alter index pk_tb_cons on tb_cons rebuild with(IGNORE_DUP_KEY = ON)

/*

Msg 1979, Level 16, State 1, Line 1

Cannot use index option ignore_dup_key to alter index 'pk_tb_cons' as it enforces a primary or unique constraint.

*/

exec sp_helpindex tb_cons



--单独创建的唯一索引,属性可以随意修改

create unique index ix_tb_cons on tb_cons(id)

alter index ix_tb_cons on tb_cons rebuild with(IGNORE_DUP_KEY = ON, ONLINE = ON)



drop table tb_cons

在保证数据唯一性上,唯一索引、唯一约束并没有区别,那么应该使用约束还是索引?

约束定义通常出现在数据库逻辑结构设计阶段,即定义表结构时,索引定义通常出现在数据库物理结构设计/查询优化阶段。

从功能上来说唯一约束和唯一索引没有区别,但在数据库维护上则不太一样,对于唯一约束可以用唯一索引代替,以方便维护,但是主键约束则没法代替。

 

2. 先创建唯一索引,再创建该索引字段的唯一约束

这时数据库并不会使用已存在的唯一索引,此时会提示已存在同名索引,约束创建失败,如果指定不同名的约束,则会生成另个唯一索引。演示脚本如下: 

--create table

CREATE TABLE TEST_CONS

(

ID             int,

CODE           varchar(100)

)

--insert data

INSERT INTO TEST_CONS

SELECT 1,'test1'

--create index

CREATE UNIQUE INDEX UQ_TEST_CONS_ID

ON TEST_CONS(ID)

--retrieve constraint

SELECT *

  FROM sys.objects

 WHERE parent_object_id = object_id('TEST_CONS') AND type = 'UQ'

                                                                                     

--retrieve index

SELECT *

  FROM sys.indexes

 WHERE object_id = object_id('TEST_CONS') AND type = 2  --2为非聚集索引

--check index

INSERT INTO TEST_CONS

SELECT 1,'test1'

--此时提示为:唯一索引

/*

消息2601,级别14,状态1,第1 行

不能在具有唯一索引'UQ_TEST_CONS_ID' 的对象'dbo.TEST_CONS' 中插入重复键的行。

*/

--add constraint

ALTER TABLE TEST_CONS

  ADD CONSTRAINT UQ_TEST_CONS_ID UNIQUE NONCLUSTERED(ID)

--此时无法创建与索引同名的唯一约束,因为约束会去生成同名的索引

/*

消息1913,级别16,状态1,第2 行

操作失败,因为在表'TEST_CONS' 上已存在名称为'UQ_TEST_CONS_ID' 的索引或统计信息。

消息1750,级别16,状态0,第2 行

无法创建约束。请参阅前面的错误消息。

*/

--add constraint

ALTER TABLE TEST_CONS

  ADD CONSTRAINT UQ_TEST_CONS_ID_1 UNIQUE NONCLUSTERED(ID)

--换个名字当然是可以成功的,但此时又生成了唯一索引UQ_TEST_CONS_ID_1

--drop table

DROP TABLE TEST_CONS

 

3.主键是否是聚集索引?

SQL Server默认在定义主键时,将生成的唯一索引定义为聚集,刚刚接触的时候容易被搞混淆了。主键对应的索引也可以非聚集,如下:

use tempdb

GO

create table test_pk(id int not null)

alter table test_pk add constraint PK_test_pk primary key nonclustered(id);

SQL Server中定义主键时,默认生成聚集索引,唯一的好处是主键列范围扫描/查找的效率比较高,但数据插入效率欠佳(聚集索引,非聚集索引,都得被维护一次),并且主键列如果选择的不好,会影响其他非聚集索引的性能。

ORACLE中定义主键时,默认生成非聚集索引,不利于主键列的范围扫描/查找,但是对于数据插入效率更佳,这是不同数据库产品各自的权衡。

 

你可能感兴趣的:(索引)