转自:http://blogs.msdn.com/b/apgcdsd/archive/2011/01/11/unicode-collation.aspx
一个常常让人困惑的问题就是,为什么SQL Server的Unicode字段(nvarchar/nchar/ntext)也有collation定义呢?Unicode字段不是可以存储多语言吗?比如下面的表定义:
CREATETABLEtt1
(
c1int,
c2nvarchar(10)collateChinese_PRC_Stroke_CI_AS
)
上门的c2字段是nvarchar类型,那么加的collate Chinese_PRC_Stroke_CI_AS有啥意义呢。 或许你会问,如果我不加上collate不就行啦.其实如果没有后面的collate, SQL server会缺省给你加上数据库的collation.也就是说nvarchar/nchar等字段一定是有collation的.
那么上面定义的collate有何意义?是否就是指这个c2字段只能存放中文字符呢?不是. Unicode的collation的作用是排序规则.就是说,这个字段依旧可以存放多国语言,但是你只能指定一种排序规则,如上面的table,我指定的排序规则就是按照中文排序,即使你存放的是别的语言..
让我们看一看例子:
IFOBJECT_ID('tt1','U')ISNOTNULL
droptablett1
go
CREATETABLEtt1
(
c1int,
c2nvarchar(10)collateChinese_PRC_Stroke_CI_AS
)
go
INSERTtt1VALUES(1,N'一');
INSERTtt1VALUES(2,N'二');
INSERTtt1VALUES(3,N'三');
INSERTtt1VALUES(4,N'四');
GO
select*fromtt1orderbyc2
结果如下:
c1c2
----------- ----------
1一
2二
3三
4四
(4 row(s) affected)
你可以看到c2列的排序结果不错.如果我们使用另外一种collation,那么结果可能是不同的,让我们看看:
IFOBJECT_ID('tt1','U')ISNOTNULL
droptablett1
go
CREATETABLEtt1
(
c1int,
c2nvarchar(10)collatelatin1_general_cs_as
)
go
INSERTtt1VALUES(1,N'一');
INSERTtt1VALUES(2,N'二');
INSERTtt1VALUES(3,N'三');
INSERTtt1VALUES(4,N'四');
GO
select*fromtt1orderbyc2
结果是不一样的, C2列的order by结果和上面是有差异的:
c1c2
----------- ----------
1一
3三
2二
4四
(4 row(s) affected)