我们可以把SSIS中的整个package包含在一个事务中,但是如果在package的执行过程中有一个表需要锁定应该怎么处理呢?SSIS内建的事务处理可以解决这个问题。在此之前首先来熟悉一下SQL Server中的事务的概念。
事务
SQL Server中的事务是单个的工作单元。如果某一事务成功,则在该事务中进行的所有数据修改均会提交,成为数据库中永久的组成部分。如果事务遇到错误且必须取消或回滚,则所有的数据修改均被清除。
在SQL Server中使用事务有可能会造成一些预想不到的结果,具体来说有脏读,不可重复读和幻读三种结果。
在SQL Server中给事务指定一个隔离级别,这个隔离级别定义该事务与其他事务进行资源或数据更改相隔离的级别。事务隔离级别决定了是否锁定SQL Server对象,下面是SQL Server中的事务隔离级别。
还有两种是SQL Server 2005中新添加的事务隔离级别
所有上述的事务处理都在tempdb数据库中一个类似版本库的数据对象中自动进行,当遇到更新未被提交的情况,数据引擎会检索这个版本库得到合适的提交结果。维护这个版本库的工作由SQL Server自动进行,不需要人为干预。
SSIS中的事务处理
SSIS中的包,容器(例如Loop,Foreach Loop,Sequence)或者一个单独的任务中都可以设置事务处理选项。事务处理选项有下面一些值
内建的事务处理要使用Distributed Transaction Coordinator(MSDTC)服务,这个服务必须开启。MSDTC允许使用分布式事务处理,例如在一个事务中同时处理SQL Server数据库和Oracle数据库。如果没有开启这个服务会得到下面的错误提示.
Error: 0xC001401A at Transaction: The SSIS Runtime has failed to start the distributed transaction due to error 0x8004D01B "The Transaction Manager is not available.". The DTC transaction failed to start. This could occur because the MSDTC Service is not running.
注意SSIS中包中的元素的事务隔离级别是Serializable,这种级别会影响锁的持续时间。下面我们来用一个例子说明在如何package中锁定一个表
1 /* 命名 */
2 Create TranQueue Table
3 /* SQLstatement设置 */
4 IF NOT EXISTS ( SELECT * FROM sys.objects WHERE object_id =
5
6 OBJECT_ID (N ' dbo.TranQueue ' ) AND type in (N ' U ' ) )
7 BEGIN
8 execute ( ' CREATE TABLE dbo.TranQueue(message nvarchar(256)) ' )
9 END
10 /* 命名 */
11 Populate TranQueue
12 /* SQLstatement设置 */
13 INSERT INTO dbo.TranQueue VALUES ( ' Test Message ' + CONVERT
14
15 ( NVARCHAR ( 23 ), GETDATE (), 121 ))
16 /* 命名 */
17 Create TranQueueHistory table
18 /* SQLstatement设置 */
19 IF NOT EXISTS ( SELECT * FROM sys.objects WHERE object_id =
20
21 OBJECT_ID (N ' dbo.TranQueueHistory ' ) AND type in (N ' U ' ) )
22 BEGIN
23 execute ( ' CREATE TABLE dbo.TranQueueHistory(message nvarchar(256)) ' )
24 END
1 DELETE TOP ( 10 ) dbo.TranQueue
2 OUTPUT DELETED. *
3 INTO dbo.TranQueueHistory
4 FROM dbo.TranQueue WITH (TABLOCKX)
图1
10.打开SQL Server Management Studion,选择对应的数据库,新建一个Query,执行下面的语句,NOLOCK选项忽略锁,这个语句查询得到一条记录 Message2011-04-10 14:22:31.043,但是这条记录并没有提交
1SELECT * FROM dbo.TranQueueHistory WITH (NOLOCK)
11.执行下面的语句
1 SELECT * FROM dbo.TranQueue
语句将阻塞在这里,语句一直停留在执行状态,不会结束。因为在Process TranQueue任务中我们使用TABLOCKX,在这里将等待任务回滚或者提交。或者可以写成这样,它任然会阻塞
1 DELETE TOP ( 10 ) dbo.TranQueue
2 INSERT INTO dbo.TranQueueHistory VALUES ( ' Test Message ' + CONVERT ( NVARCHAR ( 23 ), GETDATE (), 121 ))
12. 点击Continue按钮或者Debuge按钮,会看到package执行失败,执行SELECT * FROM dbo.TranQueueHistory
WITH (NOLOCK);因为执行了回滚,不会得到任何结果。SELECT * FROM dbo.TranQueue,任然有一条记录。
SELECT * FROM dbo.TranQueueHistory WITH (NOLOCK)
NOLOCK提示忽略锁,这个语句查询得到一条记录 Message2011-04-10 14:22:31.043,但是这条记录并没有提交
13. 执行下面的语句,
SELECT * FROM dbo.TranQueue
sql语句将阻塞在这里,语句一直执行。因为在Process TranQueue任务中我们使用TABLOCKX,在这里将等待任务回滚或者提交。或者可以写成这样
DELETE TOP(10) dbo.TranQueue;INSERT INTO dbo.TranQueueHistory VALUES ('Test Message' + CONVERT(NVARCHAR(23), GETDATE(), 121)),它任然会阻塞
14. 点击Continue按钮或者Debuge按钮,会看到package执行失败,执行SELECT * FROM dbo.TranQueueHistory WITH (NOLOCK);因为执行了回滚,不会得到任何结果。执行SELECT * FROM dbo.TranQueue,任然有一条记录。
如果设置变量User::v_SimulateFailure的值为0,不会执行Simulate Failure任务,就不会回滚,TranQueue中的记录会被写入到TranQueueHistory中。这里有一个很有意思的语句:
DELETE TOP(10) dbo.TranQueue
OUTPUT DELETED.*
INTO dbo.TranQueueHistory
FROM dbo.TranQueue WITH (TABLOCKX)
如果两个表的结构有一部分是是一样的,现在想把一个表的数据导入到另外一个表中,可以使用DELETE SourceTable OUTPUT DELETE.*/DELETE.Column1,DELETE.Column2... INTO DestinationTable FROM SourceTable,这样第一个表中的数据会被“剪切”到第二个表中。