探查 SQL Server 虚拟日志文件

SQL Server 把事务日志文件划分为多个VLF(Virtual Log File),即虚拟日志文件。

112954536.png


一、VLF的4种状态

1、active。表示VLF中存在活动的事务(即未完成的事务)。

2、recoverable。表示VLF中的事务全部已经完成,但是某些操作(例如数据库镜像、复制等)还需要用到这些数据,因此不可以被覆盖。

3、reusable。表示VLF中的数据已经不需要了,可以被覆盖。

4、unused。表示VLF从未被使用。


参考 http://support.microsoft.com/kb/317375/zh-cn


二、简单恢复模式时的VLF

1、文件的初始状态

  测试数据库名为db01,恢复模式设为简单。mdf与ldf文件初始状态如下:

103942391.png


2、填充数据

  运行以下脚本,填充大量数据:

create table testtable (UserID varchar(100),pwd varchar(200))
declare @i int
declare @d1 datetime
set @i=0
-- truncate TABLE [testtable]
insert into testtable select 'a','b'
while @i<18
begin
set @d1 = getdate()
insert into [testtable]
select UserID+cast(floor(rand()*1000) as nvarchar(50)),
cast(floor(rand()*100000) as nvarchar(50))+UserID+cast(floor(rand()*100) as nvarchar(50))
from [testtable]
set @i=@i+1
-- print '第' + Cast(@i as varchar(50)) + '圈,用时:' + Cast(datediff(ms,@d1,getdate()) as varchar(50)) + 'ms'
end


3、检查磁盘增长

  运行脚本后,LDF文件由最初的1MB增长到53MB。

  打开“报表”--“标准报表”--“磁盘使用情况”。

114633236.png


4、检查VLF

  执行dbcc loginfo,检查VLF使用情况。

104823245.png

  上表中的FileID=2表示数据库的第2个文件,对于db01这个测试库,第2个文件就是唯一的LDF文件。FileSize表示VLF的大小。FSeqNo表示VLF的序列号,如果为零则表示这个VLF未被使用。CreateLSN为零,表示创建数据库时就同时创建了这些VLF;不为零则表示在LSN产生时才创建这个VLF。

  Status列表示VLF的状态,如果为0则表示这个VLF为reusable或者unused,如果为2则表示这个VLF为active或者recoverable。

  可以通过sys.databases 系统视图查看事务日志不能被截断的原因。例如:

select log_reuse_wait , log_reuse_wait_desc from sys.databases where name='db01'

132718935.png


5、查看VLF中的LSN

  通过dbcc loginfo,可以查到Status=2的最小的FSeqNo=1865,那么可以通过以下语句查询这个VLF中的LSN。

select * from ::fn_dblog(1865000000000000001 ,1866000000000000000 )

143215130.png

  上图第1列显示的16进制LSN不能直接使用,需要换算成正常的10进制LSN。以第一行为例,第1段为VLF序列号,749H换算成10进制为1865;第2段为日志区块的第1个扇区编号,6EH换算成10个字符的10进制为0000000110;第3段为该扇区内的流水号,1H换算成4个字符的10进制为0001。因此,正常的LSN为186500000001100001。


6、checkpoint的影响

  从上表可以看出,存在一些Status=2的VLF。如果数据缓冲区仍有一些“脏数据”未回写到mdf文件,可以手动执行checkpoint,使“脏数据”立即进行回写。(前面的例子中,从sys.databases 系统视图可以看到有一个事务还未完成,导致checkpoint延迟)

  说明:在生产环境中,即使在简单恢复模式,如果有个事务很早就Begin Transaction,而忘记被Commit/Rollback,结果可能看到一个很大的日志文件。

  说明:何时执行checkpoint,请参考《SQL Server 何时将“脏页”回写到硬盘》 http://jimshu.blog.51cto.com/3171847/1202748

  再执行dbcc loginfo,检查VLF使用情况。可见绝大多数的VLF已经Status=0。

  再检查“磁盘使用情况”。

105135233.png


7、收缩日志文件

  在简单恢复模式时,自动或手动checkpoint操作,以及对数据库做完全备份都会将recoverable状态的VLF标记成Status=0,这些VLF可以被不断重用。如果没有大量的事务导致checkpoint延迟或者“脏数据”回写延迟,LDF文件就不需要增长。

  收缩日志文件时,数据库引擎会检查VLF的状态,将Status=0(即reusable和unused)的VLF所占用的空间释放出来,然后LDF再收缩它的边界。


三、完整恢复模式时的VLF

  在完整恢复模式时,对数据库执行完全备份时不会影响VLF。只有执行事务日志备份之后,VLF才会将recoverable状态的VLF被标记成reusable状态(如果有日志传送、镜像等操作,会对些操作造成限制)。

  如果VLF不能被重用,将导致LDF文件持续增长。执行事务日志备份后,VLF的状态被标记为Status=0,才可以被重用。

  为了避免LDF过度增长,应当增加事务日志备份的频率。


四、参考资料

1、《事务日志 (SQL Server)》

http://msdn.microsoft.com/zh-cn/library/ms190925.aspx#Truncation


2、《数据库检查点 (SQL Server)》

http://msdn.microsoft.com/zh-cn/library/ms189573.aspx


3、《简介数据库日志文件的增长》

http://blogs.msdn.com/b/apgcdsd/archive/2011/12/30/10251946.aspx


你可能感兴趣的:(sql,日志)