Alwayson 同步模式的坑

一个生产库, 使用量不算特别大, 内存 64GB, 数据库 60 GB左右。IO 也非常不错,虽然是虚拟机,但性能很好。

版本: SQL Server2014 企业版。 

搭建了 Alwayson , 同步模式、自动故障转移。

奇怪的是, 用扩展事件捕获到的慢SQL特别多(但占用CPU很低), 用户实际使用也比较慢, 连纯插入语句都很慢, 一天产生几万数据量的表插入居然要几秒(无更新和删除,少量查询), 令人难以置信。看监控, CPU、IO 等非常占用很低, 5% 都不到, 唯一能查到的是有两个表的更新操作很频繁, 平均每秒 几十次, 但也没占什么CPU。而且这个一时也改不了程序。

后来查了等待,发现可能有与 Alwayson 相关的等待:

msdn

select * from sys.dm_os_wait_stats s
where s.max_wait_time_ms>1000
or s.signal_wait_time_ms>1000
or s.waiting_tasks_count>1000
or s.wait_time_ms>1000
order by s.wait_time_ms desc

清空的SQL:

DBCC SQLPERF ('sys.dm_os_wait_stats', CLEAR);  

Alwayson 同步模式的坑_第1张图片

将 Alwayson 其改为 异步、手动转移 就好了。

可惜的是 异步 不能自动转移, 但也没办法了。

慢得有些奇葩, 其它有些库是同步模式也没慢成这样, 先记着吧。


今天在再看这个服务器时, 发现 xp_readerrorlog 要几十秒才能读完。

也许是那个死锁标记导致的吧, 错误日志文件估计都有个几百MB了。

DBCC TRACEON (3605,1204,1222,-1)  

里面其实不是什么死锁, 都是一些 alwayson 相关的内容。

算了, 先用:

exec msdb.dbo.sp_cycle_errorlog  
把最大的错误日志滚到最后吧。

慢跟这个应该是有一定关系的了。



你可能感兴趣的:(SQL,Server,-,AlwaysOn,SQL,Server,-,故障排除)