Windows 2003 群集服务故障 -1073741476

有一组两节点的SQL Server 2K群集,OS都是Windows 2003 sp1。

某天突然用户报告连不到数据库,管理员在机房内果然也ping不到。赶紧走到机柜,发现A节点貌似死机,B节点已意外关机。

重启A机,看到进入Windows时它做了下Scandisk,并且有报告有文件损坏。再重启,进入windows桌面时报告有服务没起来,让检查日志。检查发现是群集服务没起来。赶紧打开B机,完全启动以后成功在单节点上运行,赞美上帝,业务应用暂时可以撑一下了。

进一步检查日志,发现事件日志中群集异常退出的错误代码为 -1073741476。联系微软技术支持,工程师认为此错误号相应的16进制错误号为:0xc000015c (STATUS_NOT_REGISTRY_FILE),因此怀疑是群集服务的配置注册表出现了损坏。

解决办法却异常简单。登陆到B节点,将仲裁盘上的chk***.tmp文件复制过来,替换A节点%windir%/cluster目录中的clusdb文件。

再次进入A节点服务管理界面,启动群集服务,成功。

忙得一身冷汗。莫名其妙的坏文件,看来得找人仔细检查下硬盘,看看硬盘是不是有问题了。

你可能感兴趣的:(微软服务器家族)