机房做为IT的核心,其运维正常关系到整个企业的安全,每周的例检很重要,可以及早发现事故端倪,确保正常运维。
 
首先是电源的管理。机房内分为UPS供电和市电两种,服务器和路由交换都是直接接到UPS电源插座上,这样供电是有保障的,我们可以查看UPS指示灯是否是绿色,来判断有无异常,至少半年做一次负压测试,放电来保持电池的稳定,这些措施是必不可少的。一些电源适配器无法接到UPS电源三相插座上,我们需要准备防雷的插板来用于接市电,比如“突破”插座。在机房内都会有过电保护的电源控制器,我们要密切注意是否有“掉闸”的开关。
 
机房的温度和湿度保持在温度:22℃±2℃,湿度:50%Rh±5%Rh。通常情况下,人走进机房会有很凉快的感觉,对系统和网络设备来说,温度过高会影响机器散热,负荷工作,过低会降低机器性能;湿度过高会有结霜,腐蚀电路板,过于干燥会产生静电,击穿电路板。机房的设备都很“娇气”,为了能正常工作,我们有责任有义务提供一个舒适的“家”。每次例检看一看温度和湿度计,现在两者都做到一起,还有一种新的控制系统,可以实现温度报警+湿度报警+停电报警+电话通知+显示当前温度湿度+电话网络断路报警,用探头来探测温度、湿度以及火警,视机房建设而定。温度和湿度计左边温度、右边湿度都正常的话,那我们接下来就看一看空调系统。
 
空调系统实现各不相同,有中央空调、吊顶、壁挂式、柜式三种,各有利弊。中央空调有新风管道,耗费巨大,受物业保障影响大,很少采用;吊顶适合大机房,需要放多个才能保证温度湿度平衡,空调还要有单独的主机房;壁挂式预算小,适合内部小机房,一般到夏天才开;柜式功率大,一般都在2匹以上,设置22度自动控制风力,比较常用。
 
服务器备份和网络设备主要是看有无黄灯或橙色灯亮,服务器电源灯是绿的正常,硬盘灯是绿的正常;网络设备绿灯正常,出现黄灯或橙色灯时,多观察一会时间是否会持久。发现有问题,马上采取相应的事故处理流程。
 
如果以上都没有问题,最后大致向上看看天花板有无突起或是其它问题,地面是否平整,环顾四周堆放的杂物及时清理,到此结束,我们离开机房要把检查情况逐条核对一遍,做好记录,以备审计和检查之后,有据可查。
 
每周两次以上的例检能够排除大多数问题,有备无患,才能增加IT运维的安全和可靠性。