你的负载均衡耐高温么?(译文)

2010年11月7日
原文
http://www.makingitscale.com/2010/can-your-hardware-handle-a-thermal-meltdown.html

原标题 Can your hardware handle a thermal meltdown?

作者
Brandon Seibel, VerticalScope Inc

(译文如下)

我们最近碰到这么一回事儿:数据中心的三台中央空调同时挂了(原因还不知道,这个以后再说)。比较好玩的是看看你的硬件耐高温("防火")的能力怎么样。

机房温度最高的时候是61摄氏度,也就是说,真xx的热。

这么高的温度你是不是觉得没啥硬件能撑得住?

还真有些扛住了。

最早垮掉的是服务器,因为它们都设置了55摄氏度紧急shutdown的功能。这个我觉得还好了,不然里面重要的数据溶掉了就更惨。然后就是存储,它们垮的没有那么干净利落。存储的第一个机头由于温度太高shutdown,第二个机头尝试接管,然后也因为相同原因shutdown。

好了,现在是彻底完蛋了。没有服务器提供服务;就算有也没有存储提供数据。

谢天谢地,我们的负载均衡和交换机的"防火"能力要强的多,它们自始至终都在工作。这真是太好了,因为通过这些设备我还能远程连到机房,要不然就真的要自己跑到数据中心去了。

尤其是负载均衡能一直在线,实在太有帮助了,因为它有个功能,可以在服务器全部宕机的情况下把用户的请求转发到别的远程URL去(failover URL)。这样至少我们的用户知道发生了啥事情。多谢A10网络和Cisco可以提供如此耐高温的硬件产品。

等到空调恢复,温度下降,我们没有碰到啥问题就慢慢恢复服务了。所有的硬件都没啥损坏,所以也很快恢复到正常运营状态。就是NetApp吓了我们一小跳,有一个机头起不来,还好再插拔一下后就可以顺利管理磁盘柜了。

碰到这种事,让我觉得能建个多数据中心的网络会好的多,不过近期可没有预算做这个事情。


(J.L.)


 

你可能感兴趣的:(职场,url,Cisco,Failover,A10,休闲,NetApp,耐高温)