记一次阿里云ECS宕机无法启动恢复过程

唉,本来周末美滋滋的在休息,咔嚓,监控报警系统发消息说有一台ECS服务器宕机,本来以为过一会儿就会自动恢复,结果这一等。。。好家伙,周一早上来了还没起来。到公司后,一查还是jenkins发布服务器,这玩大了,赶紧登陆阿里云后台,手动执行启动操作,结果没有任何反应,起了好几次也没起来,赶紧给阿里云提工单寻求帮助。
左等右等,终于等到了恢复,记一次阿里云ECS宕机无法启动恢复过程_第1张图片
看到这里心差点凉了半截,为啥呢。我的前任啊。。。你当时买服务器的时候咋就想不开选了本地磁盘呢?这不是给后人埋坑嘛!!!!这里再次给大家提个醒,买服务器选磁盘的时候千万不要图那点便宜,还是得买高效云盘或者SSD呀。。。。。我们公司N多服务,全是用jenkins来打包发布,这要是数据丢失了,我估计就得卷铺盖走人了。
万幸的是,我们一直都在备份磁盘快照,我灵机一动,是不是可以在阿里云工作人员迁移完后,通过回滚磁盘快照的方式将数据恢复,把这个想法告诉了阿里的工作人员,然后就是焦急的等待了(估计是阿里的工作人员在做实验来验证是否可行,所以这次等待时间较长)。皇天不负有心人,终于等来了阿里工作人员的回复记一次阿里云ECS宕机无法启动恢复过程_第2张图片
估计阿里小哥要是在旁边,我都想保住丫亲两口了!!!!
最终不负所望,阿里工作人员将宕机的ECS迁到了别的物理服务器上,然后我通过回滚系统盘和数据盘的最新快照,所有的数据都回来了~~~~

写这篇文章是要告诉运维同胞们:
1.不要图便宜,不要在购买ECS的时候选择本地磁盘,这要是没有快照的话,出了问题,哭都没地儿哭
2.一定要选择自动磁盘快照,出问题了还能回滚一下,不然就准备卷铺盖走人吧!!!

你可能感兴趣的:(杂货记录,运维,阿里云)