rmr事故

 

         今天我也奇葩了一把,因一个失误,酿成从业6年以来最严重的工作灾难事故。本来今天完成跨HDFS版本数据迁移和1.0IMPALA-LZO是非常值得我高兴的事情,却因在线上环境和测试环境之间迁移数据时,本该删除测试环境的,不小心递归删除了在线数据仓库的一个大目录,造成海量数据丢失,造成难以评估的结果。尼玛,老子人品暴跌吗?

       一再提醒自己细心处理在线事务,却还是在不经意间发生了本不该发生的事情,不是因为不熟悉,而是因为粗心,不可饶恕。

        这次误操作,我没有逃避,没有隐瞒,及时坦白地向上汇报,让事故造成的影响得到了最高程度的控制。目前公司还没有责罚我,不管怎么样,我愿意去承受我能承受的一切!但是还是感谢公司的宽容、领导的担当和大家的配合处理,让数据可以在24小时左右基本恢复!

 

        这次事故值得深思:

               1、主机权限控制问题;

               2、数据操作安全问题(屏蔽高危命令);

               3、数据可快速恢复问题(HDFS回收站)。

       

         接下来,必须做好预防措施和应急方案。 

你可能感兴趣的:(责任,rmr,在线操作安全,细心,再细心)