GitLab数据库误删事故

事件过程:GitLab事故之技术详叙:抢救后恢复在线,已确定下一步计划

GitLab Todo List

1、为不同的环境改变Linux终端的格式或者颜色,例如红色代表生产环境,黄色代表测试环境。针对所有用户在shell提示符处显示机器的完整名字,例如db1.staging.gitlab.com,而不是仅仅是“db1”。: https://gitlab.com/gitlab-com/infrastructure/issues/1094
2、针对postgresql的文件夹拒绝执行rm -rf这样的命令?可以设置命令执行保护或者针对数据库文件夹有对应的备份措施。
3、为备份增加提醒:检查S3仓库之类的体型。增加图形化界面,显示时间变化后的备份大小,当下降超过10%时发出警报。:https://gitlab.com/gitlab-com/infrastructure/issues/1095
4、找出为什么PostgreSQL在max_connections被设置为8000之后突然出现问题,这个设置在2016513日就已经完成了。因为这个问题的突然出现导致了其他很多问题。https://gitlab.com/gitlab-com/infrastructure/issues/1096
5、通过WAL归档增加备份阈值,这个方法对审计失败也许有用。https://gitlab.com/gitlab-com/infrastructure/issues/1097
6、针对上线产品创建常见问题查找指南手册。
7、从一个数据中心移动数据到另一个数据中心可以通过AxCopy完成:微软声称这个工具比rsync要快很多。看上去这是Windows上面的问题,但是没有任何Windows专家参与。

你可能感兴趣的:(数据库)