我决定分享我的自动化数据库运维架构和落地方案

1.监控架构:

   1.监控需要与报告的方式展示,有别于zabbix监控,zabbix做一些细节接口,一般核心指标确定,监控项就是固定不变的

   2.核心指标项的确定

     天兔,获取日常监控日报

    慢查询监控

    表空间大小监控日报

    磁盘告警监控日报

3.告警分级,严重分电话,常规走钉钉和邮件短信

4.巡检日报核心指标,周报,和日报。

日报,分所有服务器磁盘使用情况,所有数据库表大小top50 报告

以上监控搞定,基本数据库不会出现问题

------------------------------------------------------------------------------------------------------------

2.数据自动化管理平台: redis,mysql,mssql,mongo

   功能,数据库的增删改查,导出,ddl,可以走平台流程化。

-----------------------------------------------------------------------------------------------------------------

3.数据治愈平台

    1,大表历史归档

    2.备份恢复-  全量恢复---增量恢复--binlog恢复

   3.主从切换

   4.数据库碎片整理

   4.历史回档自动化操作

----------------------------------------------------------------------------------------------

4.资源管理平台

------------------------------------------------------------------------------------------

4.资源业务分类管理

vip管理

端口管理

服务器管理

知识库管理

--------------------------------------------------------------------------------------------

测试环境容器化管理

目的:省资源,易扩展

 

------------------------------------------------------------------------------------

差点忘了一个东西

还有个自动化创建数据库架构的工具,可以使用ansible-playbook 写好自动化搭建架构的脚本。

实现工程化管理,这个我建议也可以接入平台管理。

-----------------------------------------------------------------------------------------

redis管理

不做持久化

redis热点key实时监控,过期时间,过期key类型,过期key所属团队和业务。

内存管理。

有个开源的redismanager感觉不错,

redis-cluster 

扩展的命令都脚本化,或者用redismanager管理

redis记得基本都是内存的问题,加加内存,管理过期key,

过期key管理好,redis基本不出问题

------------------------------------------

mongo基本上我运维的很少

不知道原因,感觉稳定的一逼

 

 

 

 

 

以上平台搞定,基本很少需要人工接入了

以上是我想到什么就写了什么,

根据我的经验基本以上搞定,日常基本没什么事,只需要关注巡检日报,拿手机审核单子。数据库不可能出问题,除非服务器宕机。

临时想到写的一些我所做的一些东西

后续,写一些以上落地方案的设计和架构。

基本上都实现了之后,你会觉得工作没意思了。对了大表,大数据量的规范指定好,一切走流程。很重要

以上流程掌握,保你工作清闲

对了,以上构思其实很值钱。。。有的时候懂一样东西的价值,会比努力更重要。希望构思上对再看的你有帮助

 

 

你可能感兴趣的:(DBA)