1.监控架构:
1.监控需要与报告的方式展示,有别于zabbix监控,zabbix做一些细节接口,一般核心指标确定,监控项就是固定不变的
2.核心指标项的确定
天兔,获取日常监控日报
慢查询监控
表空间大小监控日报
磁盘告警监控日报
3.告警分级,严重分电话,常规走钉钉和邮件短信
4.巡检日报核心指标,周报,和日报。
日报,分所有服务器磁盘使用情况,所有数据库表大小top50 报告
以上监控搞定,基本数据库不会出现问题
------------------------------------------------------------------------------------------------------------
2.数据自动化管理平台: redis,mysql,mssql,mongo
功能,数据库的增删改查,导出,ddl,可以走平台流程化。
-----------------------------------------------------------------------------------------------------------------
3.数据治愈平台
1,大表历史归档
2.备份恢复- 全量恢复---增量恢复--binlog恢复
3.主从切换
4.数据库碎片整理
4.历史回档自动化操作
----------------------------------------------------------------------------------------------
4.资源管理平台
------------------------------------------------------------------------------------------
4.资源业务分类管理
vip管理
端口管理
服务器管理
知识库管理
--------------------------------------------------------------------------------------------
测试环境容器化管理
目的:省资源,易扩展
------------------------------------------------------------------------------------
差点忘了一个东西
还有个自动化创建数据库架构的工具,可以使用ansible-playbook 写好自动化搭建架构的脚本。
实现工程化管理,这个我建议也可以接入平台管理。
-----------------------------------------------------------------------------------------
redis管理
不做持久化
redis热点key实时监控,过期时间,过期key类型,过期key所属团队和业务。
内存管理。
有个开源的redismanager感觉不错,
redis-cluster
扩展的命令都脚本化,或者用redismanager管理
redis记得基本都是内存的问题,加加内存,管理过期key,
过期key管理好,redis基本不出问题
------------------------------------------
mongo基本上我运维的很少
不知道原因,感觉稳定的一逼
以上平台搞定,基本很少需要人工接入了
以上是我想到什么就写了什么,
根据我的经验基本以上搞定,日常基本没什么事,只需要关注巡检日报,拿手机审核单子。数据库不可能出问题,除非服务器宕机。
临时想到写的一些我所做的一些东西
后续,写一些以上落地方案的设计和架构。
基本上都实现了之后,你会觉得工作没意思了。对了大表,大数据量的规范指定好,一切走流程。很重要
以上流程掌握,保你工作清闲
对了,以上构思其实很值钱。。。有的时候懂一样东西的价值,会比努力更重要。希望构思上对再看的你有帮助