运维中心—监控大盘

一、监控大盘内容分类
1、告警
2、业务趋势
3、异常码
4、主机
5、服务状态
6、系统账单
二、API分类
基础数据
1、分组查询各自子系统
2、子系统查询名下各个微服务
主机
根据分组查询主机信息,按照子系统分组,按照CPU和内存排序
步骤:
1、先查询主机数量
2、对于不到100台的,直接查询所有结果,并在内存中进行排序
3、对于超过100台的,基于缓存查询,查不到前端给出提示
4、由于数据实时查询argus,需要支持异步查询和缓存
【异步任务】
1、20分钟运行一次
2、redis 查询当前缓存的系统名
3、元数据管理-查询对应的主机
4、定时任务-argus-更新主机CPU,内存信息,写入redis有序集合
5、redis集合,每个系统两个有序集合(CPU、Memory)
告警
1、返回不同子系统的每天的告警曲线
2、根据子系统查询近7天的告警分布
【步骤】
1、每天定时任务统计前一天的各个系统各个类型的数量
2、实时统计当天某个系统各类型的数量
3、没有子系统的情况下,根据namespace找到子系统
4、通过flink统计出准实时数据,保存到redis
【业务趋势】
1、各个子系统和场景,返回业务趋势曲线
【异常码】
根据微服务和场景,返回异常码列表和出现次数
【服务状态】
根据分组查询微服务状态信息,按子系统进行分组
【系统账单】
根据分组查询账单信息,按子系统分组

你可能感兴趣的:(技术方案,运维)