java项目线上值班手册


注意:
1、外部依赖的紧急问题优先电话联系;
2、报备先本群报备,若紧急问题优先电话会议报备;

【应用清单】:
项目清单、标注【重点项目】

【中间件对接】:
DBA:XXX
Redis:XXX
统一配置:XXX
运维:XXX
MQ:XXX

【发现问题】:(6点~22点)
1、关注群里机器人、电话、系统消息报警;

2、定时巡检日志系统,重点观察有无error和warning异常;

3、定时巡检APM,重点观察内存、GC、CPU、RT等指标;

【定位&解决问题】:
1、若有相应异常,先当前群里报备,再确认对业务有没有影响,并第一时间定位问题,并阶段性报备问题处理进展;

2、定位问题,则优先check代码、统一配置发布记录,中间件(db、redis、mq、统一配置)及应用运维侧有无异常,
再定位业务异常,确定是外部依赖异常,还是应用内部代码异常,若外部依赖异常,则及时找下游依赖方反馈,若内部
异常则结合日志系统链路定位报错代码,定位具体问题,若需要发布,则需及时报备;

3、若无异常,也需要阶段性群里报备下,至少早、中、晚报备一次;

你可能感兴趣的:(java,开发语言)