GBase 8a 告警管理--页面告警

统一监控支持对单个或多个集群的监控,通过对集群节点 Server 的系统资源利用情况、网络通讯情况、进程运行情况和集群运行状态等信息的采集,并根据用户设定的报警策略进行计算,如有报警,及时通知用户报警信息,以避免集群出现故障。

用户可以通过界面查看集群报警信息。如下图:集群报警信息管理

GBase 8a 告警管理--页面告警_第1张图片

 

上图中的查询条件描述如下:
 报警类型:显示报警类型的多选框, 包括: 报警信息、恢复信息。默认为都不选择,表示选择所有报警类型。
 报警等级:显示报警等级的下拉框, 包括: 严重、 次要、 警告、提醒。默认为所有。
 服务器 IP:支持输入检索的多选菜单,第一项为“所有服务器”,该项为默认值,其他为集群的所有服务器 IP, IP 按升序排列。
监控指标: 支持多选、模糊查询的下拉框。 指标项为平台管理中该集群所选监控策略的指标项。
报警时间:支持日历控件选择。默认为当前操作最近 24 小时。查询时间包含起止时间。
确认方式:显示报警信息确认方式的选择框, 包括: 手动确认、 超时忽略、 未确认。默认为未确认,支持多选。如果都不选择,表示选择所有确认方式。
手动确认:选择报警记录后,点击手动确认。可以将报警记录的确认方式修改为手动确认。支持多选。
上图中的查询结果描述如下:
输入条件后点击“查询”按钮,查询相关信息并显示。表格默认先按未确认的优先显示,然后按报警时间降序排列。 点击表格表头后,可以按当前列进行升序或降序排列。
表格内容如下: 

报警时间:报警的发生时间。
报警等级:包括严重、 次要、 警告、提醒。 采集服务器 IP:产生报警信息的服务器 IP。
指标名称:发生报警的指标名称。
报警错误信息:报警信息的具体内容。当鼠标移动到内容上时,会弹出提示框,显示全部报警信息。  

 当前值:发生报警时,服务器的指标数值。
 报警类型:包括报警信息、恢复信息。其中恢复信息是指当服务器从报警状态恢复到正常状态时,统一监控推送的恢复信息。
 确认方式: 包括: 手动确认、 超时忽略、 未确认。当服务器发生报警时的初始状态为未确认;管理员可以通过统一监控将报警信息确认,报警信息状态变为手动确认;如果当前时间减去报警发生时间的值,超过监控策略中设置的超时忽略时间,系统默认将报警信息的状态变为超时忽略。
 确认用户:手动确认状态的确认用户为操作统一监控的当前用户;超时忽略状态的确认用户为系统管理员。
 确认时间:手动确认状态的确认时间为用户手动确认的时间;超时忽略状态的确认时间为系统定时操作时的时间。  

你可能感兴趣的:(运维,数据库)