大数据之LibrA数据库系统告警处理(ALM-12035 恢复任务失败后数据状态未知)

告警解释

执行恢复任务失败后,系统会自动回滚,如果回滚失败,可能会导致数据丢失等问题,如果该情况出现,则上报告警,如果下一次该任务恢复成功,则恢复告警。

告警属性

告警ID

告警级别

可自动清除

12035

致命

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

TaskName

任务名称。

对系统的影响

执行恢复任务失败后,系统会自动回滚,如果回滚失败,可能会导致数据丢失,数据状态未知等问题,有可能会影响业务功能。

可能原因

该告警产生原因依赖于该任务的详细情况,直接获取日志和任务详情来处理该告警。

处理步骤

收集故障信息。

  1. 登录FusionInsight Manager管理界面,单击“告警管理”。
  2. 在告警列表中单击该告警,从“告警详情”的“定位信息”处获得TaskName。
  3. 选择“系统设置 > 恢复管理”。
  4. 根据“TaskName”查找对应恢复任务,查看恢复任务的详细信息。
  5. 再一次启动该恢复任务,查看恢复任务是否执行成功。

    • 是,执行步骤 6。
    • 否,执行步骤 7。

  6. 等待2分钟,检查告警是否消除。

    • 是,结束操作。
    • 否,执行步骤 7。

  7. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  8. 在“服务”下拉框中勾选“Controller”,单击“确定”。
  9. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。

你可能感兴趣的:(数据库,大数据,java)