大数据-之LibrA数据库系统告警处理(ALM-37000 MPPDBServer数据目录或Redo目录缺失)

告警解释

当出现如下情况时,产生该告警:

  • 数据实例数据目录被删除。
  • 数据实例Redo目录(pg_xlog)被删除。
告警属性

告警ID

告警级别

可自动清除

37000

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

产生此告警后,因数据实例无法启动,状态为异常。

可能原因

该Coordinator节点或Datanode节点的数据目录或者Redo目录被删除。

处理步骤
  1. 检查告警上报实例的数据目录或者Redo目录(pg_xlog)是否被删除。

    可以通过gs_om -t status --detail命令获取到集群中每一个CN或者DN实例对应的数据目录,Redo目录就是数据目录下的pg_xlog目录。

    1. 使用omm用户登录告警上报的节点。
    2. 初始化环境变量。

      source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile

    3. 执行gs_om -t status --detail系统反馈类似如下信息。
       
  2. 修复损坏的数据实例(CN、DN)。具体方法请参考“实例故障处理”章节。
  3. 选中产生异常的节点,单击“更多操作 > 重启实例”。重启节点后等待5分钟,查看告警是否仍然存在。
    1. 是,执行4。
    2. 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

你可能感兴趣的:(数据库,大数据,服务器)