大数据-之LibrA数据库系统告警处理(ALM-37016 MPPDBServer执行XLOG日志归档命令异常)

告警解释

当集群中的CN实例或者DN实例执行归档命令归档XLOG日志失败时,产生该告警。

在下次执行成功时告警自动恢复。

告警属性

告警ID

告警级别

可自动清除

37016

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

可能会导致部分XLOG日志未被归档到归档命令指定的归档目录。XLOG日志目录中的XLOG日志文件数会一直增长,导致磁盘空间不足。

可能原因
  • 归档命令错误。
  • 归档命令指定的归档目录没有写入权限。
  • 归档命令指定的归档目录不存在。
  • 归档命令指定的归档目录空间满,已无法写入。
处理步骤

修改归档配置。

  1. 登录FusionInsight Manager界面,单击“告警管理”,在告警列表中点击对应告警,从“告警详情”中的“定位信息”获取告警所在节点和实例的信息。
  2. 使用PuTTY工具以root用户或者omm用户登录发生告警的节点。
  3. 检查告警对应Coordinator实例或Datanode主实例的“postgresql.conf”文件(例如“/srv/BigData/mppdb/data1/master1/postgresql.conf”)中的归档命令archive_command语法是否错误。
    • 是,执行4。
    • 否,执行5。
  4. 将命令修改正确,等待5分钟,查看告警是否重现。

    命令详情可参考“postgresql.conf”中的注解。

    • 是,执行5。
    • 否,处理完毕。
  5. 检查归档命令所指定的归档目录是否存在以下问题:不存在、没有写入权限或者空间已满。
    • 是,执行6。
    • 否,执行7。
  6. 根据检查结果修复对应问题,确保指定的归档目录可以正确写入。等待5分钟,查看告警是否重现。
    • 是,执行7。
    • 否,处理完毕。

收集故障信息。

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

你可能感兴趣的:(大数据,数据库)