大数据-之LibrA数据库系统告警处理(ALM-12037 NTP服务器异常)

告警解释

当NTP服务器异常时产生该告警。

当NTP服务器异常消除时,该告警恢复。

告警属性

告警ID

告警级别

可自动清除

12037

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

异常NTP服务器的IP地址。

对系统的影响

主OMS节点配置的NTP服务器异常,可能会导致主OMS节点与外部服务器不能同步时间,集群时间可能会产生飘移。

可能原因
  • NTP服务器网络异常。
  • 与NTP服务器认证失败。
  • 不能从NTP服务器获取时间。
  • 从NTP服务器获取的时间持续未更新。
处理步骤

检查NTP服务器网络。

  1. 打开FusionInsight Manager页面,在实时告警列表中,单击此告警所在行。
  2. 在“告警详情”区域,查看告警附加信息,是否提示不能ping通NTP服务器IP。

    • 是,执行步骤 3。
    • 否,执行步骤 4。

  3. 联系网络管理员检查网络配置,确保NTP服务器与主OMS节点网络正常,然后检查告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 4。

检查与NTP服务器认证是否失败。

  1. 使用PuTTY工具以root用户登录主OMS节点。
  2. 执行查看状态命令ntpq -np检查集群与NTP服务器认证是否失败。

    对应NTP服务器“refid”项显示“.AUTH.”表示认证失败。

    • 是,执行步骤 10。
    • 否,执行步骤 6。

检查是否能从NTP服务器获取时间。

  1. 继续查看告警附加信息,是否提示不能从NTP服务器获取时间。

    • 是,执行步骤 7。
    • 否,执行步骤 8。

  2. 联系NTP服务器的服务商,解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 8。

检查从NTP服务器获取的时间是否持续未更新。

  1. 继续查看告警附加信息,是否提示从NTP服务器获取时间持续未更新。

    • 是,执行步骤 9。
    • 否,执行步骤 10。

  2. 联系NTP服务器的服务商,解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 10。

收集故障信息。

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“NodeAgent”、“OmmServer”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后30分钟,单击“下载”。

你可能感兴趣的:(大数据,服务器,运维)