大数据-之LibrA数据库系统告警处理(ALM-12040 系统熵值不足)

告警解释

每天零点系统检查熵值,每次检查都连续检查五次,首先检查是否启用并正确配置了rng-tools工具或者haveged工具,如果没有配置,则继续检查当前熵值,如果五次均小于500,则上报故障告警。

当检查到真随机数方式已经配置或者伪随机数方式中配置了随机数参数或者没有配置但是五次检查中,至少有一次熵值大于等于500,则告警恢复。

告警属性

告警ID

告警级别

可自动清除

12040

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

RoleName

产生告警的角色名称。

HostName

产生告警的主机名。

对系统的影响

导致解密失败,影响解密相关功能,例如DBservice安装等。

可能原因

haveged服务或者rngd服务异常。

处理步骤

检查并手动配置系统熵值。

  1. 在FusionInsight Manager界面,单击“告警管理”。
  2. 查看该告警的详细信息,查看定位信息中对应的“HostName”字段值,获取该告警产生的主机名。
  3. 使用PuTTY工具,以root用户登录告警所在节点。
  4. 执行/bin/rpm -qa | grep -w "haveged"命令,查看haveged安装情况,如果命令返回结果不为空,继续执行/sbin/service haveged status |grep "running",查看返回结果。

    • 如果执行成功,表示haveged服务安装并正常配置运行,执行步骤 8。
    • 如果执行不成功,表示haveged服务没有正常运行。执行步骤 5。

  5. 执行/bin/rpm -qa | grep -w "rng-tools"命令,查看rng-tools安装情况,如果命令返回结果不为空,继续执行ps -ef | grep -v "grep" | grep rngd | tr -d " " | grep "\-o/dev/random" | grep "\-r/dev/urandom",查看返回结果。

    • 如果执行成功,表示rngd服务安装并正常配置运行,执行步骤 8。
    • 如果执行不成功,表示rngd服务并没有正常运行。执行步骤 6

  6. 手动配置系统熵值设置,设置方法参见参考信息。
  7. 等待第二天零点,系统下一次熵值检查,查看告警是否自动清除。

    • 是,操作结束。
    • 否,执行步骤 8。

收集故障信息。

  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“NodeAgent”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
  4. 请联系技术支持,并发送已收集的故障日志信息。

参考信息

手动检查操作系统熵值

以root用户登录节点,执行cat /proc/sys/kernel/random/entropy_avail命令,检查操作系统熵值是否满足FusionInsight HD的安装要求(不低于500)。如果低于500,可使用以下两种方式之一进行配置:

  • 使用“haveged”工具(真随机数方式):请联系OS供应商安装并启动该工具。
  • 使用“rng-tools”工具(伪随机数方式):请联系OS供应商安装该工具,并根据操作系统类型进行配置:
    • Red Hat和CentOS下:执行以下命令进行配置:

      echo 'EXTRAOPTIONS="-r /dev/urandom -o /dev/random"' >> /etc/sysconfig/rngd

      service rngd start

      chkconfig rngd on

    • SUSE下:执行以下命令进行配置:

      rngd -r /dev/urandom -o /dev/random

      echo "rngd -r /dev/urandom -o /dev/random" >> /etc/rc.d/after.local

你可能感兴趣的:(数据库,大数据,java)