记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)

文章目录

    • 概要
    • 调查流程
    • 处理方式:

概要

现场服务器告警灯亮,其他服务器正常,磁盘灯正常,所以从整体来看应是内部部件抛出的异常问题,需要登录机器确认:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第1张图片

调查流程

通过ILOM web界面查看服务器状态进行信息收集:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第2张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第3张图片

记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第4张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第5张图片
以上内容,可以看到报错是/SYS/MB/P0,并且服务器重启过一次。报CPU的问题,貌似比较严重,验证当前CPU情况同步查询相应官方文档。
磁盘服务状态正常:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第6张图片
CPU 64输出没问题:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第7张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第8张图片
官方文档:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第9张图片
严重程度是危急的,通过ilom命令行确定损坏部件状态:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第10张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第11张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第12张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第13张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第14张图片
PCIE7应该是cpu0的插槽(PCle Slot 7)

处理方式:

以上确定我系统是在正常运行情况下,并且输出cpu正常,判断为临时性错误,或ilom监测异常导致,尝试清掉报错。
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第15张图片

ssh -l root <ilom ipaddr>

记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第16张图片

记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第17张图片
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第18张图片
依次将/SYS/MB/P0和/SYS完成清除,进行确认

start /SYS/faultmgmt/shell

fmadm faulty -a

在这里插入图片描述
通过ilom web再次确认状态:
记录Oracle Exadata X8M-2 存储服务器告警灯亮的处理过程(/SYS/MB/P0&PCIE7)_第19张图片

你可能感兴趣的:(运维日常,服务器,运维)