SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错

SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错

  • 一、报错信息显示
  • 二、判断故障并修复

一、报错信息显示

服务器型号为lenovo SR850,XCC管理口提示有两个报错信息,并且服务器会遇到不定时重启的情况,报错信息如下
1、fault in slot ALL PCI error on system ThinkSystem SR850
中文:系统ThinkSystem SR850的插槽 ALL PCI Error中发生故障
2、An uncorrectable PCIe Error has Occurred at Bus 0000 device 00 function 00. The Vendor ID for the device is 8086 and the Device is 2020. The Physical slot number is 0.
中文:总线0000的设备00功能00发生了不可纠正的PCIe错误,设备的供应商标识为8086,device id为2020,物理插槽编号为0
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第1张图片
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第2张图片

二、判断故障并修复

从XCC的管理口看硬件并没有提示什么报错,截图如下
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第3张图片
点击“其他”跳转的部件如下
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第4张图片

日志如下
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第5张图片
以上信息中都没有看到具体的报错信息等,其他中的部件也是可以正常识别到没有报错的,在文章第一张图片中的“活动系统事件”中提到的物理插槽编号为0,一般没有具体的物理位置指向的,或者指向的编号为0的,大部分都是固件版本的问题,这边选择升级固件,可以按照XCC—>UEFI的顺序升级,如果XCC升级后报错仍在,再次去升级UEFI的固件版本,具体的版本lenovo的官网都有,这边选择升级BMC的固件,
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第6张图片
上传新的版本升级后,XCC会重启,等待一会可以正常ping通后,再次去连接进入,报错消失,服务器恢复正常
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第7张图片
SR850出现fault in slot ALL PCI error on system ThinkSystem SR850报错_第8张图片

你可能感兴趣的:(服务器,运维)