故障弹性引导 (FRB) 在英特尔® 服务器主板和英特尔®服务器系统


故障弹性引导 (FRB) 在英特尔® 服务器主板和英特尔®服务器系统

上次审核日期: 31-Oct-2017
文章 ID: 000007197


症状:

  • 什么是 FRB?
  • 我如何知道它是否工作?
  • 英特尔®服务器上的故障弹性启动。

解决:

故障弹性引导

BMC (底板管理控制器) 实现 FRB 级别1、2和3。如果默认引导处理器 (BSP) 无法完成启动过程, FRB 将尝试使用备用处理器进行引导。

  • FRB 级别1旨在从开机自检期间检测到的 BIST 故障恢复。此 FRB 恢复完全由 BIOS 代码处理。
  • FRB 级别2用于在开机自检期间从看门狗超时恢复。FRB 级别2的看门狗定时器在 BMC 中实现。
  • FRB 级别3旨在从看门狗超时的硬复位或通电恢复。这为此级别的 FRB 提供了硬件功能。

FRB-1

在多处理器系统中, BIOS 将注册处理器 (MP) 表和 ACPI APIC 表中的应用程序处理程序。当由 BSP 启动时, 如果应用程序处理器 (AP) 在某一时间内无法完成初始化, 则假定它无法正常工作。如果 BIOS 检测到应用程序处理器已失败 BIST 或无法正常使用, 则它会请求 BMC 禁用该处理器。

然后, BMC 在禁用处理器时生成系统重置;BIOS 在下一个启动周期中将看不到失败的处理器。故障 AP 未列在 MP 表中, 也没有在 ACPI APIC 表中列出, 操作系统也不可见。如果 BIOS 检测到 BSP 已失败 BIST, 它将向 BMC 发送请求以禁用当前处理器。如果没有备用处理器可用, BMC 会对扬声器发出蜂鸣音, 并暂停系统。如果 BMC 可以找到另一个处理器, 则 BSP 所有权将通过系统重置转移到该处理器。

FRB-2

BMC 中的第二个看门狗定时器 (FRB-2) 由 BIOS 设置约6分钟, 旨在保证系统完成 bios 开机自检。在禁用 FRB-3 计时器之前启用 FRB-2 计时器, 以防止任何未受保护的时间窗口。在 POST 结束前, 在初始化选项 rom 之前, BIOS 将禁用 BMC 中的 FRB-2 计时器。

如果系统包含超过 1 GB 的内存, 并且用户选择测试每个 DWORD 内存, 则在扩展内存测试开始之前, 看门狗定时器将被禁用, 因为内存测试在这个配置下可能需要超过6分钟。如果系统在开机自检期间挂起, BIOS 将不会禁用 BMC 中的计时器, 从而生成异步系统重置 (ASR)。

FRB-3

当系统从硬复位 (通常约为5秒) 时, 第一个计时器 (FRB-3) 开始计数。如果 BSP 成功地重置并开始执行, BIOS 将通过取消断言 FRB_TIMER_HLT 信号 (GPIO) 来禁用 BMC 中的 FRB-3 定时器, 并且系统继续开机自检。如果计时器由于 BSP 未能获取或执行 BIOS 代码而过期, 则 BMC 会重置系统并禁用故障处理器。

系统将继续更改 BSP, 直到 BIOS POST 通过禁用 BMC 中的 FRB-3 计时器。如果在扬声器找不到好的处理器时, BMC 会发出蜂鸣音代码。在系统复位或电源循环时, 循环通过所有处理器的过程将被重复。

你可能感兴趣的:(Server)