常见的计算机系统可靠性数学模型,软件设计师计算机系统知识专题:计算机可靠性一...

1.3.1计算机可靠性

1.计算机可靠性概述

计算机系统的硬件故障通常是由元器件的失效引起的。对元器件进行寿命试验并根据实际 资料统计得知,元器件的可靠性可分成三个阶段,开始阶段器件工作处于不稳定期,失效率较 高;第二阶段器件进入正常工作期,失效率最低,基本保持常数;第三阶段元器件开始老化, 失效率又重新提高。这就是所谓的“浴盆曲线”.因此,应保证在计算机中使用的元器件处于 第二阶段。在第一阶段应对元器件进行老化筛选,而到了第三个阶段,则淘汰该计箅机。

通常用平均修复时间(MTRF)来表示计算机的可维修性,即计算机的维修效率,指从故障发生到机器修复平均所需要的时间。计算机的可用性是指计算机的使用效率,它以系统在执行任务的任意时刻能正常工作的概率A来表示,即

计算机的RAS技术就是指用可靠性R、可用性d和可维修性S三个指标衡量一个计算机 系统。但在实际应用中,引起计算机故障的原因除了元器件以外还与组装工艺、逻辑设计等因 素有关。因此,不同厂家生产的兼容机,即使釆用相同的元器件,其可取性及MTBF也可能会 相差很大。

2.计算机可靠性模型

计算机系统是一个复杂的系统,而且影响其可靠性的因素也非常繁复,很难直接对其进行 可靠性分析。但通过建立适当的数学模型,把大系统分割成若干子系统,可以简化其分析过程。 常见的系统可靠性数学模型有以下三种。

(1)串联系统。假设一个系统由#个子系统组成,当且仅当所有的子系统都能正常工作时, 系统才能正常工作,这种系统称为串联系统,如图1-16所示。

编辑推荐:

你可能感兴趣的:(常见的计算机系统可靠性数学模型)