一、故障树分析法概述故障树分析法(Fault Tree Analysis)是由美国贝尔电话研究所的沃森(Watson)和默恩斯(Mearns)与于1961年首次提出并应用于分析民兵式导弹发射控制系统的。其后,波音公司的哈斯尔(Hasse)、舒劳德(Schroder)、杰克逊(Jackson)等人研制出故障树分析法计算程序,标志着故障树分析法进入了以波音公司为中心的宇航领域。1974年,美国原子能委员会发表了以麻省理工学院(MIT)拉斯穆森(Rasmussen)为首的安全组所写的“商用轻水反堆核电站事故危险性评价”的报告,该报告采用了美国国家航空和管理部于60年代发展起来的事件树(ET:Event Tree)和故障树分析方法。这一报告的发表引起了各方面的很大反响,并推动了故障树分析法从宇航、化工和机械等工业领域。所谓故障树分析,就是首先选定某一影响最大的系统故障作为顶事件,然后将造成系统故障的原因逐级分解为中间事件,直至把不能或不需要分解的基本事件作为底事件为止,这样就得到了一张树状逻辑图,称为故障树。如图1-1所示就是一简单的故障树。这一简单故障树表明:作为顶事件的系统故障是由部件A的故障或部件B的故障引起的,而部件A的故障可能由元件1引起,也可能由元件2引起,部件B的故障则由元件3和元件4同时发生故障时引起,这样,就将引起系统故障的基本原因及影响途径表达得一清二楚。更一般地说,故障树分析就是以故障树为基础,分析影响顶事件发生的底事件种类及其相对影响程度。故障树分析包括以下几个主要步骤:建立故障树、故障树的定性分析和故障树的定量分析。图1-1 简单的故障树二、故障树的建立故障树的建立有人工建树和计算机建树两类方法,它们的思路相同,都是首先确定顶事件,建立边界条件,通过逐级分解得到的原始故障树,然后将原始故障树进行简化,得到最终的故障树,供后续的分析计算用。1、确定顶事件在故障诊断中,顶事件本身就是诊断对象的系统级(总体的)故障部件。而在系统的可靠性分析中,顶事件有若干的选择余地,选择得当可以使系统内部许多典型故障(做为中间事件和底事件)合乎逻辑地联系起来,便于分析。所选的顶事件应该满足:① 要有明确的定义;
② 要能进行分解,使之便于分析顶事件和底事件之间的关系;
③ 要能度量以便于定量分析。选择顶事件,首先要明确系统正常和故障状态的定义;其次要对系统的故障作为初步分析,找出系统组成部分(元件、组件、部件)可能存在的缺陷,设想可能发生的各种的人为因素,推出这些底事件导致系统故障发生的各种可能途径(因果链),在各种可能的系统故障中选出最不希望发生的事件作为顶事件。对于复杂的系统,顶事件不是唯一的,必要时还可以把大型复杂的系统分解为若干个相关的子系统,以典型中间事件当作故障树的顶事件进行建树分析,最后加以综合,这样可使任务简化并可同时组织多人分工合作参与建树工作。2、建立边界条件建立边界条件的目的是为了简化建树工作,所谓边界条件是指:① 不允许出现的事件;
② 不可能发生的事件,实际中常把小概率事件当作不可能事件;
③ 必然事件;
④ 某些事件发生的概率;
⑤ 初始状态。当系统中的部件有数种工作状态时,应指明与顶事件发生有关的部件的工作状态。建立边界条件和建树时应该注意的是:① 小概率事件不等同于小部件的故障和小故障事件;
② 有的故障发生概率虽小,但一旦发生则后果严重,为安全起见,这种小概率故障就不能忽略;
③ 故障定义必须明确,避免多义性,以免使故障树逻辑混乱;
④ 先抓主要矛盾,开始建树时应先考虑主要的、可能性很大的以及关键性的故障事件,然后再逐步细化分解过程中再考虑次要的、不经常发生的以及后果不严重的次要故障事件;
⑤ 强调严密的逻辑性和系统中事件的逻辑关系,条件必须清楚,不可紊乱和自相矛盾。3、建树符号建树符号包括故障事件符号、逻辑门符号和转移符号等,如表1-1所示。表1-1 建树符号
下面以减速器的故障为例,来说明说明建树过程。显然,在本例中,减速器的故障就是顶事件。假定减速器故障仅包括漏油、振动噪声和减速器不能工作三种形式,它们可作为故障树的第二级。而减速器的振动噪声可能来自齿轮箱,也可能来自基座、电机或工作中的不平稳外载荷,它们可作为故障树的第三级。齿轮箱由转轴组件和轴承系统组成,它们构成故障树的第四级。转轴组件又包括齿轮和转轴,称为故障树的第五级,这样层层分解,最后可能建立如图1-2所示的故障树。需要说明的是,图1-2所示的减速器故障树与某一实际的减速器故障情形可能并不完全相符,此处所列只是为说明故障树的建立方法。由此可以看出,一张实际的故障树可能非常复杂,这取决于考虑问题的角度和出发点。
图1-2 减速器故障树三、故障树的简化在分析系统故障时,最初建立的故障树往往并不能最简的,可以对它进行简化。最经常采用的简化方法是借助逻辑代数的逻辑法则进行简化,为此,先来介绍几个基本的逻辑关系和逻辑运算法则、故障树的结构函数,最后以一个实例来说明简化方法。1、基本逻辑关系两个变量的基本逻辑关系如表1-2所示,逻辑运算的真值表如表1-3所示。表1-2 两个变量的基本逻辑关系
表1-3 两个变量逻辑运算的真值表2、逻辑运算的基本法则为简便起见,现将逻辑运算的基本法则列于表1-4。表1-4 两个变量逻辑运算的真值表3、故障树的结构函数由图1-1所示的简单故障树可以看出,由于故障树是由构成它的全部底事件的“或”和“与”的逻辑关系联结而成,因此可用结构函数这一数学工具给出故障树的数学表达式,以便于对故障树作定性分析和定量计算。系统故障称为故障树的顶事件,以符号T表示,系统各部件的故障称为底事件,如对系统和部件均只考虑故障和正常两种状态,则底事件可定义为:(1-2)系统顶事件的状态如用φ来表示,则必然是底事件状态Xi(i=1,2,…,n)的函数。(1-3)同时定义为故障(1-4)显然,图1-3所示的与门故障树的结构函数为(1-5)
图1-4所示的或门故障树的结构函数为(1-6)图1-3 与门故障树
图1-4 或门故障树也可写为(1-7)4、简化实例下面以两个简单的例子来说明故障树的简化过程。对图1-5(a),故障树的简化过程如下对图1-5(b),故障树的简化过程如下图1-5 故障树简化实例四、故障树的定性分析对故障树作定性分析的主要目的是为了弄清系统(或设备)。出现某种故障(顶事件)可能性有多少,亦即分析有哪些因素会引发系统的某种故障。定性分析首先必须确定系统的最小割集。1、割集和最小割集割集是引起系统故障发生的几个故障底事件的集合,即一个割集代表了系统发生故障的一种可能性或一种故障模式。如一故障树的底事件集合为
,当有一子集
,当满足条件
(1-8)时,使
,亦即该子集所含之全部底事件均发生时,顶事件必然发生,则该子集就是割集,其割集数为K。割集的对偶式路集,路集是系统不发生故障的底事件的集合,即一个路集代表了一个系统正常的可能性或模式。最小割集是指包含有最少数量而又最必须的底事件的割集,全部最小割集的完整集合代表了给定的全部故障,因此,最小割集的意义就是在于它给出了处于故障状态的系统中所必须要修理的故障模式。2、最小割集的求取目前,对最小割集的研究较多,在此介绍较常用的两种方法,即赛迈特里斯算法和富赛尔算法。(1)赛迈特里斯算法(上行法)由赛迈特里斯(Semanderes)研制(1972年)的最小割集算法,其基本原理是:对给定的故障树从最下一级中间事件开始,如中间事件是以逻辑与门把底事件联系在一起,可用与门结构函数式(式1-5);如中间事件是逻辑或门与底事件相联,则用或门结构函数式(1-6);依次往上,直至顶事件,运算才终了。在所得计算结果中,如有相同的底事件出现,就应用布尔代数加以简化。对图1-6所示的故障树,显然可以写出:(1-9)
由此得到8个割集。可用逻辑代数对上式进行简化得到最小割集为
,即该故障树有4个最小割集,为
,同时可得其等价故障树如图1-7所示。图1-6 故障树举例图1-7 图1-6的等价故障树(2)富赛尔(Fussell)算法(下行法)求故障树最小割集的另一种算法是富赛尔(Fussell)根据范斯莱(Vesely)编制的计算机程序MOCUS(获得割集的方法)于1972年提出的一种手工算法。它根据故障树中逻辑或门会增大割集容量的性质,从故障树的顶事件开始,由上到下,顺次把上一级事件置换为下一级事件,遇到与门将输入 横向并列写出,遇到或门则将输入事件竖向串列写出,直至把全部逻辑门都置换为底事件为止,由此可得该故障树的全部割集。需要说明的是,由于图1-7所示的故障树已经过最小割集处理,故富赛尔推算得到的结果均为最小割集,而对于一般地故障树,则仍须用布尔代数对富赛尔推算结果进行简化,才能求得最小割集。五、故障树的定量分析所谓故障树的定量分析,就是以故障树为基础,分析系统故障的发生概率以及各底事件的重要程度,包括结构重要度、概率重要度和关键性重要度等三个不同含义的定量指标。1、概率计算的基本公式设事件
的发生概率分别为
,(1)当
为相互独立的事件时,有:和的概率
(1-11)积的概率
(1-12)(2)当
为相斥事件时,有:和的概率
(1-13)积的概率
(1-14)(3)当
为相容事件时,有:和的概率
(1-15)积的概率
(1-16)实际计算时,当
时,相容事件近似独立事件;当
时,相容事件近似于相斥事件。值得注意的是,在应用上述公式计算系统故障的概率时,当故障树中包含两个以上同一底事件时,则必须应用逻辑代数整理简化后,才能使用以上概率计算公式,否则会得出错误的结论。因此,在计算概率之前,必须将故障树化为结构最简,即与最小割集对应。2、顶事件的发生概率求顶事件的发生概率有多种方法,这里介绍由最小割集结构函数求顶事件的故障概率的算法。该算法的基础思路是:将故障树的结构函数表示成最小割集和的形式,然后应用概率计算的基本公式求出系统故障发生的概率。即将系统的最小割集结构函数表达为
(1-17)式中:k——最小割集数;Mi(x)——某一最小割集,其定义为
(1-18)系统顶事件发生的概率,即是使
的概率,为
(1-19)对图1-7所示的故障树数,令底事件求顶事件
的发生概率分别为
,各最小割集间看做相斥事件,于是又系统(顶事件)故障发生的概率为:3、事件的重要度计算
故障树的各个底事件(或各最小割集)对顶事件发生的影响称为底事件(或最小割集)的重要度。研究事件对改善系统设计、提高系统的可靠性或确定故障监测的部位、制定系统故障诊断方案、减小排除故障的时间等具有重要意义。一个故障树往往包含有多个底事件,为了比较它们在故障树中的重要程度,在故障树的定量分析中常作结构重要度、概率重要度和关键重要度等计算。(1)结构重要某个底事件的结构重要度,是在不考虑其发生概率值得情况下,观察故障树的结果,以决定该事件的位置重要程度。由于底事件
的状态取0或1,当 Xi 处于某一状态时,其余n-1个底事件组合系统状态为
。因此,第i个底事件 Xi 的结构重要度定义为:
(1-20)式中,即第i个底事件为1;,即第i个底事件为0;n—底事件个数。该定义中,
表示底事件 Xi 和顶事件同时发生的状态组合数目,即表示底事件 Xi 不发生而顶事件发生的状态组合数目,即。两者相减则代表了底事件 Xi 发生则顶事件发生、且底事件 Xi 不发生顶事件也不发生的情况,这些状态组合与顶事件发生与否密切相关因此可以利用其数目与系统总状态数之比来表示底事件 Xi 的结构重要度。仍以图1-7所示的故障树为例来说明事件结构重要度的计算方法。为此,先列出底事件状态与顶事件状态表,如表1-3所示。表1-3 底事件状态与顶事件状态对底事件1来说,首先找出底事件1和顶事件同时发生的集合即
,有(1001)、(1010)、(1011)、(1101)、(1110)、(1111)共6个,再找出底事件1不发生而顶事件发生的集合,即
,有(0011)、(0101)、(0111)共3个,于是可得底事件1的结构重要度为:同时可得:即在此例中,底事件4的结构重要度最高:(2)概率重要度底事件 Xi 发生概率的变化引起顶事件发生概率的变化程度定义为该底事件的概率重要度,记作
其数学表达式为
(1-21)由于在一般情况下,有
(1-22)式中:g(P)——顶事件发生的概率Pi——顶事件Xi发生的概率因此,底事件Xi的概率重要度为
(1-23)式中:g(1iP)——底事件发生时顶事件发生的概率;Pi——底事件Xi发生的概率。由式(1-21)可得顶事件发生概率
的变化量
与底事件发生概率的变化量间的近似关系为
图1-7所示故障树种各底事件的概率重要度(假定P1=0.01, 可P2=0.05,P3=0.02,P4=0.03)可如下求得:对于底事件1而言,在表1-3中找出只有右边的
(此时
),而左边的
(此时
)的事件组合,即只有底事件1发生顶事件才发生的事件组合,为(1001)、(1010)和(1110),把各底事件看成相互独立、各事件组合看成相斥,应用式(1-23)可得:同理可得即
(3)关键重要度底事件Xi发生概率的变化率的改变引起顶事件发生概率变化率的改变程度定义为该底事件的关键重要度,记作
,其数学表达式为即关键性重要度是顶事件发生概率与某事件概率变化率之比,式中 g(P) 为顶事件发生的概率。关键性重要度 Ic(i) 与概率重要度的关系为
(1-26)仍以图1-7所示的故障树为例,前已求得顶事件发生的概率为,于是可得底事件
的关键性重要度分别为:
即
。由以上讨论可以看出,对于不同的重要度定义,各底事件间的相对重要程度是不同的。