3.3 失效模式与影响分析(FMEA)和故障树分析(FTA)3.3.1失效模式与影响分析(FMEA)失效模式与影响分析早期用于美国宇航及军方产品,是一种预测产品设计及生产过程中可能出现的问题点,进而评价其危险度并进行事先预防的质量工具。现在已成为一种广泛使用的可靠性分析技术用于制造业与服务业,尤其是国际上实行产品召回制度以后,更加受到人们重视。研究可靠性、维修性国际技术标准的国际电工委员会(IEC)的技术委员会TC56,已从1979年开始制定了FMEA与FTA的有关国际标准。失效模式与影响分析技术贯穿产品生命周期管理的全过程,按用途和使用阶段可以分为系统失效模式与影响分析(System FMEA)、设计失效模式与影响分析(Design FMEA)、流程失效模式与影响分析(Process FMEA)以及软件失效模式与影响分析(Software FMEA)四种,在设计阶段主要使用的是前两种。其中严重度、发生度与检出度的评价标准详见下表:分值 严重度 发生度 检出度10 与安全或政府规定 事项抵触1/2 以上不可避免
无法找出故障原因 9 与预期的安全或政府规定事项抵触1/3 找出故障原因的可能性极小8 主要功能失效1/8 反复出现 找出故障原因的可能性较小7 主要功能受限1/20 找出故障原因的可能性非常低6 一般功能失效1/80 找出故障原因的可能性低5 一般功能受限1/400 找出故障原因的可能性一般4 大多数顾客可以感知的缺陷1/2000 找出故障原因的可能性较高3 部分顾客可以感知的缺陷1/15000 基本没有 找出故障原因的可能性高2 少数顾客可以感知的缺陷1/150000 找出故障原因的可能性非常高1 没有缺陷 1/1500000 以下几乎不可能 很容易找出故障原因
从FMEA本质来说是一种从原因向系统故障(自下而上)分析系统可靠性的定性分析手段,其使用一系列表格列举系统构成模块/部件的所有故障模式,并假定故障发生,继而找出系统可能发生的故障。在将故障项进行RPN权重分析后,统计汇总形成致命项目表,一方面用于提供设计评审使用,另一方面用于为DOE提供改善目标与依据进行设计改善。
由于FMEA在使用中局限在单一故障模式的分析上,因而是孤立的分析,缺乏系统的分析视角;另外对于含大量部件,具有多重功能的工作模式和维修措施的复杂系统,以及环境影响大的系统,FMEA应用都较为困难;在FMEA的实际应用中,由于是定性分析,不可避免的要受到人为因素的影响,任何细微的敷衍了事都可能会造成整个分析的失败,这也是很多FMEA分析流于形式的重要原因。3.3.2故障树分析(FTA)FTA也是一种可靠性分析技术,但与FMEA不同的是,它是一种从故障向原因(自上而下)的分析方法,它将系统分解成树状图,从而对多重故障进行逻辑的、定量的分析。在实际应用中,FTA以某个特定的不希望发生的故障为顶事件,构建故障树模型,然后简化拆解为可靠性框图,进一步用最小割集、最小路集等方法进行更加深入的分析,不仅可以分析部件故障,还可以分析由于人员差错、软件错误、控制错误以及环境应力等引起的故障,最后从整个系统角度逻辑上明确故障的发生过程,用布尔代数定量计算顶事件的发生概率,再根据故障率计算出系统的可靠度。系统故障树由“与”(AND)、“或”(OR)门组成。相对应的,可靠性框图的结构由串联、并联两种基本单元组成,这里并不意味着系统的实际构成是一个在空间上和物理上自左向右的串联或并联结构,而是表示当功能流(实际的能量、信号、信息、交通量以及物质流等)从系统的左侧输入,从右侧输出时就实现了系统的功能,因而保证了系统的可靠性。还有一种例外的情况,就是由三个元素组成的单元,至少两个元素功能正常就可以的贮备单元,称为三取二单元。计算系统可靠度时,虽然可以使用枚举法利用真值表算出系统可靠度,但当单元数目增多,系统较为复杂时,这种方法就显得很烦琐,为了简化可靠度的计算,可以引入最小路集与最小割集的概念。所谓最小路集是指可靠性框图中表示功能流的实线从输入端至输出端所经过的单元的最小集合,只要其中的单元都没有故障,就可以确保系统的可靠度R。若用(P1,P2,…… ,Pm)表示最小路集,则系统可靠度可用3-3-2表示:R = P(P1 ∪ P2 ∪ …… ∪ Pm) (3-3-2)最小割集是指从系统不可靠度F的角度观察可靠性框图,从垂直于框图中连结实线的方向将系统单元切断时,引起系统故障的被切单元的最小集合。若用(C1,C2,…… ,Cm)表示最小割集,则系统不可靠度可用3-3-3表示:F = P(C1 ∪ C2 ∪ …… ∪ Cm) (3-3-3)在FTA的分析中,主要是以防止发生不希望的顶事件为目标的,因此主要是根据最小割集进行不可靠度分析,但同时也应求出最小路集,以便讨论哪些路径应当得到加强和改善。现在随着计算机技术的不断发展,也可以直接使用布尔代数按照系统故障树的结构直接计算出系统的可靠度或故障率。