中国科技术语

• 热点词\难点词 • 上一篇    下一篇

关于fault与failure,MTBF与MTTF的译名

闵应骅   

  1. 中科院计算所 北京 100080
  • 出版日期:2002-03-15 发布日期:2002-03-15

Discussions about the Chinese Translations on“Fault”and“Failure”,etc.

Min Yinghua   

  • Online:2002-03-15 Published:2002-03-15

摘要: 摘要 本文阐述了fault与failure,以及MTBF与MTTF的确切含义。建议分别译为故障、失效,平均失效间隔时间和失效前平均时间。
宋子寿教授在本刊[1]曾对failure和fault两个词,以及国内的相关标准,进行了详细的分析和解释。本文稍作补充,特别是在可靠性、容错计算、电子技术和计算机领域,根据美国电气电子工程师协会(IEEE)的标准[2],阐述这些词的含义。以此为出发点来考虑它们的中文译名。
一、failure与fault
failure定义为The termination of the ability of an item or equipment to perform its required function。[2]这就是说,某一项条款或某一个设备终止了它完成所要求功能的能力,就是failure。而fault则定义为A physical condition that causes a device,a component,or an element to fail to perform in a required manner。[2]这里说fault是一个device(注意,集成电路中的每一个门都是一个device,不见得是一个大型装置),一个元件或组件的一种物理状态,在该状态下,该元件不能按所要求的方式工作。另一个与此有关的术语是error。error在数学上是指误差,而在计算机和数据处理领域,则是指一个不正确的步骤、过程或结果。在国内电子和计算机领域,我们把fault译为故障,譬如集成电路或电路板上的混线故障,固定为0或1故障,存储器芯片的模式敏感故障,软件的某一条编写错误等。这些故障并不是很容易发现的,甚至是很难发现的。这就引出了一个门类的技术——测试技术。这些故障只有在某种条件下才能在其输出端产生差错(error),这些差错由于在系统内部,不是很容易就能观测到。只有这种差错积累到一定程度或者在某种系统环境下,才能使系统失效(failure)。所以,失效是面向用户的,而故障和差错是面向制造和维修的。也许有人会说,难道一个系统失效了,还不是有故障了吗?一个元件有故障了,不也就失去效力了吗?当然,这种译法只是想澄清一些名词的概念,使之明晰而已,并不是无懈可击的。也许有人会说,难道一个系统失效了,还不是有故障了吗?一个元件有故障了,不也就失去效力了吗?如此等等。我们希望汉语能够确切地适应时代潮流的发展,而不是模棱两可,概念含混。
二、MTBF和MTTF
按照[2]的定义,MTBF(Mean Time Between Failures)定义为The average time (preferably expressed in hours) between failures of a continuously operating device,circuit,or systems。这就是说,一个装置、电路或系统,如果是连续运行的,那末MTBF是两次失效间的平均时间。这里有个问题是:第一次失效之后,是怎样使它重新工作的。可能是经过修理或者重新启动而使之重新工作的。这个时间相对于长期运行来说可能是可以忽略的。如果修理时间较长,修理时间不算在内。因此,把MTBF译成“平均失效间隔时间”比较合适。按照我们对failure的理解,译成“平均故障间隔时间”就不合适。因为系统内存在某些故障并不意味着系统一定失效。事实上,现在的计算机系统中,存在计算机软件故障是很普通的,不过人们未能发现而已。IBM的操作系统甚至在现场运行十年后仍发现有故障,而IBM建议不要轻易去修理它,因为修理反而可能产生出更严重的故障。当今的许多容错(fault-tolerant)系统其实应该叫容故障系统。现在,又开始研究容灾系统、容侵系统等。
MTTF(Mean Time To Failure)主要是针对不可修复的系统,定义为The total operating time of a number of items divided by the total number of failures。取同样的多个元件、部件或系统在同样条件下运行,直到某些失效,总的运行时间除以失效个数可以以一定的置信度相信其到失效的平均时间。对于可修复的电子系统,由于电子器件在偶然失效期内,是否发生故障这样一个随机过程,假定是平稳的和马尔柯夫的如果系统在将来的状态只依赖于它现在的状态,而与它的过去无关,那么这个随机过程是马尔柯夫的①[3],到失效的平均时间与时间的起点无关。只要它工作,就和新的一样。所以,不必说明是从t=0到失效的平均时间。因此,把MTTF译为“失效前平均时间”是合适的。
至于MTBF与MTTF的关系,一般来说,MTBF主要是针对可修复系统的,而MTTF主要针对不可修复的系统。大家经常使用的MTBF=1/失效率,以及可用性=MTTF/(MTTF+MTTR)都是在系统失效工作时间与修理时间都服从指数分布的情况下推导出来的。这一点常常被人忽略。当然,这些表达式物理意义比较明显,容易被人接受。
三、结束语
科技术语的统一是一件很有意义的工作,它牵涉到中华民族语言的发展。有些国家语言的混乱是一个教训。我们总是希望汉语能够发扬光大,适应现代化的要求。但是,也应该看到,同一个英文术语在不同科技领域也有不同的用法,各公司或各方面科学技术专家也各有所好,甚至不断创造新词。对汉语名词,强求高度统一是困难的。但是,讲清术语的含义,互相交流,将有利于相互理解,及对报刊杂志和媒体信息的确切了解。
在此,笔者想介绍与这几个词相关的dependability(可信性)一词,它比可靠性含义更广泛。它虽然是1985年才提出的,但已有可信性标准,而且已经得到广泛应用。希望在译法上达成共识。现在有的媒体译为“可依赖”、“可信赖”等等。笔者以为译为“可信性”较好。
① 如果系统在将来的状态只依赖于它现在的状态,而与它的过去无关,那么这个随机过程是马尔柯夫的。