随着高新技术迅猛发展,并成功运用于高档数控机床、航空发动机、高速列车、
核电设备等复杂系统的研制和生产过程中,复杂系统的信息集成化、系统精密化、
功能智能化程度不断提高。然而,复杂系统服役环境异常恶劣,长时间在高温、低
温、高压、高转速、复杂载荷等环境下工作,导致系统寿命周期短、故障发生频率
高、故障引发损失惨重。国内外由于复杂系统及其结构失效引发的重大安全事故屡
见不鲜。在航天领域,2011 年 8 月,俄罗斯 U 运载火箭由于燃料运输管路堵塞造
成燃气发生装置故障而导致****失败。2015 年 4 月,美国猎鹰 9 号火箭推进器气
压阀失灵引发爆炸,当空解体。2021 年 9 月 5 日,美国“Firefly”航天公司****首
枚阿尔法火箭由于发动机引擎异常关闭导致****失败。在航空领域,据美国空军统
计,在飞行事故中,由航空发动机故障造成的约占 43%,其中结构故障约占航空发动机故障的 50%[
1]。据不完全统计,我国军用航空发动机结构故障引起空中停车约
占总故障的 45%,其中,涡轮叶片、传动齿轮、主轴轴承等关键零部件的失效是主
要原因[
2]。因此,亟待对复杂系统及其关键部件开展可靠性评估和剩余寿命预测,
揭示系统服役阶段状态的动态演变规律,发现影响装备状态退化和失效的潜在因
素,从而为装备可靠性设计、故障预警以及预测性维修管理提供决策依据。由于该
研究领域的重要性和紧迫性,《中国制造 2025》[
3]和《中华人民共和国国民经济和
社会发展第十四个五年规划和 2035 年远景目标纲要》[
4]均将高端数控机床和航空
发动机等重大技术装备及其关键技术作为原创性引领性科技攻关和大力推动重点
突破发展的领域,力求确保复杂系统服役过程的可靠与安全。可靠性是我国重大技术装备论证、设计研制与研究过程中一个重要的技术指
标。可靠性技术包括可靠性设计、可靠性评估和可靠性试验等。系统可靠性的研究
范畴主要是刻画系统及其部件的可靠性特征如:浴盆曲线、平均失效时间、寿命分
布等,以及阐明部件的可靠性特征与系统的状态演变之间的关联关系[
5]。系统可靠
性评估旨在发现系统退化规律、部件间相互关联关系以及系统可靠性薄弱环节,对
系统可靠性设计(如:冗余设计)、可靠性增长以及运行维护具有重要指导意义。剩
余寿命预测是指利用是系统服役过程中状态监测数据、观测数据甚至专家对系统
状态的经验判断数据对系统的剩余使用寿命进行预示,旨在预知故障发生时间或
者系统健康状态首次穿越失效阈值的时间[
6]。剩余寿命预测结果能够为复杂系统的
故障及时预警和后续智能运维管理提供有效地决策依据,因此对于提升高端装备
核心竞争力和降低系统失效风险具有重大意义。
然而,复杂系统及其搜集到的与系统可靠性特征相关的信息具有以下几个特
点,导致系统可靠性评估和剩余寿命预测极具挑战。
(1)系统及其部件的多状态特性。复杂系统在服役过程中普遍呈现出多状态的
退化物理机制与特征。可靠性起源于二战时期电子产品可靠性研究。由于电子产品
只存在完好和完全失效两种状态,因此,传统的可靠性分析方法都是假定所研究的
系统为二状态系统。经过近 70 年的发展,目前二状态系统可靠性理论体系已经基
本成熟完善。然而,随着可靠性理论逐渐渗入机械、工业各个领域,以及人们对复
杂系统失效机理和规律的深入研究,发现复杂技术系统及组成部件在服役阶段呈
现出状态逐级退化、性能渐变的多状态特征,系统和部件从正常工作到完全失效将
经历若干中间状态。在这种情况下,采用常规的二状态系统可靠性理论分析多状态
系统可靠性已是捉襟见肘,故亟待开展多状态系统可靠性评估。
多状态系统指系统除了“正常工作”和“完全失效”两种状态之外,还具有多
种工作或失效状态,或系统能够在多个不同性能状态水平下运行,并且组成该系统的部件同样也可能具有多状态特征[
7]。在实际工程中,很多类型的系统都可视为多
状态系统:①系统或部件在服役阶段呈现出多种不同的失效模式[
8],如:航空发动
机主轴轴承存在内圈失效、外圈失效、滚珠失效等失效模式;②组成系统的部件其
性能对系统总的性能有累积效果[
9],如:计算机内存由多个内存条提供;③部件的
状态变化将引起系统性能水平/工作效率的变化[
7],[9],如:能源系统中发电站发电水
平的退化导致整个发电性能水平的变化;④系统健康状况的连续衰退过程被划分
成若干个状态退化水平[
10],[11],如:航空发动机传动齿轮滑动磨损过程可划分为完
好工作、轻度磨损、中度磨损、深度磨损以及完全失效等离散状态。
由于多状态系统能更准确地描述系统性能的复杂变化行为,目前已经在各类
工业系统应用中取得了较为显著的效果[
12]-[14]。如图 1-1 所示,在能源系统中,发
电系统以及电力传输系统由于发电机组部件和变电机组部件老化导致性能容量
(Performance Capacity)逐级退化。因此,整个能源系统构成一个多状态系统[
15]-[17];
在制造系统中,整个系统任务处理速度取决于机器视觉检测单元、数据传输单元、
数据处理单元以及机械手操作单元等对事件响应速度。由于不同单元可用带宽、处
理效率不同导致整个制造系统任务处理速度也可以用一个多状态系统描述[
18]-[20];
在通信系统中,****、中继塔和终端等连接与覆盖情况也可以构建成一个多状态系
统[
21]-[23];在典型的机械工程系统中,轴承内、外圈裂纹以及齿轮齿根部位弯曲裂
纹生长过程也可粗略的划分为几个不同的严重等级[
8],[10],[11]。由此可见,多状态特
性已经成为复杂系统典型特征,对复杂系统可靠性评估势必要考虑其多状态特性。
(2)系统多物理层次特性。复杂系统往往具有复杂的物理层次结构(如:部件-
(多层)子系统-系统),部件的状态退化将诱发子系统的状态变化并引起系统状态的
改变[
24]-[26]。另外,由于部件、子系统和系统均具有多状态特征,部件与系统的状
态之间具有十分复杂的映射关系。要研究整个系统状态演变过程,就必须先掌握系
统所包含子系统、子系统所包含部件的状态演变过程。在实际工程中,往往会从系
统多个物理层次搜集可靠性特征数据,旨在全面掌握系统关键部件和子系统的性
能退化规律,为后续精准的预测性维修提供数据支撑。图 1-2 示意了 GTF(Geared
TurboFan)航空发动机的多物理层次结构以及相应可能收集到的状态监测数据。整
个 GTF 发动机可以看成由风扇、齿轮减速箱、低压压气机、高压压气机、燃烧室、
高压涡轮和低压涡轮等主要子系统组成,而每个子系统由一些关键部件构成,如:
其齿轮减速箱可以由行星轮、内齿轮、太阳轮、轴承和供油管等关键部件构成[
27]。
不同物理层次有不同类型的状态监测数据,例如:系统层的气动参数数据、子系统
风扇的速度、扭转振动、压气机的出口脉动压力以及齿轮减速箱的关键部件温度、
振动数据等[
28]。可以看出,系统的物理结构复杂性与多层次性造成其可靠性数据