1. 引言
随着我国民用航空运输事业的高速发展和民用航空器适航管理的不断深入,国内维修单位及航空公司的工程管理部门都越来越意识到研究飞机故障产生机理以及其影响因素重要性,特别是某一时段或某一季节的频发故障的预测,以便民航维修机务工作提前采取有效措施,从而避免故障的多发性、频发性,提高航班的正常率,降低延误率,从而提高航空维修企业的工程维修管理水平,增加航空维修企业的经济效益。
我国民航维修普遍停留在定性分析、全员动员而进行故障的预防方式,没有真正实现采用故障的定量、定性相结合排故理念来开展故障预测。因此在国内有必要对故障发生的可靠性数据进行分析,研究故障的发生机理,从而提出基于时间序列预测法进行多发、频发故障的预测,进而提出防范的方法及措施角度开展研究工作[1] [2]。
2. 故障数据及统计学方法
2.1. 数据来源及处理
故障数据来源于南方航空股份有限公司沈阳维修基地航线故障数据。故障数据涉及的机型为MD90飞机,此种型号飞机为国内航线的主力机型,具有很强的代表性。数据收集后,首先进行数据的预处理,按时间区段进行统一化处理,选取1997年至2006年的数据并将数据进行合成。数据经过核对、补漏,从而保证数据的准确和完整。样本序列时间段选取1997年1月至2006年12月,2007年12个月的观测值留出,作为评价预测精度的参照对象,表1给出了处理后平均单架次飞机1997~2006年故障数统计表,数据来源于整个机队的空调系统,图1给出了飞机故障分布折线图。
Table 1. Statistics of average failures per flight from 1997 to 2006 after treatment
表1. 处理后平均单架次飞机1997~2006年故障数统计表
|
1 |
2 |
3 |
4 |
5 |
6 |
1997:01-06 |
46.16667 |
31.16667 |
32.83333 |
35.16667 |
52.00000 |
46.50000 |
1997:07-12 |
37.66667 |
37.66667 |
31.16667 |
30.16667 |
31.16667 |
31.83333 |
1998:01-06 |
29.83333 |
27.00000 |
39.00000 |
30.83333 |
33.00000 |
37.16667 |
1998:07-12 |
40.33333 |
43.83333 |
37.66667 |
36.00000 |
35.50000 |
34.83333 |
1999:01-06 |
24.00000 |
18.00000 |
28.83333 |
28.83333 |
34.66667 |
38.00000 |
1999:07-12 |
38.16667 |
45.50000 |
35.33333 |
35.33333 |
27.83333 |
24.33333 |
2000:01-06 |
23.16667 |
20.16667 |
27.66667 |
24.16667 |
29.50000 |
29.00000 |
2000:07-12 |
40.16667 |
45.16667 |
36.66667 |
34.16667 |
39.50000 |
36.66667 |
2001:01-06 |
35.83333 |
34.33333 |
39.33333 |
43.50000 |
55.83333 |
51.83333 |
2001:07-12 |
52.66667 |
56.83333 |
63.16667 |
56.33333 |
50.33333 |
55.00000 |
2002:01-06 |
54.50000 |
47.33333 |
46.83333 |
50.50000 |
54.83333 |
62.00000 |
2002:07-12 |
62.83333 |
57.16667 |
55.83333 |
55.50000 |
56.83333 |
53.83333 |
2003:01-06 |
50.00000 |
49.83333 |
62.33333 |
60.16667 |
59.50000 |
60.50000 |
2003:07-12 |
59.83333 |
71.50000 |
52.16667 |
47.33333 |
45.50000 |
51.00000 |
2004:01-06 |
48.00000 |
47.50000 |
47.33333 |
51.16667 |
50.00000 |
51.16667 |
2004:07-12 |
59.00000 |
56.16667 |
46.33333 |
38.33333 |
39.83333 |
48.33333 |
2005:01-06 |
47.50000 |
44.16667 |
46.33333 |
39.83333 |
43.16667 |
39.66667 |
2005:07-12 |
49.50000 |
44.66667 |
41.00000 |
31.83333 |
32.83333 |
33.50000 |
2006:01-06 |
33.33333 |
31.66667 |
37.66667 |
33.33333 |
33.16667 |
38.66667 |
2006:07-12 |
41.33333 |
39.83333 |
39.50000 |
36.00000 |
36.83333 |
35.66667 |
![]()
Figure 1. MD90 single flight failure distribution line chart
图1. MD90单架次飞机故障分布折线图
2.2. 统计学方法
运用EXCEL2003及Eviews对1997年1月至2007年12月MD90机队单架飞机故障数据进行整理分析,统计出单架飞机每月发生故障数作为时间序列,观察飞机故障发展趋势,应用时间序列分析方法,建立数学模型,并对预测值和实际值比较。
3. 理论与模型介绍
在实际情况中,绝大部分序列都是非平稳的,同样,飞机故障序列也是一个非平稳时间序列,目前对非平稳序列的分析各种分析方法非常多。本文采用建立组合模型的方法对该序列进行分析,它是从系统分析的观点出发,用确定性模型描述序列中确定性因素的变动规律,用ARMA模型刻画序列中随机因素的一般规律性,从而建立起确定性加随机的组合模型。在组合模型中既有确定部分,又有随机部分,因而用以描述某些类型的非平稳过程,往往能够得到满意的效果,建立组合模型的方法分为以下三个步骤[3] [4]:
(1) 根据时间序列特征,用一定函数形式拟合序列的确定性组成部分,直到剩余序列平稳为止;
(2) 对剩余序列拟合合适的ARMA模型;
(3) 将分别拟合的确定性模型和ARMA模型结合起来并以其参数作为初始值,用最小二乘法估计模型的参数,得到最终的组合模型。
从图1可看出,序列具有较强的循环变动和季节变动,而长期趋势变动表现为停留在某一水平线上。通过图1可以清晰看出,每年6~7月份,故障数会出现峰值,而在每年的12月份左右,故障数目相对较少,这充分反映出序列的季节变动。同时也可看出序列有类似三角函数的超过一年的周期波动,即存在循环波动。最后,观察序列无异常点,故不存在突然变动,但存在随机波动。通过以上分析,本文采用了下面的建模过程:
(1) 季节调整:消除季节因素,得到新变量
和季节因子
。
(2) 对季节调整后的新变量ASA建立组合模型。
① 循环性拟合:消除季节因素后的序列仍有明显的循环波动,初步判断可以用三角函数拟合;
② ARMA模型的建立:消除循环性波动后的序列经过平稳性检验,如果是平稳序列就可以用ARMA模型进行建模;
③ 包含循环项和随机项的组合模型:前面已经分析过,季节调整后的时间序列包含循环项和随机项,循环项使用余弦函数拟合,随机项采用ARMA模型拟合,模型的方程如下:
,其中
为循环项,采用余弦函数拟合,
为随机项。
(3) 建立含季节项的最终模型:上述组合模型的建立是针对季节调整后的序列进行拟合的,如果要对原始序列拟合,必须考虑季节因子的影响,在上面季节调整过程中,已经计算出季节因子,所以求原始序列的拟合方程,只需要把上述拟合方程和季节因子叠加在一起即可。
4. 实例分析
4.1. 季节调整
根据Eviews绘制的折线图,可见原始序列(记为
)无整体趋势,但存在季节变动和周期变动,应用Eviews得到序列的自相关图和偏自相关图,可以发现自相关图存在很强的季节性,故首先对原序列进行季节调整可以看到序列是非平稳的,为了消除序列趋势,首先对序列进行季节调整(图2),得到季节调整因子
,调整后的序列命名为ASA。
Figure 2. Line chart of the new variable ASA after eliminating seasonal factors from variable A
图2. 由变量A消除季节因素后的新变量ASA的折线图
4.2. 循环项拟合及ARMA模型识别
消除季节因素后的序列ASA仍有明显的循环波动,初步判断可以用三角函数拟合,本文采用余弦函数,其表达式为:
(1)
其中:
为截距项,
为幅值项,
为角速度项,
为初相位项。
对于变量
采用余弦函数拟合具有较好的效果,R-squared系数为0.76,回归方程的系数
、
、
、
所对应的p值为零,说明方程系数显著不为0。另外,通过余弦函数对变量
进行循环项拟合,可以得到相应的残差列(图3),并命名为ASA_cos。
Figure 3. Variable ASA fitting results and residual curve
图3. 变量ASA拟合结果和残差曲线图
然后对该序列进行平稳性检验,如果是平稳序列,可直接使用ARMA模型进行拟合。在Eviews中,常用的平稳性检验方法为ADF检验,检验结果中ADF值为−3.137431,其值小于5%置信水平对应的临界值−2.8865,因此可以判断序列“ASA_cos”为平稳序列。通过Eviews得到自相关函数图和偏自相关函数图,发现序列自相关函数图有拖尾现象,偏自相关函数图4阶截尾,所以选取4阶自回归模型。在EViews中,经过拟合后,因为C、AR(2)、AR(3)没有显著性,所以予以剔除,AR(2),AR(4)分别为0和0.08,虽然AR(4)项为0.08,相对于0.05的置信水平并无显著性,但其值并不是特别大,而且经过后面的组合模型的建立,在模型中保留AR(4)项后,最终的组合模型的估计效果会更好[5] [6]。
4.3. 组合模型建立
前面已经分析过,季节调整后序列ASA包含循环项和随机项,循环项使用余弦函数拟合,随机项采用AR(1),AR(4)自回归模型拟合,模型的方程如下:
(2)
其中
为循环项,采用余弦函数拟合,
为随机项,采用AR(1),AR(4)模型拟合。
使用Eviews进行方程估计,最终得到下列估计方程,残差见图4。
(3)
其中:
,
是以月份为单位的时间,
用来描述序列ASA中循环变动的确定性部分。
Figure 4. Diagram of the residual results of the sequence ASA_cos
图4. 序列ASA_cos残差结果示意图
使用Eviews中的“correlogram Q statistics”功能,可判断残差是否独立,计算结果如下:
Figure 5. Schematic diagram of residual correlation calculation results
图5. 残差相关性计算结果示意图
从图5中可以看出,残差序列白噪声检验的相伴概率Prob均远大于5%,说明残差满足独立性假设,模型拟合较好。
4.4. 含季节项的最终模型
上述采用组合模型只是针对序列
的拟合,如果要对原始序列
拟合,必须考虑季节因子的影响,在上面季节调整过程中,已经计算出季节因子,由于在季节调整时,采用的是乘法模型,所以序列
的拟合方程可表示为:
(4)
其中,
,图6给出了原序列
(实线)和预测序列AF (虚线)的计算结果,说明方程拟合效果较好。
Figure 6. Schematic diagram of the comparison results of sequences A and AF
图6. 序列A、AF比较结果示意图
4.5. 预测
利用上述组合模型对2007年1月至2007年12月的单架MD90飞机月发故障数进行预测,预测结果如表2所示,从表2可看出预测效果较好。
Table 2. MD90 single aircraft monthly failure prediction results in 2007
表2. MD90单架飞机2007年月发故障预测结果
|
1月 |
2月 |
3月 |
4月 |
5月 |
6月 |
7月 |
8月 |
9月 |
10月 |
11月 |
12月 |
实际值 |
47.3 |
46.8 |
50.5 |
54.8 |
62 |
62.8 |
57.1 |
55.8 |
55.5 |
56.8 |
53.8 |
50 |
预测值 |
51.0 |
46.6 |
55.1 |
52.6 |
57.7 |
60.1 |
65.4 |
68.8 |
59.5 |
54.7 |
53.9 |
55.1 |
5. 结束语
整体民航飞机故障曲线呈现具有以年为周期的变化曲线,并且呈现波峰和波谷交替状态,一般在每年7、8月份出现大的波峰;另外两次小的波峰出现在3、12月份,出现的偏差约为±15天左右;通过对收集整理的十年故障数据研究分析,整体故障趋势呈现以8年左右为周期的波浪型曲线,在大的波浪曲线中会显示每年呈现季节性变化的跳动。通过对曲线的分析,同时结合飞机的故障统计,发现每年出现的与季节性正相关的大的波峰情况与飞机一些系统在雨雪季节的特定气候相关,飞机的这些系统包括:空调系统、电子电气系统等,这些系统在该季节频繁出现故障,从而带来相对较高的波峰值。不同季节所出现的环境因素对飞机的一些敏感系统会产生一定的不利影响,从而导致一系列故障的产生,因此换季时期也是故障多发期。做好换季工作,针对不同季节的多发故障准备相应的维修预案采取预防性维护,可以避免或消除大量的故障隐患,从而提高飞机的安全性能。