1. 引言
随着传统金融行业面向数字化转型的迫切需求,银行的各种业务交易和各项金融服务由软件系统完成,其软件系统的建设工作均被信息部门承接。银行软件的核心是处理资金交易,任何系统故障或安全漏洞都会导致资金损失,甚至引发大规模的金融风险。可靠的软件可以确保交易的准确性和实时性,避免因系统问题带来的资金错误或丢失。一旦软件发生故障,就会对银行业务造成影响甚至可能造成巨大损失。例如:2012年,英国皇家银行因软件更新失败导致了广泛的系统故障,影响了数百万客户的日常银行业务。问题源于系统升级过程中一项操作出现错误,导致银行的核心账务系统无法正常处理交易。2018年,英国TSB银行在将其IT系统从母公司西班牙萨班德银行的平台迁移到自主平台时,发生了严重的技术故障。迁移过程中的错误导致银行系统瘫痪,客户无法访问账户长达数周。如今已经有大量研究人员对软件可靠性模型进行研究,其中最常用的一类是NHPP (Non-homogeneous Poisson process)类软件可靠性模型,该模型的特点是假设累计故障数服从非齐次泊松过程。原始的NHPP类模型是G-O模型,其后相继提出了Delayed S-shaped、Inflection S-shaped以及Yamada等经典模型。
Wang等[1]研究了软件测试人员在排除故障时也有学习的现象,当检测到的故障排除后,引入的故障数量逐渐减少,建立了一种故障引入的趋势呈递减趋势的软件可靠性模型。Heliyon等[2]提出一种基于动态加权NHPP模型的基于增强邻域的粒子群优化(NPSO)技术的新方法,用于带有附加故障引入参数的软件可靠性分析。Li等[3]提出一种将S型测试工作量函数纳入具有不完善调试的NHPP软件可靠性模型。Li等[4]将不完善的调试和运行环境的不确定性及其对故障检测率的影响涵盖到基于非齐次泊松过程(NHPP)的软件可靠性评估中。Jain [5]提出一种引入测试工作量(TEF)和故障减少因子(FRF)和不完善的调试软件可靠性增长模型。Song [6]考虑软件测试受环境的影响,提出一种具有受操作环境影响的威布尔故障检测率函数的软件可靠性模型。后续研究学者还利用随机微分方程来建立软件可靠性模型。Chaudhary [7]在故障检测率中融入了变化点概念,提出了一种基于随机微分方程(SDE)的软件可靠性增长模型。Chatterjee [8]考虑软件可靠性受软件故障的严重程度以及各故障被修复的优先级的影响,建立了一种基于随机微分方程的软件可靠性模型,将故障检测与故障发生的严重程度联系在一起,并将纠正故障的过程与缺陷修复的优先级联系在一起。Yang等[9]考虑了具有多个子模块的软件系统的复杂性,引入屏蔽数据,提出一种基于随机微分方程(SDE)的多组件软件可靠性加性模型。Singh等[10]考虑软件故障修复、功能增强和添加新功能等情况,给故障排除率带来了不确定性,使用三维维纳过程定义了三种波动类型,提出了一个统一的模型框架。Kapur [11]考虑到大规模软件每次调试检测到并消除的故障数量的变化与测试阶段开始时的初始故障内容相比变得足够小,提出一种基于随机微分方程的广义Erlang模型。Fang [12]等采用随机微分方程对软件故障检测过程进行置信区间估计,为软件开发人员和测试人员进行软件开发和软件质量控制提供了有益的信息。本文考虑了软件故障跟踪系统中故障报告存在随机性、不规律性以及各种不确定因素的影响,利用随机微分方程建立软件可靠性模型,并且为了更好地适应银行软件故障特点,采用广义拐点S型分布作为故障检测率函数。
2. 随机微分方程软件可靠性模型框架
2.1. 模型假设
随着软件系统规模不断扩大,故障检测过程充满不确定性。针对这种不确定性,将系统的故障视为一种随机过程,利用随机微分方程对系统可靠性进行建模。
基于随机微分方程软件可靠性模型假设如下:
1) 故障检测过程可以看作是一个随机过程。
2) 软件系统中残留的故障数量随着测试时间逐渐减少,并且检测到的故障去除时不会引入新的故障。
3) 在故障检测过程中,故障检测率随测试时间不规则变化。
4) 系统剩余缺陷引起软件失效。
记
为
时间段内检测到的累积故障数,
是一个独立增量过程;由假设可以得到微分方程:
(1)
(2)
其中,
表示软件系统中预期的总故障数,
为故障检测率函数,表示时间
时每个故障被检测的概率。
含有不规则波动,其中
表示不规则波动的正常量,
为标准高斯白噪声,并且有下列性质,
将式(1)带入(2)可以得到:
(3)
式(3)可以被扩展成下列的伊藤(Ito-type)类随机微分方程,
(4)
其中
表示布朗运动或者是一维维纳过程。
2.2. 基于随机微分方程和广义拐点S型故障检测率的软件可靠性模型
为了适应银行软件测试数据,本文采用广义拐点S型故障检测率函数作为
,该函数允许对每个故障函数的非单调故障检测率进行建模,是一种非常灵活的故障检测率函数。即:
(5)
其中,
、
和
分别是尺度参数、形状参数和拐点参数,用来表示软件测试中的故障检测行为。根据(3~5)即可得到随机微分方程:
(6)
通过伊藤公式求解
:
(7)
得到本文提出的GISS_SDE模型,其期望检测出的故障数量
可以表示为:
(8)
2.3. 模型的参数的极大似然估计
记
表示
个观察到的系统软件故障数据对,
表示在时间段
内检测到的故障数量,
的联合分布函数可以表示为:
(9)
其中,
表示系统软件在
时刻累计检测出的故障数量。根据式(7)和(9),
的概率分布为:
(10)
构造对数似然函数:
(11)
本文提出模型的参数
,
,
,
和
的最大似然估计值
,
,
,
,
可以通过解以下方程得到。
(12)
2.4. 模型评价指标
均方误差(MSE):预测值与实际值偏差的平方和与观察次数N的比值:
(13)
其中
为模型的预测值,
为
时刻真实故障数。MSE值越低,表明拟合误差越小。
3. 数值案例
为了充分、有效地评估提出的改进模型的拟合和预测性能,本节使用了经典NHPP模型:GO模型、DSS 模型、ISS模型,GISS模型以及本文提出的GISS_SDE模型对计算结果进行对比分析,见表1。
Table 1. Model summary table
表1. 模型汇总表
模型序号 |
模型名称 |
模型的均值函数 |
Model1 |
GO |
|
Model2 |
ISS |
|
Model3 |
DSS |
|
Model4 |
GISS |
|
Model5 |
GISS_SDE (本文提出的模型) |
|
3.1. 数据说明
本文数据来自MISYS资金交易系统项目,MISYS资金交易系统是A银行外购的一个资金业务中后台系统。 该项目测试对象包含在此升级过程中所涉及或关联到的所有系统。系统包括:资金产品管理系统、数据仓库系统、主机业务系统(境内)、资金业务管理系统(境内)等。选取2020年6月29日到2020年9月2日检测到的故障数(共33组数据),累计检测故障133个。
3.2. 参数估计结果
使用表2中A银行MISYS资金交易系统项目失效数据对经典模型和本文模型进行参数估计,参数估计结果及评价指标见表3。
Table 2. Bank A’s MISYS fund trading system project failure data
表2. A银行MISYS资金交易系统项目失效数据
时间 |
累计故障数 |
时间 |
累计故障数 |
时间 |
累计故障数 |
1 |
0 |
14 |
70 |
27 |
103 |
2 |
3 |
15 |
71 |
28 |
105 |
3 |
5 |
16 |
83 |
29 |
107 |
4 |
20 |
17 |
76 |
30 |
109 |
5 |
28 |
18 |
80 |
31 |
110 |
6 |
33 |
19 |
82 |
32 |
111 |
7 |
37 |
20 |
84 |
33 |
113 |
8 |
42 |
21 |
86 |
|
|
9 |
46 |
22 |
89 |
|
|
10 |
51 |
23 |
93 |
|
|
11 |
52 |
24 |
84 |
|
|
12 |
57 |
25 |
96 |
|
|
13 |
65 |
26 |
102 |
|
|
Table 3. Model summary table
表3. 模型汇总表
模型名称 |
参数估计值 |
MSE |
GO |
a = 159.371 |
32.816 |
k = 0.08154 |
ISS |
a = 199.5048 |
21.25524 |
b = −0.8601 |
k = 0.0108 |
DSS |
a = 141.4787 |
130.1294 |
k = 0.2212 |
GISS |
a = 204.317 |
21.24545 |
b = 0.9210 |
c = 0.6356 |
k = 0.2068 |
GISS_SDE 本文提出的模型 |
a = 225 |
21.21 |
b = 0.9771 |
c = 0.6018 |
δ = 0.00785 |
k = 0.2038 |
3.3. 模型性能对比分析
从图1和表3可以看出经典非齐次泊松过程模型里GISS模型效果最好,MSE值为21.245,其次是ISS模型,MSE值为21.25524,DSS模型效果最差,MSE值为130.1294,针对GISS模型来说,本文改进后的GISS_SDE模型效果要优于GISS模型,其MSE值为21.21。
Figure 1. Fitting diagram of the cumulative number of faults of each model
图1. 各模型累计故障数拟合图
图2为相对误差拟合对比图,通过绘制各个模型的相对误差曲线(Relative error curve),GISS_SDE模型随着时间的增长,其波动程度最小,并最终趋近于0,表明GISS_SDE模型对数据拟合的适应性最强。因此本文提出的模型更适合评估所选银行软件的可靠性。
Figure 2. Comparison chart of the relative error fitting of each model
图2. 各模型相对误差拟合对比图
4. 结论
在数字经济时代,软件的可靠性对银行的影响深远且广泛,直接关乎银行的运营效率、客户体验、业务连续性和市场竞争力。然而银行软件系统规模的显著扩大,导致软件测试故障的报告存在随机性、不规律性以及各种不确定因素,这些因素往往会影响对银行软件可靠性评估。本文基于随机微分方程将广义拐点S型分布作为故障检测率,提出一种新的软件可靠性模型,并将其应用到A银行MISYS资金交易系统项目中。通过绘制累计故障数拟合图和各模型相对误差对比图得出结论,本文提出的模型相较于其他经典非齐次泊松过程类软件可靠性模型具有更好的拟合效果,为评估银行软件可靠性提供了有价值的贡献。
NOTES
*通讯作者。