基于随机微分方程和广义拐点S型故障检测率的银行软件可靠性研究

doi:10.12677/ecl.2024.1341575

期刊菜单

基于随机微分方程和广义拐点S型故障检测率的银行软件可靠性研究
Research on the Reliability of Banking Software Based on Stochastic Differential Equations and Generalized Inflection Point S-Type Fault Detection Rate

DOI: 10.12677/ecl.2024.1341575, PDF, HTML, XML,
作者: 王震, 熊天骏：贵州大学数学与统计学院，贵州贵阳；杨剑锋^*：贵州大学数学与统计学院，贵州贵阳；南宁师范大学数学与统计学院，广西南宁
关键词: 随机微分方程；软件可靠性模型；银行软件；电子商务；Stochastic Differential Equations； Software Reliability Models； Banking Software； Electronic Commerce

摘要: 在数字经济时代，随着电子商务快速发展，银行软件系统的规模显著扩大，软件故障跟踪系统中故障的报告存在随机性、不规律性以及各种不确定因素，因此故障检测过程可以看作是一个随机过程。在软件可靠性领域，随机微分方程常用于描述软件故障的发生过程及其可靠性的动态变化，在故障检测率方面，广义拐点S型故障检测率往往具有更强的灵活性，因此本文提出一种基于随机微分方程和广义拐点S型故障检测率的软件可靠性模型，并使用极大似然估计方法对模型的参数进行估计。最后在A银行测试中心数据集上进行验证，实验结果表明本文提出模型对实验数据拟合效果最好。因此该模型相较于其他经典软件可靠性模型具有优越性。

Abstract: In the era of digital economy, with the rapid development of e-commerce, the scale of banking software systems has expanded significantly, and the fault reporting in the software fault tracking system has randomness, irregularity and various uncertain factors, so the fault detection process can be regarded as a random process. In the field of software reliability, stochastic differential equations are often used to describe the occurrence process of software failures and the dynamic changes of their reliability, and the generalized inflection point S-type fault detection rate is often more flexible in terms of fault detection rate, so this paper proposes a software reliability model based on stochastic differential equations and generalized inflection point S-type fault detection rate, and uses the maximum likelihood estimation method to estimate the parameters of the model. Finally, it is verified on the data set of A Bank test center, and the experimental results show that the proposed model has the best fitting effect on the experimental data. Therefore, this model has advantages over other classical software reliability models.

文章引用：王震, 杨剑锋, 熊天骏. 基于随机微分方程和广义拐点S型故障检测率的银行软件可靠性研究[J]. 电子商务评论, 2024, 13(4): 3719-3727. https://doi.org/10.12677/ecl.2024.1341575

1. 引言

随着传统金融行业面向数字化转型的迫切需求，银行的各种业务交易和各项金融服务由软件系统完成，其软件系统的建设工作均被信息部门承接。银行软件的核心是处理资金交易，任何系统故障或安全漏洞都会导致资金损失，甚至引发大规模的金融风险。可靠的软件可以确保交易的准确性和实时性，避免因系统问题带来的资金错误或丢失。一旦软件发生故障，就会对银行业务造成影响甚至可能造成巨大损失。例如：2012年，英国皇家银行因软件更新失败导致了广泛的系统故障，影响了数百万客户的日常银行业务。问题源于系统升级过程中一项操作出现错误，导致银行的核心账务系统无法正常处理交易。2018年，英国TSB银行在将其IT系统从母公司西班牙萨班德银行的平台迁移到自主平台时，发生了严重的技术故障。迁移过程中的错误导致银行系统瘫痪，客户无法访问账户长达数周。如今已经有大量研究人员对软件可靠性模型进行研究，其中最常用的一类是NHPP (Non-homogeneous Poisson process)类软件可靠性模型，该模型的特点是假设累计故障数服从非齐次泊松过程。原始的NHPP类模型是G-O模型，其后相继提出了Delayed S-shaped、Inflection S-shaped以及Yamada等经典模型。

Wang等[1]研究了软件测试人员在排除故障时也有学习的现象，当检测到的故障排除后，引入的故障数量逐渐减少，建立了一种故障引入的趋势呈递减趋势的软件可靠性模型。Heliyon等[2]提出一种基于动态加权NHPP模型的基于增强邻域的粒子群优化(NPSO)技术的新方法，用于带有附加故障引入参数的软件可靠性分析。Li等[3]提出一种将S型测试工作量函数纳入具有不完善调试的NHPP软件可靠性模型。Li等[4]将不完善的调试和运行环境的不确定性及其对故障检测率的影响涵盖到基于非齐次泊松过程(NHPP)的软件可靠性评估中。Jain [5]提出一种引入测试工作量(TEF)和故障减少因子(FRF)和不完善的调试软件可靠性增长模型。Song [6]考虑软件测试受环境的影响，提出一种具有受操作环境影响的威布尔故障检测率函数的软件可靠性模型。后续研究学者还利用随机微分方程来建立软件可靠性模型。Chaudhary [7]在故障检测率中融入了变化点概念，提出了一种基于随机微分方程(SDE)的软件可靠性增长模型。Chatterjee [8]考虑软件可靠性受软件故障的严重程度以及各故障被修复的优先级的影响，建立了一种基于随机微分方程的软件可靠性模型，将故障检测与故障发生的严重程度联系在一起，并将纠正故障的过程与缺陷修复的优先级联系在一起。Yang等[9]考虑了具有多个子模块的软件系统的复杂性，引入屏蔽数据，提出一种基于随机微分方程(SDE)的多组件软件可靠性加性模型。Singh等[10]考虑软件故障修复、功能增强和添加新功能等情况，给故障排除率带来了不确定性，使用三维维纳过程定义了三种波动类型，提出了一个统一的模型框架。Kapur [11]考虑到大规模软件每次调试检测到并消除的故障数量的变化与测试阶段开始时的初始故障内容相比变得足够小，提出一种基于随机微分方程的广义Erlang模型。Fang [12]等采用随机微分方程对软件故障检测过程进行置信区间估计，为软件开发人员和测试人员进行软件开发和软件质量控制提供了有益的信息。本文考虑了软件故障跟踪系统中故障报告存在随机性、不规律性以及各种不确定因素的影响，利用随机微分方程建立软件可靠性模型，并且为了更好地适应银行软件故障特点，采用广义拐点S型分布作为故障检测率函数。

2. 随机微分方程软件可靠性模型框架

2.1. 模型假设

随着软件系统规模不断扩大，故障检测过程充满不确定性。针对这种不确定性，将系统的故障视为一种随机过程，利用随机微分方程对系统可靠性进行建模。

基于随机微分方程软件可靠性模型假设如下：

1) 故障检测过程可以看作是一个随机过程。

2) 软件系统中残留的故障数量随着测试时间逐渐减少，并且检测到的故障去除时不会引入新的故障。

3) 在故障检测过程中，故障检测率随测试时间不规则变化。

4) 系统剩余缺陷引起软件失效。

记 $N (t)$ 为 $(0, t]$ 时间段内检测到的累积故障数, ${N (t), t \geq 0}$ 是一个独立增量过程；由假设可以得到微分方程：

$\frac{d N (t)}{d t} = r (t) [a - N (t)]$ (1)

$r (t) = b (t) + δ γ (t)$ (2)

其中， $a$ 表示软件系统中预期的总故障数， $b (t)$ 为故障检测率函数，表示时间 $t$ 时每个故障被检测的概率。 $r (t)$ 含有不规则波动，其中 $δ$ 表示不规则波动的正常量， $γ (t)$ 为标准高斯白噪声，并且有下列性质，

$E (δ γ (t)) = 0$

$V a r (δ γ (t)) = δ^{2}$

将式(1)带入(2)可以得到：

$\frac{d N (t)}{d t} = (b (t) + δ γ (t)) [a - N (t)]$ (3)

式(3)可以被扩展成下列的伊藤(Ito-type)类随机微分方程，

$d N (t) = [b (t) - \frac{1}{2} δ^{2}] (a - N (t)) d t + δ (a - N (t)) d W (t)$ (4)

其中 $W (t)$ 表示布朗运动或者是一维维纳过程。

2.2. 基于随机微分方程和广义拐点S型故障检测率的软件可靠性模型

为了适应银行软件测试数据，本文采用广义拐点S型故障检测率函数作为 $b (t)$ ，该函数允许对每个故障函数的非单调故障检测率进行建模，是一种非常灵活的故障检测率函数。即：

$b (t) = \frac{k c t^{c - 1}}{1 + b e^{- k t^{c}}}; t \geq 0, k, c > 0, b \geq 0$ (5)

其中， $k$ 、 $c$ 和 $b$ 分别是尺度参数、形状参数和拐点参数，用来表示软件测试中的故障检测行为。根据(3~5)即可得到随机微分方程：

$d N (t) = [\frac{k c t^{c - 1}}{1 + b e^{- k t^{c}}} - \frac{1}{2} δ^{2}] (a - N (t)) d t + δ (a - N (t)) d W (t)$ (6)

通过伊藤公式求解 $N (t)$ ：

$N (t) = a [1 - \frac{1 + b}{1 + b e^{- k t^{c}}} e^{- k t^{c} - δ W (t)}]$ (7)

得到本文提出的GISS_SDE模型，其期望检测出的故障数量 $m (t)$ 可以表示为：

$m (t) = a (1 - \frac{(1 + b) \exp (- k t^{c} + \frac{δ^{2} t}{2})}{1 + b \exp (- k t^{c})})$ (8)

2.3. 模型的参数的极大似然估计

记 $(n_{i}, t_{i})$ $(i = 0, 1, 2, \dots, N; 0 = t_{0} \leq t_{1} \leq t_{2} \leq \dots \leq t_{N})$ 表示 $N$ 个观察到的系统软件故障数据对， $n_{i}$ 表示在时间段 $[0, t_{i}]$ 内检测到的故障数量， $N (t_{i})$ 的联合分布函数可以表示为：

$F (t_{1}, n_{1}; t_{2}, n_{2}; \dots; t_{N}, n_{N}) = P (N (t_{1}) \leq n_{1}, \dots, N (t_{N}) \leq n_{N} | N (t_{0}) = 0)$ (9)

其中， $N (t_{i})$ 表示系统软件在 $t_{i}$ 时刻累计检测出的故障数量。根据式(7)和(9)， $N (t_{i})$ 的概率分布为：

$\begin{array}{l} P [N (t_{i}) \leq n_{i} | N (t_{i - 1}) = n_{i - 1}] \\ = ϕ [\frac{\log [\frac{a - n_{i - 1}}{a - n_{i}}] - [\int_{0}^{t_{i}} b (s) d s - \int_{0}^{t_{i - 1}} b (s) d s]}{δ \sqrt{t_{i} - t_{i - 1}}}] \\ = ϕ [\frac{\log (\frac{a - n_{i - 1}}{a - n_{i}}) - k (t_{i}^{c} - t_{i - 1}^{c}) + \log (\frac{1 + b e^{- k t_{i - 1}^{c}}}{1 + b e^{- k t_{i}^{c}}})}{δ \sqrt{t_{i} - t_{i - 1}}}] \end{array}$ (10)

构造对数似然函数：

$\begin{matrix} L = \log (\prod_{i = 1}^{N} \frac{d}{d n_{i}} P (N (t_{i}) \leq n_{i} | N (t_{i - 1}) = n_{i - 1})) \\ = \sum_{i = 1}^{N} [- \log (δ (a - n_{i})) - \frac{1}{2} \log (2 π (t_{i} - t_{i - 1}))] \\ - \sum_{i = 1}^{N} \frac{1}{2 δ^{2} (t_{i} - t_{i - 1})} \times {[\log (\frac{a - n_{i - 1}}{a - n_{i}}) - k (t_{i}^{c} - t_{i}^{c - 1}) + \log (\frac{1 + b e^{- k t_{i}^{c}}}{1 + b e^{- k t_{i - 1}^{c}}})]}^{2} \end{matrix}$ (11)

本文提出模型的参数 $a$ ， $b$ ， $c$ ， $k$ 和 $δ$ 的最大似然估计值 $\hat{a}$ ， $\hat{b}$ ， $\hat{c}$ ， $\hat{k}$ ， $\hat{δ}$ 可以通过解以下方程得到。

$\frac{\partial L}{\partial a} = \frac{\partial L}{\partial b} = \frac{\partial L}{\partial c} = \frac{\partial L}{\partial k} = \frac{\partial L}{\partial δ} = 0$ (12)

2.4. 模型评价指标

均方误差(MSE)：预测值与实际值偏差的平方和与观察次数N的比值：

$MSE = \frac{1}{N} \sum_{i}^{N} {[m (t_{i}) - n_{i}]}^{2}$ (13)

其中 $m (t_{i})$ 为模型的预测值， $n_{i}$ 为 $t_{i}$ 时刻真实故障数。MSE值越低，表明拟合误差越小。

3. 数值案例

为了充分、有效地评估提出的改进模型的拟合和预测性能，本节使用了经典NHPP模型：GO模型、DSS 模型、ISS模型，GISS模型以及本文提出的GISS_SDE模型对计算结果进行对比分析，见表1。

Table 1. Model summary table

表1. 模型汇总表

模型序号	模型名称	模型的均值函数
Model1	GO	$m (t) = a (1 - \exp (- k t))$
Model2	ISS	$m (t) = a (1 - \frac{1 + b}{1 + b \exp (- k t)} \exp (- k t))$
Model3	DSS	$m (t) = a (1 - (1 + k t) \exp (- k t))$
Model4	GISS	$m (t) = a (1 - \frac{(1 + b) \exp (- k t^{c})}{1 + b \exp (- k t^{c})})$
Model5	GISS_SDE (本文提出的模型)	$m (t) = a (1 - \frac{(1 + b) \exp (- k t^{c} + \frac{δ^{2} t}{2})}{1 + b \exp (- k t^{c})})$

3.1. 数据说明

本文数据来自MISYS资金交易系统项目，MISYS资金交易系统是A银行外购的一个资金业务中后台系统。该项目测试对象包含在此升级过程中所涉及或关联到的所有系统。系统包括：资金产品管理系统、数据仓库系统、主机业务系统(境内)、资金业务管理系统(境内)等。选取2020年6月29日到2020年9月2日检测到的故障数(共33组数据)，累计检测故障133个。

3.2. 参数估计结果

使用表2中A银行MISYS资金交易系统项目失效数据对经典模型和本文模型进行参数估计，参数估计结果及评价指标见表3。

Table 2. Bank A’s MISYS fund trading system project failure data

表2. A银行MISYS资金交易系统项目失效数据

时间	累计故障数	时间	累计故障数	时间	累计故障数
1	0	14	70	27	103
2	3	15	71	28	105
3	5	16	83	29	107
4	20	17	76	30	109
5	28	18	80	31	110
6	33	19	82	32	111
7	37	20	84	33	113
8	42	21	86
9	46	22	89
10	51	23	93
11	52	24	84
12	57	25	96
13	65	26	102

Table 3. Model summary table

表3. 模型汇总表

模型名称	参数估计值	MSE
GO	a = 159.371	32.816
	k = 0.08154
ISS	a = 199.5048	21.25524
	b = −0.8601
	k = 0.0108
DSS	a = 141.4787	130.1294
	k = 0.2212
GISS	a = 204.317	21.24545
	b = 0.9210
	c = 0.6356
	k = 0.2068
GISS_SDE 本文提出的模型	a = 225	21.21
	b = 0.9771
	c = 0.6018
	δ = 0.00785
	k = 0.2038

3.3. 模型性能对比分析

从图1和表3可以看出经典非齐次泊松过程模型里GISS模型效果最好，MSE值为21.245，其次是ISS模型，MSE值为21.25524，DSS模型效果最差，MSE值为130.1294，针对GISS模型来说，本文改进后的GISS_SDE模型效果要优于GISS模型，其MSE值为21.21。

Figure 1. Fitting diagram of the cumulative number of faults of each model

图1. 各模型累计故障数拟合图

图2为相对误差拟合对比图，通过绘制各个模型的相对误差曲线(Relative error curve)，GISS_SDE模型随着时间的增长，其波动程度最小，并最终趋近于0，表明GISS_SDE模型对数据拟合的适应性最强。因此本文提出的模型更适合评估所选银行软件的可靠性。

Figure 2. Comparison chart of the relative error fitting of each model

图2. 各模型相对误差拟合对比图

4. 结论

在数字经济时代，软件的可靠性对银行的影响深远且广泛，直接关乎银行的运营效率、客户体验、业务连续性和市场竞争力。然而银行软件系统规模的显著扩大，导致软件测试故障的报告存在随机性、不规律性以及各种不确定因素，这些因素往往会影响对银行软件可靠性评估。本文基于随机微分方程将广义拐点S型分布作为故障检测率，提出一种新的软件可靠性模型，并将其应用到A银行MISYS资金交易系统项目中。通过绘制累计故障数拟合图和各模型相对误差对比图得出结论，本文提出的模型相较于其他经典非齐次泊松过程类软件可靠性模型具有更好的拟合效果，为评估银行软件可靠性提供了有价值的贡献。

NOTES

^*通讯作者。

参考文献

[1]	Wang, J., Zhang, C. and Yang, J. (2022) Software Reliability Model of Open Source Software Based on the Decreasing Trend of Fault Introduction. PLOS ONE, 17, e0267171. [Google Scholar] [CrossRef] [PubMed]
[2]	Rani, P. and Mahapatra, G.S. (2019) A Novel Approach of NPSO on Dynamic Weighted NHPP Model for Software Reliability Analysis with Additional Fault Introduction Parameter. Heliyon, 5, e02082. [Google Scholar] [CrossRef] [PubMed]
[3]	Li, Q., Li, H. and Lu, M. (2015) Incorporating S-Shaped Testing-Effort Functions into NHPP Software Reliability Model with Imperfect Debugging. Journal of Systems Engineering and Electronics, 26, 190-207. [Google Scholar] [CrossRef]
[4]	Li, Q. and Pham, H. (2019) A Generalized Software Reliability Growth Model with Consideration of the Uncertainty of Operating Environments. IEEE Access, 7, 84253-84267. [Google Scholar] [CrossRef]
[5]	Jain, M., Manjula, T. and Gulati, T.R. (2014) Imperfect Debugging Study of SRGM with Fault Reduction Factor and Multiple Change Point. International Journal of Mathematics in Operational Research, 6, 155-175. [Google Scholar] [CrossRef]
[6]	Song, K., Chang, I. and Pham, H. (2017) A Software Reliability Model with a Weibull Fault Detection Rate Function Subject to Operating Environments. Applied Sciences, 7, Article 983. [Google Scholar] [CrossRef]
[7]	Chaudhary, K., Kapur, P.K., Kumar, P. and Kumar, V. (2024) Stochastic Software Reliability Growth Modelling with Fault Introduction and Change Point. International Journal of System Assurance Engineering and Management. [Google Scholar] [CrossRef]
[8]	Chatterjee, S., Chaudhuri, B. and Bhar, C. (2020) Optimal Release Time Determination via Fuzzy Goal Programming Approach for SDE-Based Software Reliability Growth Model. Soft Computing, 25, 3545-3564. [Google Scholar] [CrossRef]
[9]	Yang, J., Ding, M., He, M., Zheng, Z. and Yang, N. (2024) SDE-Based Software Reliability Additive Models with Masked Data Using ELS Algorithm. Journal of King Saud University-Computer and Information Sciences, 36, Article 101978. [Google Scholar] [CrossRef]
[10]	Deepika, Singh, O., Anand, A. and Singh, J. (2020) SDE Based Unified Scheme for Developing Entropy Prediction Models for OSS. International Journal of Mathematical, Engineering and Management Sciences, 6, 207-222. [Google Scholar] [CrossRef]
[11]	Kapur, P.K., Anand, S., Yamada, S. and Yadavalli, V.S.S. (2009) Stochastic Differential Equation‐Based Flexible Software Reliability Growth Model. Mathematical Problems in Engineering, 2009, Article 581383. [Google Scholar] [CrossRef]
[12]	Fang, C. and Yeh, C. (2015) Effective Confidence Interval Estimation of Fault-Detection Process of Software Reliability Growth Models. International Journal of Systems Science, 47, 2878-2892. [Google Scholar] [CrossRef]

为你推荐

友情链接