1. 引言
由于现代工业产品往往具有寿命时间长、试验成本高等特点,因此在实践中为了满足试验需要,人们逐步提出了截尾寿命试验,常见的截尾试验包括定数截尾和定时截尾[1]。为了使试验方案更具有实用性,研究人员又相继提出逐步增加截尾寿命试验。这是一类效率更高、成本更低的寿命试验方式,还能防止对宝贵资源不必要的破坏,具有灵活性以及高效性。所以在当今的发展进程中,这类优良的试验方案在工程应用、水文学以及生存分析等多个领域里都有广泛的应用。逐步增加截尾试验分为逐步增加I型截尾和逐步增加II型截尾两种类型。有关逐步增加截尾试验的统计分析已经吸引了很多学者的广泛讨论,如Algarni等[2]讨论了逆威布尔分布下逐步增加I型截尾样本的经典和贝叶斯估计问题;Aljohani [3]讨论了Chen分布下两种逐步增加II型截尾方案的参数估计问题。有关逐步增加截尾寿命试验的详细介绍可参考Balakrishnan等的著作[4]。本文在寿命模型–比例危险率分布下,利用一类广泛的损失函数–平衡损失函数,讨论该模型的可靠性指标在逐步增加II型截尾样本下的贝叶斯估计问题。
首先对逐步增加II型截尾寿命试验模式做一简要介绍:假设有n个相同样品同时开始试验,并且样品失效时间均可被检测到,设
,
是试验前预先固定的一组正整数,并且满足条件
。当第一个失效样品出现时,记失效时刻为X1,同时在剩下
个未失效样品中随机移离r1个样品;当第二个失效样品出现时,记失效时刻为X2,在剩下
个样品中随机移离r2个样品;以同样的方法继续试验直至第m个失效样品出现,记失效时刻为rm,并移离剩下的全部
个样品,试验完毕。由定义可以看到,逐步增加II型截尾寿命试验是一类比定时、定数截尾试验更加灵活广泛的寿命试验。当截尾策略
时,该试验是通常的定数截尾试验;当
时,相当于完全寿命试验。设受试样品寿命服从的分布函数为
,密度为
的寿命分布,则相应的逐步增加II型截尾样本
的联合概率分布为:
,(1)
其中,c表示独立于参数的正则化常数。
在统计决策理论中,为了描述决策与风险之间的关系,人们常常引入损失函数的概念,常见的有均方损失、熵损失、对数损失等。然而,通常的损失函数仅仅只顾及参数估计的精确性,而忽略了数据对于分布函数的拟合优度。为了在决策分析中兼顾分布函数拟合及参数估计的精确性,Zellner [5]最早引入了平衡损失函数的概念,Mohammad等[6]在Zellner的基础上进一步提出了一类更加广泛的平衡损失函数,其形式如下:
,(2)
其中,
,
是正的权函数,
表示任意的损失函数,其中
是
的估计值,
是预先给出的
的一个估计,如似然估计、最小二乘估计等。由定义可见,平衡损失
是一类更加广泛的损失函数,可以用来描述各种不同场合。当权因子
时,
退化为通常的损失函数
。
本文考虑样本寿命X服从如下的模型,其分布函数为:
(3)
相应的密度函数为
为:
(4)
其中,
是未知模型参数,
是任意连续函数,且满足
。
模型(3)被称为比例危险率模型。
由(3)、(4)可以看到,比例危险率模型是一类非常重要的广义半参数模型,在生存分析、可靠性理论及质量控制等方面都具有广泛的应用,很多常见的寿命分布都是比例危险率模型的特殊情形,例如:
1) 当
时,模型(3)为指数分布,其分布密度为:
2) 当
时,模型(3)为Rayleigh分布,其分布密度为:
3) 当
时,模型(3)为Pareto分布,其分布密度为:
因此,区别于以往对传统数据类型的研究,本文的创新之处即在平衡损失函数下,考察当数据为逐步增加II型截尾样本时,比例危险率模型分布参数和可靠性指标的Bayes估计问题,为寿命试验领域提供了较为新颖的视角。
由(3)、(4)可知,寿命分布X在时间t的生存函数和失效率函数分别为:
,
.(5)
假设
是来自于模型(3)的逐步增加II型截尾样本,由(1)可知,截尾样本
的联合似然函数可以表示为:
,(6)
其中,
。
2. Bayes估计
本节给出参数和可靠性指标的Bayes估计。
2.1. 先验信息及后验分布
设参数
的先验分布为共辄伽玛分布
:
,(7)
其中,
为超参数。
由(6)和(7)可知,参数
的后验分布为:
,(8)
当
时,记平衡损失函数(2)为
,本文分别在
为均方误差和Linex损失情形下,讨论参数及可靠性指标的贝叶斯估计。由于利用平衡损失函数进行决策分析时需要使用到相关的预估计
,下面我们首先给出两类频率估计作为
的选择。
2.2. 频率估计
本节给出参数及可靠性指标的极大似然估计(MLE)和一致最小方差无偏估计(UMVU)。
由(6)可知,对数似然函数为:
,(9)
对(9)关于
求导数,利用不变性原理分别可得参数
、可靠性指标
的MLE如下:
(10)
为了获得UMVU估计,下面给出一个有用的引理。
引理1 设
是来自于分布(3)的逐步增加II型截尾样本,则
服从自游度为2m的卡方分布。
证明 定义
,则
是来自于标准指数分布的逐步增加II型截尾样本。
考虑如下变换:
则
是来自于标准指数分布的独立同分布样本。进一步,由[1]可知:
服从自由度为的2m的卡方分布,其密度函数为:
结论得证。
推论1 参数
和失效率
的极大似然估计是渐进无偏,且相合的。
证明 我们分别考察
和
的MLE的样本性质。
利用引理1,我们有:
和
从而有参数
极大似然估计的期望和方差为:
(11)
类似地,参数
极大似然估计的期望和方差为:
(12)
因为
,
,
从而结论成立。
因为W是参数
的充分完备统计量,利用Rao-Blackwell-Lehmann-Scheffe定理和引理1,一步可以得到参数和可靠性指标的UMUV估计如下:
,(13)
推论2 参数
和可靠性指标H(t)的一致最小方差无偏估计是相合的。
证明 由(11)和(12)可知:
.
由相合性定义知,统计量
是相合估计。
结合引理1和
的独立性,下面给出几个假设检验问题。
注1. (单参数假设检验)当获得逐步增加II型截尾样本
时,有时需要考虑参数
如下的假设检验:
(a)
,
(b)
,
(c)
。
由引理1可知,
服从自由度为2m的卡方分布。在检验水平
,对上述检验(a)、(b)和(c),相应原假设H0的拒绝域分别为:
(a)'
,
(b)'
,
(c)'
。
这里,
表示自由度为2m的卡方分布的
上侧分位数。
注2. (两样本假设检验)这里给出一个两样本假设检验问题。在实际中,我们有时常常需要比较服从同一模型的两样本参数。比如,当某产品的寿命分布服从指数分布()时,在进行技术革新或者设备调整之后,我们常常需要比较调整前后产品的平均寿命是否得到提高。由于在指数分布下,
表示产品的平均寿命,因此,需要比较变化前参数
和变化后参数
的大小。如果技术革新有效,产品的寿命提高,则有
。下面我们给出一类两样本的假设检验问题。设
表示来自于寿命分布(3)参数为
,样本容量为
,截尾策略为
的逐步增加II型截尾样本。我们考虑以下假设检验问题:
(d)
,
(e)
,
(f)
。
令
,由引理1可知,
服从自由度为
的卡方分布,进而有
服从自由度为
和
的F分布。进而,在检验水平
下,对上述检验(e)、(d)和(f),相应原假设
的拒绝域分别为:
(d)'
,
(e)'
,
(e)'
。
这里,
表示自由度为
和
的F分布的
上侧分位数。
2.3. 平衡均方损失函数下的Bayes估计
当
,由(2)及风险函数最小准则,
在平衡均方损失下
的Bayes估计为:
(14)
由(8)和(14)可知,在平衡均方损失
下参数
和可靠性指标
的Bayes估计如下:
(15)
在参数
和可靠性指标
的Bayes估计(15)中,估计
表示各个指标相应的预先估计值,在下述平衡Linex损失中亦同。
注4. 当先验分布(7)中超参数
时,在平衡均方损失下相应的Bayes估计为:
直接计算可知,
、
和
是当先验取无信息先验分布
时,在平衡均方损失函数下相应的Bayes估计。
2.4. 平衡Linex损失函数下的贝叶斯估计
Linex损失函数是近年来研究较多的一类非对称损失函数,与均方损失不同,该损失函数能够对过高估计和过低估计产生的风险区别对待,从而更加客观地描述现实情况,因而受到众多学者和实际工作者的青睐,其基本形式如下:
由定义可以看到,当
时,过低估计所造成的损失大于过高估计;当
时,结论正好相反;当
时,非对称Linex损失渐近趋于均方损失,且渐近对称。由于在Linex损失下
的Bayes估计为,根据风险最小原则,在平衡Linex损失函数
的Bayes估计为:
(16)
由(8)和(16)可得,在平衡Linex损失
下参数
和可靠性指标
的Bayes估计分别为:
(17)
注5. 当先验分布(7)超参数
时,在平衡均方损失下相应的Bayes估计为:
类似于平衡均方损失,
和
是当先验分布取无信息先验分布
,在平衡Linex损失函数下相应的Bayes估计。
2.5. 超参数估计
设总体X是来自于分布(3)的寿命分布,令
,则Y服从指数分布:
进一步,令
,则
是来自于指数分布
的逐步增加II型截尾样本。
其条件密度函数为:
相应地,条件分布密度为:
所以,逐步增加II型截尾样本
的似然函数为:
从而对数似然函数为:
关于对数似然函数取导数可得:
由ML-II法可知,如果超参数a的似然估计存在,只需证明对数似然函数有唯一的根即可。
令
因为
且
由上述两式可知,函数
和
是关于a的连续单调递减凸函数。
又因为
从而方程
存在唯一解,即超参数a的估计存在且唯一。因为由方程
不能直接给出a的精确数值解,这里给出下面的迭代算法来获得超参数a的ML-II估计:
(18)
其中,
表示a的第k次迭代值,
表示a的一个给定的初始值。
记由(18)获得的a的ML-II估计为
,将
带入参数
和可靠性指标
的Bayes估计,进而获得相关估计的经验Bayes估计。
2.6. Bayes最大后验密度区间估计
这里给出参数
和可靠性指标
的最大后验密度区间估计(HPD)。
给定水平值
,设
是参数
的
HPD区间估计,则
满足下列条件:
由(8)可知:
(19)
其中,
。
为了得到
的HPD区间估计,由(8)可知,可靠性指标
的后验密度函数分别为:
类似于HPD区间估计
,可得
的HPD区间估计
满足:
(20)
其中,。
进一步,
的HPD区间估计
满足:
(21)
其中,。
3. Bayes预测
记
表示第s个逐步增加II型截尾样本,基于历史样本
的贝叶斯预测密度为:
其中,
,这里
。
由(3)、(4)可知,
。
从而
,预测密度为:
从而对任意
,有:
其中,
表示Fisher Z分布在点z的值。
记
是
的
的Bayes预测上下界,满足:
从而
的预测上下界
可由下面的式子分别得到:
在实际应用中,人们往往比较关心一步预测,即
的情形,这时有:
从而
的一步预测上下界分别为:
(22)
其中,
表示
的反函数。当超参数a未知时,将前面给出的a的估计值
带入上式,即得逐步增加II型截尾样本
的经验Bayes预测区间。
4. 数值算例
本节以Lomax寿命分布作为比例危险率模型的特殊例子,给出该模型在平衡损失下逐步增加II型截尾样本的数值模拟,并研究估计结果的精确性。对于Lomax分布,其分布函数如下:
其中,
。
利用文献[7]给出的算法,逐步增加II型截尾数据产生步骤如下:
(S1.) 产生m个均匀
分布的独立同分布随机变量
;
(S2.) 给定逐步增加II型截尾策略
,令
;
(S3.) 再令
,则
是来自于均匀分布
的逐步增加II型截尾数据;
(S4.) 最后利用变换
,得到来自任意分布
的逐步增加II型截尾寿命试验数据,这里
表示分布
的反函数。
下面利用Monte-Carlo数值模拟方法给出参数
、可靠性指标
的Bayes估计,具体步骤如下:
1) 对于给定超参数a,利用参数
的先验分布(7)产生
的一组值,并选取其中一个当作参数
的真值,记为
,将
带入(5),得到
的真值;
2) 对给定的
,利用上面的方法,产生逐步增加II型截尾试验数据
;
3) 利用(18)给出超参数a的数值解
;
4) 对于给定的t,由(10)、(13)给出指标的频率估计;由(15)、(17)和(18)得到平衡损失函数下指标的经验Bayes估计;利用(19)⁓(21)获得参数和可靠性指标的HPD区间估计;最后,利用(22)获得未来样本的预测区间。
当给定
和
时,产生如下的逐步增加II型截尾样本:0.0225、0.1192、0.1274、0.1358、1.2379。表1给出了参数及可靠性指标的Bayes估计的结果及预测区间。对于Bayes点估计,表1中第一行表示预估计取MLE时得到的估计值,第二行表示预估计取UMVU估计时得到的估计值。同时,为了比较HPD区间估计的优劣性,表1中还给出了通常的Bayes置信(BCI)区间估计。这里,表1第一行表示区间估计的估计范围,第二行表示相应的区间长度。
为了检验估计的精度,做5000次重复模拟试验数据,利用下面的式子给出两种损失函数下各指标贝叶斯估计量的估计风险:
Table 1. Bayes estimation of
under balanced loss
表1. 平衡损失下Bayes估计
指标 |
|
|
|
参数真值 |
0.5 |
0.6901 |
0.2381 |
MLE |
1.0524 |
0.4580 |
0.5012 |
UMVU |
0.8420 |
0.5071 |
0.4009 |
平衡均方估计 |
1.03320.7560 |
0.48100.5153 |
0.47770.3876 |
平衡Linex估计 |
0.67560.7379 |
0.78230.8412 |
0.48420.3669 |
HPD区间 |
(0.3354, 1.5702)1.2348 |
(0.2883, 0.7319)0.4436 |
(0.1643, 0.7351)0.5707 |
BCI区间 |
(0.4181, 1.6855)1.2674 |
(0.2862, 0.7335)0.4473 |
(0.1993, 0.8025)0.6032 |
预测区间 |
|
其中,
表示真值
相应的Bayes估计。表2给出了给出了当样本量不同时所采取的截尾策略,表3、表4给出了当预估计分别取MLE和UMVU估计时的估计风险。
Table 2. Progressively increasing type-II censoring samples
表2. 逐步增加II型截尾样本
样本量 |
|
n = 20, m = 5 |
|
n = 20, m = 10 |
|
n = 30, m = 20 |
|
Table 3. Bayesian estimation risk of
under balanced loss for exponential distribution
表3. 指数分布在平衡损失下Bayes估计风险
|
|
|
|
|
|
|
(20, 5) |
0.3114 |
0.1057 |
0.0918 |
0.1121 |
0.0769 |
0.0686 |
(20, 10) |
0.1879 |
0.0429 |
0.0361 |
0.0641 |
0.0548 |
0.0382 |
(30, 15) |
0.0634 |
0.0101 |
0.0086 |
0.0213 |
0.0111 |
0.0107 |
注:这里
取相关指标的MLE。
Table 4. Bayesian estimation risk of
under balanced loss for exponential distribution
表4. 指数分布在平衡损失下Bayes估计风险
|
|
|
|
|
|
|
(20, 5) |
0.1077 |
0.0693 |
0.0533 |
0.0426 |
0.0317 |
0.0269 |
(20, 10) |
0.0836 |
0.0500 |
0.0279 |
0.0253 |
0.0104 |
0.0136 |
(30, 15) |
0.0312 |
0.0214 |
0.0085 |
0.0123 |
0.0063 |
0.0078 |
注:这里
取相关指标的UMVU。
下面结合上述Monte-Carlo模拟算例,对逐步增加II型截尾样本在比例危险率模型下的Bayes估计结果进行简要分析:
1) 比例危险率模型是一类应用广泛的寿命模型,在实际工业生产、可靠性理论等领域有着广泛的应用,通过
选取可模拟多种失效模型。
2) 平衡损失是一类更加广泛的损失,通过对
的选取,可以模拟各种损失情形,由数值模拟的结果可以看出,该损失比一般损失更加灵活;同时,权系数
和
为
的估计提供了更大的选择空间,兼顾了Bayes方法和经典方法的优点;
3) 从表1可以看出,在平衡损失函数下获得的Bayes估计优于相应的预估计,这体现了平衡损失函数的灵活性和Bayes估计的优越性。同时,由模拟结果亦可以看到,当预估计较优时,在平衡损失函数下所得到Bayes估计大部分情况也较优。对于Bayes区间估计,通过比较区间长度可知,对于同样的置信水平
,最大后验密度区间估计优于通常的Bayes置信区间估计。由表3、表4可知,不同样本量和
值下,Bayes估计风险均随着样本的增大而减小,体现了频率的稳定性。最后,本文的研究尚有不足之处,比如,在实际操作中由于试验成本、研究人员以及试验设备等方面的限制,有时无法对所有的试验样品进行及时检测等,这些问题都在一定程度上影响推断精度。因此,在实验设计领域,未来的研究仍有广阔的空间等待深入探索。