1. 引言
可靠性统计研究的核心是基于寿命分布的分析。然而,由于各种实际因素和产品特性的差异,寿命数据展现出显著的多样性。这种多样性体现在数据的类型、分布形态、变化趋势等多个方面,使得单一的寿命分布模型往往难以全面、准确地描述实际数据的特征。在过去的一段时间里,许多国内外学者致力于研究通过在原有基础连续分布基础上增加尺度函数,得到一种新的扩展分布族。增加的参数已被证明在探索偏度和尾部是很有用的,也提高了新分布的拟合优度。Eugene et al. (2002) and Jones (2004)提出了The beta-G扩展分布族,得到了Beta Weibull-geometric分布,可应用于生物领域的数据建模分析[1] [2];Marshall和Olkin首次利用分布生成技术,提出了一种通过增加形状参数得到扩展分布族的方法:M-O扩展,并成功应用于指数分布和威布尔分布中[3];Cordeiroandde Castro (2011)提出了The Kumaraswamy-G (Kw-G)扩展分布族,并应用Gumbel分布[4];Ramos (2014)提出了The Kumaraswamy Poisson-G (Kw-G)扩展分布,对应的概率密度函数和相应的风险率函数更灵活[5];刘焱哲等通过Kumaraswamy Marshall-Olkin扩展方法引进并研究了一个新的五参数寿命分布[6];常帅等利用Kumaraswamy分布结构推广到了倒帕累托分布[7];这些研究都是通过引入额外的参数,定义了新的多参数分布,同时研究了它们的各阶矩、熵、参数的估计,并给出了新分布参数估计值的算法。
本文将KwMO方法对Rayleigh分布进行扩展,得到KwMO-R分布,对研究在无线电通信工程、工程测量等领域有广泛的意义。在已有的Rayleigh分布研究基础上,本文进一步讨论了新分布的分位数、矩、次序统计量的性质、Renyi熵、并验证了估计的相合性,最后进行了数值模拟。
2. 分布的定义
瑞利分布的分布函数和概率密度函数分别为:
(2.1)
(2.2)
其中
为尺度参数。
引理:设变量X的分布函数为
,密度函数为
,则KwMO方法扩展得到的新分布族为:
对应的密度函数为
根据引理把(2.1)、(2.2)分别代入上述两式,得到:
(2.3)
其密度函数为
(2.4)
定义2.1 称(2.3)或(2.4)式给出的分布为KwMO-R分布,记为
,
为形状参数,
为尺度参数。
(2.4)式也可以写成:
,即
。
(2.4)式中
时,该分布为
。
关于x递减,且当
时,
;
时,
。
3. 分布的性质
定理3.1
1) KwMO-R分布的
分位数为
,即中位数
。
2) KwMO-R分布的r阶中心距
,特别地KwMO-R的数学期望为
,其中
见下面所述。
证明:1) 由KwMO-R分布的定义及分位数的定义可得,略。
2) 由
由广义二项式展开定理可得:
其中,
,
,
,
当
时,
(3.1)
这里
是参数为k的广义指数分布的分布函数,即
。
类似地,KwMO-R分布的密度函数:
(3.2)
是参数为k的广义指数分布的密度函数,即
故KwMO-R分布的r阶中心距为:
(3.3)
当
时,KwMO-R的数学期望为:
(3.4)
根据生存函数、危险率函数的定义,得到
分布的生存函数为:
(3.5)
定理3.2 若随机变量
分布,则其危险率函数为
,并且有
,
,同时
所有参数关于x都是倒浴盆曲线,
证明:根据分布函数和危险率函数的定义可得:
。
对上式利用洛必达法则易得上述极限。证毕。
当
时,函数先增加后趋于平缓,呈J形;当
时,随着
的增大,曲线呈浴盆型,p越大,函数越凸。
定理3.3 若
是来自KwMO-R的简单随机样本,则第i阶次序统计量为
,其中
;记
,则
,其中
。
证明:由次序统计量的定义,可得第i阶次序统计量的密度函数为:
根据
,
,这里
,
(见参考文献[8]),把(3.1)和(3.2)代入上式,得到:
其中
,
是参数为
广义指数分布的密度函数,即
。(见参考文献[9])
由(2.3),(2.4)式有
根据洛必达法则有:
根据文献[10]定理2.1.2及定理2.4.3可知,当
时,有
。
定理3.4 若随机变量
分布,则其Renyi熵为
,其中
且
。
证明:根据Renyi熵
和(3.2)式可得:
若
有
其中
见(3.1)
故
。
4. 参数估计
设
是来自
的简单随机样本,记
为样本观测值,其对数似然函数
为:
似然方程为:
(4.1)
(4.2)
(4.3)
(4.4)
解方程组(4.1)~(4.4),其解
就为参数
的极大似然估计(MLE)。
下面讨论估计的相合性。
分布的参数空间记为
对任意
及
,记:
,这里
根据文献[11]命题2.4.34,只需要证明对充分小的
,有
,MLE就存在。事实上,在
上,
为
的连续函数,故存在
,使得
由文献[12]定理2.1.3可知,若
,可以证明
,即
存在。由定理3.1可以证明
,
。
故
成立,似然方程必存在一个强相合解。
5. 数值模拟
由于上述似然方程组不易求出显示解的表达式,考虑用Monte-Carlo模拟算法计算其极大似然估计。
设模型参数的真值分别为
。
1) 确定需要产生的样本容量
;
2) 产生n个独立随机数
,计算
,则
为
分布的容量为n的样本。
3) 对给定参数的初始值
,设定迭代的次数为5000,代入迭代公式(4.1)和(4.4)得参数到
的均值、偏差、均方误差,见表1。
Table 1. Simulation results of KwMO-R distribution parameters
表1. KwMO-R分布参数的模拟结果
n |
Parameter |
|
MEAN |
Bias |
MSN |
50 |
a |
4 |
3.301337 |
−0.698663 |
9.4057169 |
b |
1.2 |
1.186861 |
0.186861 |
2.2464300 |
p |
0.2 |
0.3233599 |
0.1233599 |
0.1805369 |
|
3.5 |
3.406095 |
−0.093905 |
5.3471411 |
100 |
a |
4 |
3.422929 |
−0.577071 |
7.006185 |
b |
1.2 |
1.01385 |
0.01385 |
1.5863938 |
p |
0.2 |
0.3383646 |
0.1383646 |
0.1821119 |
|
3.5 |
3.524606 |
0.024606 |
5.1935504 |
500 |
a |
4 |
3.533069 |
−0.466931 |
5.811375 |
b |
1.2 |
0.9443207 |
−0.055679 |
0.4228819 |
p |
0.2 |
0.3332891 |
0.1332891 |
0.1743206 |
|
3.5 |
3.494839 |
−0.005161 |
4.667971 |
从表中可以看出随着样本容量n的增加,虽然p的估计值偏差增加,但是均方误差值是减小的;总体来说随着样本n的增加,
估计值的偏差和均方误差都是递减渐近趋于0的。
6. 结论
本文针对Rayleigh分布进行扩展,得到一种广义四参数
分布,该分布的危险函数主要呈J型、浴盆型,因此它可以灵活地拟合一些较复杂的寿命数据;同时对该分布的进行了统计分析,最后得到了未知参数的估计公式,并验证了估计的强相合性;在MC模拟样本下,随着样本容量的增加,未知参数估计值的偏差和均方误差都是趋于0的。
基金项目
2021年湖北省教育厅科学研究计划资助项目(B2021286);2022年湖北省高等学校优秀中青年科技创新团队计划项目(T2022035)。