1. 引言
Lindley分布是可靠性研究中的一个重要分布,某些寿命数据可通过Lindley模型达到更好的拟合效果 [1]。Krishna等在逐步II型右删失数据下,采用极大似然方法和贝叶斯方法研究了Lindley分布的可靠性 [2]。杨冬霞等分别在完全数据、逐步I型区间删失数据,逐步II型删失数据以及定数截尾样本下研究了Lindley分布的参数估计问题 [3] [4] [5];范梓淼等分别讨论了在NA随机样本序列和独立同分布样本下Lindley分布参数的经验贝叶斯检验函数问题 [6] [7];龙兵分析了Lindley分布参数的区间估计和假设检验问题 [8];近几年,变点问题也是统计方向研究的一个热点问题。何朝兵等在左截断右删失数据下对指数分布多变点模型进行了参数估计 [9]。沙雪云等利用贝叶斯方法研究了Lomax分布形状参数变点的估计模型 [10];程静等用极大似然估计和贝叶斯估计讨论了两种分布的单变点问题 [11] [12]。关于Lindley分布参数变点问题的研究较少,本文给出了Lindley分布的变点模型,在叙述了解决多变点模型问题的具体步骤后,主要研究Lindley分布参数的单变点模型,分别在无信息先验分布和伽玛分布为先验分布的条件下,利用贝叶斯估计研究参数和变点位置,并通过R软件进行随机模拟。结果显示:各参数的估计值和真实值之间的MC误差较小,表明其估计值的效果较为理想。
2. Lindley分布变点模型
设随机变量 服从参数为
的Lindley分布,则分布函数和密度函数如下:
其中参数
。
Lindley分布多变点模型为:
其中
两两不等,m是变点个数,
(满足
)是需要估计的变点位置。通过二分分段法来解决多变点的问题的具体步骤为:先确定Lindley分布的序列S中是否存在单变点,如果没有,则序列S中无变点;如果存在单变点,此变点将Lindley分布的序列S拆分成两个子序列,再次确定两个子序列中是否存在单变点,重复上述步骤,直至所有子序列中识别不到变点为止。
设随机变量
相互独立且满足
其中参数
且
,
均未知,当
时k就是要讨论的变点,此模型只含有一个变点,称其为Lindley分布的单变点模型。
下文确定各参数的贝叶斯估计,对 取无信息先验分布:
,对参数
分别取无信息先验分布和伽玛分布后,再对变点k和参数
做贝叶斯估计。
3. Lindley分布参数的贝叶斯估计
当
时,设k是变点,故此变点问题的似然函数为
1) 通过Jeffreys提出的用Fisher信息阵来确定
的无信息先验分布。
样本对数似然函数为:
其中
。
通过样本对数似然函数可以求得:
进而得到
的无信息先验矩阵为:
其中
。
故
的无信息先验分布为:
由贝叶斯公式求得
的联合后验分布为:
各参数满条件分布为:
比较选取均匀分布作为先验分布来说,Jeffreys提出的用Fisher信息阵来确定
的无信息先验分布在单调变换中具有不变性,能够保证不论采取什么样的参数化方法,它们的先验分布始终是互通的,从而后验分布也是互通的。
2)
的先验分布为伽玛分布
。
且
相互独立,由贝叶斯公式得
的联合后验密度为:
各参数满条件分布为:
4. 随机模拟
在随机模拟过程中,考虑到参数
的满条件分布比较复杂,因此选用M-H算法对各参数的满条件分布进行抽样。接下来介绍Markov Chain Monte Carlo (MCMC)算法的几个具体步骤:
设初始点
经过迭代后第
次迭代值为
,则第t次迭代步骤如下:
1)
,选取建议分布
为均匀分布,并从中随机抽取
,令
,若随机数
,则
,否则
;
2)
,获取
与1)类似;
3)
,选取建议分布
为取值
的离散型均匀分布,并从中随机抽取
,令
,若随机数
,则
,否则
。
设
为迭代M次所得的Gibbs样本,若B次后迭代逐渐收敛,则将后
个迭代的均值作为参数
的估计值,
取
个样本,参数
的真实值取
,此时Lindley分布的模型为:
利用各参数的满条件分布,运用R软件进行MCMC模拟。为确保参数的收敛性,先进行10,000次的预迭代,再进行20,000次迭代。结果如下所示:
1) 当
选取无信息先验分布时:
Table 1. Bayesian estimation of parameters k , θ 1 , θ 2 under uninformative prior distribution
表1. 无信息先验分布下参数
的贝叶斯估计
Figure 1. The iteration trajectory of parameter k
图1. 参数k的迭代轨迹
Figure 2. The iteration trajectory of parameter k
图2. 参数k的迭代轨迹
2) 当
选取伽玛先验分布时:
,
。
Table 2. Bayesian estimation of parameters k , θ 1 , θ 2 under conjugate prior distribution
表2. 共轭先验分布下参数
的贝叶斯估计
Figure 3. Two iteration trajectories of the parameter k
图3. 参数k的两条迭代图
Figure 4. Two iteration trajectories of the parameter k
图4. 参数k的两条迭代轨迹
结果分析:由表1和表2知,当参数选取不同的先验分布后再进行随机模拟,得到各参数估计值与真实值的MC误差均不超过2%,因此各参数的估计值在较高水平上是有效的;各参数置信水平0.95的置信区间[2.5%分位数,97.5%分位数]较窄,说明区间估计效果良好;图1,图2是变点k的抽样迭代轨迹,可以根据图上信息判断样本是否收敛。两张图上显示出抽样基本都在变点附近波动,具有一定的规律性;此外,由图3,图4看出k的两条Markov链趋于重合,具有较好的收敛性。综上可得,Lindley分布的参数和变点估计可由MCMC算法得到较为理想的效果,可用该方法解决Lindley分布的变点问题。
基金项目
国家自然科学基金项目(11801488);新疆师范大学教学研究与改革项目(SDJG2020-30);新疆师范大学科研发展专项项目(XJNUZX202001)。
NOTES
*第一作者。
#通讯作者。