Laplace分布参数的Bayes统计推断研究
A Study of Bayes Statistical Inference for Parameter of Laplace Distribution
DOI: 10.12677/AAM.2023.127310, PDF, HTML, XML, 下载: 167  浏览: 342  科研立项经费支持
作者: 周 慧, 袁新梅:宜春学院数学与计算机科学学院,江西 宜春
关键词: Laplace分布Bayes估计损失函数LINEX损失熵损失函数Laplace Distribution Bayes Estimation Loss Function LINEX Loss Entropy Loss Function
摘要: Laplace分布在金融研究、可靠性理论、机器学习中具有重要的作用。本文将讨论Laplace分布参数的Bayes统计推断问题。首先研究了Laplace分布参数在平方误差损失、LINEX损失和熵损失这三类损失函数下的Bayes估计问题,然后研究了基于平方误差损失函数下的风险函数的比较问题,并通过蒙特卡洛模拟考察了各类估计的优良性,最后提出在实际应用Bayes估计时,如何针对n的取值来选择合适的Bayes估计。
Abstract: Laplace distribution plays an important role in financial research, reliability theory, and machine learning. This paper will discuss the Bayes statistical inference of Laplace distribution parameters. Firstly, the Bayes estimation of the distribution parameter under scale squared error loss, LINEX loss and entropy loss is studied, and then the comparison of risk functions under square error loss function is studied and the advantages of various estimates are investigated by Monte Carlo simula-tion. Finally, how to select an appropriate Bayes estimation based on the value of n is proposed in practical application of Bayes estimation.
文章引用:周慧, 袁新梅. Laplace分布参数的Bayes统计推断研究[J]. 应用数学进展, 2023, 12(7): 3113-3120. https://doi.org/10.12677/AAM.2023.127310

1. 引言

Laplace分布由两个指数函数组成的,所以又叫做双指数函数分布(double exponential distribution),在金融工程、质量控制和机器学习等领域中有着重要的应用。Laplace分布的密度函数曲线具有尖峰和重尾特征,这可以很好地刻画金融数据 [1] [2] 。文献 [3] 用非对称Laplace分布对中国沪深股市收益率分布特征作了实证研究;文献 [4] 提出了偏广义误差-Laplace (SGEL)分布并给出了SGEL分布的最大似然估计量和Fisher信息矩阵、构建了基于SGEL分布的风险度量模型、将POT模型中的超额分布用SGEL分布近似提出了POT-SGEL模型,这些可以用于金融市场中度量风险。Laplace分布模型的可靠性统计推断问题在国内外也得到了广泛的关注和研究。文献 [5] 研究了相互独立的顺序统计量 X = ( X ( 1 ) , X ( 2 ) , , X ( n ) ) 服从参数为 λ ( λ > 0 )和 μ ( μ 为实常数)的拉普拉斯分布时的性质, X ( 1 ) X ( n ) 的密度函数及它们的数字期望和方差;文献 [6] 讨论了标准Laplace分布极小和极大次序统计量的分布及在样本容量为2时,次序统计量分布的特点和它们之间的关系;文献 [7] 基于次序统计量样本研究了Laplace分布精确预测区间问题;文献 [8] 探讨了在测量误差的分布为Laplace分布时建立一种多元Laplace分布的测量误差模型,并将基于无条件期望的估计方法应用到其中;文献 [9] 基于卡方拟合优度检验和K-S检验方法构造了一类新的检验统计量对Laplace分布进行假设检验,最后通过统计模拟验证了该检验方法的有效性和可行性;文献 [10] 将Laplace分布的尺度参数的最短置信区间估计的求解问题转化为非线性方程组的求解问题;文献 [11] 在对数平方误差损失函数下研究了Laplace分布参数的最大最小估计问题。目前,Laplace分布也被应用到图形信号处理和模式识别等领域 [12] 。文献 [13] 根据多尺度几何分析方法Contourlet变换和平移不变Contourlet变换(TICT)高频系数重拖尾的特征,将数据分成两组,用广义Laplace分布对其无噪系数建模,高斯分布对其噪声系数建模,用分布迭代求得无噪系数在高频系数中的概率,最后用混合分布滤波方法降噪,在平滑噪声的同时较好的保持了图像的细节信息。文献 [14] 改进了基于拉普拉斯先验的贝叶斯压缩感知模型,消除了外部噪音的影响,提高了模型的抗噪性能和二维图像的重构性能。文献 [15] 通过建立混合泊松–拉普拉斯–高斯分布来表征电荷耦合器件(CCD)传感射线照相数据中的噪声,并开发了一个多凸优化模型来解决重建问题,对在动力实验中处于重要地位的阿贝尔反演层析成像做了进一步研究。

本文将在平方误差损失、LINEX损失和熵损失这三类损失函数下研究Laplace分布参数的Bayes估计问题,然后基于平方误差损失函数对以上三种风险函数进行比较,通过蒙特卡洛模拟考察各类估计的优良性,最后提出在实际应用Bayes估计时,如何针对n的取值来选择合适的Bayes估计。

设随机变量X服从两参数Laplace分布,相应的概率密度函数为

f ( x | μ , θ ) = 1 2 θ exp ( | x μ | θ ) , < x < (1)

其中 μ ( + , ) 为位置参数, θ > 0 为尺度参数。

2. Bayes估计

X = ( X 1 , X 2 , , X n ) 来自总体服从Laplace分布(1)的容量为n的一个简单随机样本,其中位置参数 μ 已知。记 x = ( x 1 , x 2 , , x n ) X = ( X 1 , X 2 , , X n ) 的样本值, t = i = 1 n | x i μ | T = i = 1 n | X i μ | 的样本值。

给定样本值 x = ( x 1 , x 2 , , x n ) 后,参数 θ > 0 的似然函数为

l ( x ; θ ) = i = 1 n f ( x i | μ , θ ) = i = 1 n 1 2 θ exp ( | x i μ | θ ) θ n e t θ (2)

通过求解对数似然方程得 θ 的最大似然估计:

δ ^ M L E = T n (3)

易证 T = i = 1 n | X i μ | 服从参数为n和 θ 1 伽玛分布 Γ ( n , θ 1 ) ,则有 E T 1 = θ / ( n 1 )

以下讨论中设参数 θ 的先验分布为无信息Quasi先验分布,即概率密度:

π ( θ ) θ d , θ > 0 , d > 0 (4)

本节讨论中所采用的损失函数为

1) 平方误差损失函数

L ( θ ^ , θ ) = ( θ ^ θ ) 2 (5)

在该损失下参数 θ 的Bayes估计为:

θ ^ B S = E [ θ | X ] . (6)

2) LINEX损失函数:

L ( Δ ) = e c Δ c Δ 1 , c 0 (7)

其中 Δ = θ ^ θ θ ,c为形状参数。在该损失函数下, θ 的Bayes估计 θ ^ B L 为方程(8)的解:

E [ 1 θ exp ( c θ ^ B L θ ) | X ] = e c E [ 1 θ | X ] (8)

3) 熵损失函数:

L ( θ ^ , θ ) = θ ^ θ ln θ ^ θ 1 (9)

在该损失下,参数 θ 的Bayes估计为

θ ^ B E = [ E ( θ 1 | X ) ] 1 (10)

以上三种损失函数的详细介绍以及它们在Bayes统计推断中的更多应用参见文献 [16] [17] [18] [19] [20] 。

定理 3.1 设 X 1 , X 2 , , X n 为来自Laplace分布(1)的一个样本容量为n的简单随机样本,其中 x 1 , x 2 , , x n 为相应的样本值,记 x = ( x 1 , x 2 , , x n ) X = ( X 1 , X 2 , , X n ) t = i = 1 n | x i μ | T = i = 1 n | X i μ | 的样本值。并设参数 θ 的先验分布为Quasi先验分布(4),则

1) 参数 θ 在平方误差损失下的Bayes估计为:

θ ^ B S = T n + d 2 , (11)

2) 参数 θ 在LINEX损失下的Bayes估计为:

θ ^ B L = T c [ 1 exp ( c n + d ) ] (12)

3) 参数 θ 在熵损失下的Bayes估计为:

θ ^ B E = T n + d 1 (13)

证明 给定样本值 x = ( x 1 , x 2 , , x n ) 后参数 θ 的似然函数为:

l ( θ ; x ) = i = 1 n f ( x i | μ , θ ) = i = 1 n 1 2 θ exp ( | x i μ | θ ) θ n e t θ ,

其中 t = i = 1 n | x i μ | T = i = 1 n | X i μ | 的样本值。再由公式(4)和Bayes定理,我们可以得到参数 θ 的后验概率

密度函数为:

h ( θ | x ) l ( θ | x ) π ( θ ) θ n e t / θ θ d θ ( n + d ) e t / θ (14)

于是 θ 的后验分布为倒伽玛分布 I Γ ( n + d 1 , s ) ,即概率密度为:

h ( θ | x ) = t n + d 1 Γ ( n + d 1 ) θ ( n + d ) e t θ (15)

则:

1) 参数 θ 在平方误差损失函数下的Bayes估计为:

θ ^ B S = E ( θ | X ) = T n + d 2 ,

2) 由于

E [ 1 θ exp ( c θ ^ B L θ ) | X ] = 0 1 θ exp ( c θ ^ B L θ ) T n + d 1 Γ ( n + d 1 ) θ ( n + d ) e T θ d θ = T n + d 1 Γ ( n + d 1 ) Γ ( n + d ) ( T c θ ^ B L ) n + d

e c E [ 1 θ | X ] = 0 1 θ T n + d 1 Γ ( n + d 1 ) θ ( n + d ) e T θ d θ = e c n + d 1 T

将它们代入式(8),解得参数 θ 在LINEX损失下的Bayes估计为:

θ ^ B L = T c [ 1 exp ( c n + d ) ]

3) 参数 θ 在熵损失函数下的Bayes估计为:

θ ^ B E = [ E ( θ 1 | X ) ] 1 = [ 0 1 θ T n + d 1 Γ ( n + d 1 ) θ ( n + d ) e T θ d θ ] 1 = T n + d 1

3. 平方误差损失下各类估计的风险函数比较研究

为比较各类Bayes估计的好坏,风险函数是一个常用且重要的衡量标准。设 θ ^ θ 的估计量, L ( θ ^ , θ ) 表示损失函数,则其对应的风险函数定义为:

R ( θ , θ ^ ) = E [ L ( θ ^ , θ ) ] .

本节将推导各Bayes估计量在平方误差损失下的风险函数,并给出蒙特卡洛模拟比较结果。设 θ ^ θ 的估计量,则在平方误差损失下, θ ^ 的风险函数为

R ( θ , θ ^ ) = E [ ( θ ^ θ ) 2 ] = 0 ( θ ^ θ ) 2 h ( s ) d s (16)

经简单的计算得,三类Bayes估计的风险函数分别为:

R ( θ , θ ^ B S ) = θ 2 [ n ( n + 1 ) ( n + d 2 ) 2 2 n n + d 2 + 1 ] (17)

R ( θ , θ ^ B L ) = θ 2 [ n ( n + 1 ) c 2 ( 1 e c / ( n + d ) ) 2 2 n c ( 1 e c / ( n + d ) ) + 1 ] (18)

R ( θ , θ ^ B E ) = θ 2 [ n ( n + 1 ) ( n + d 1 ) 2 2 n n + d 1 + 1 ] . (19)

为比较各风险函数,将各风险函数与 θ 2 做比值,得到如下三个比率风险函数:

R ( θ , θ ^ B S ) θ 2 = B 1 R ( θ , θ ^ B L ) θ 2 = B 2 R ( θ , θ ^ B E ) θ 2 = B 3

下面给出各风险函数与 θ 2 的比值函数 B 1 , B 2 B 3 随n变化的曲线图。

图1~4知,当n较小时,各风险函数与 θ 2 的比值函数 B 1 , B 2 B 3 的图像差别较大,但随n的增大,特别是n较大,例如当n > 60时,各类曲线趋于重合,即三个比率风险函数值趋于一致。

Figure 1. The curves of ratio of risk function with d = 1.5, c = 1.5

图1. d = 1.5,c = 1.5时,各比率风险函数曲线

Figure 2. The curves of ratio of risk function with d = 1.5, c = 0.5

图2. d = 1.5,c = 0.5时,各比率风险函数曲线

Figure 3. The curves of ratio of risk function with d = 0.5, c = −2.5

图3. d = 0.5,c = −2.5时,各比率风险函数曲线

Figure 4. The curves of ratio of risk function with d = 2, c = 2.5

图4. d = 2,c = 2.5时,各比率风险函数曲线

4. 结论

针对Laplace分布模型参数的Bayes统计推断问题,本文在参数的先验分布为无信息Quasi先验时研究了其在三种常见损失函数下的Bayes估计问题。进一步地,在平方误差损失函数下通过统计模拟试验对各类Bayes估计的风险函数进行了比较。又由公式(18),我们发现LINEX损失函数中的形状参数c不但影响估计值也会影响到参数的估计的风险函数值。根据模拟结果(参见图1~4),我们建议在实际应用Bayes估计时,可采用如下原则:

1) 当n较小时,可以将图像中对应于超参数d的风险函数较小的Bayes估计作为参数的估计值。

2) 当n较大时,由于各Bayes估计受超参数d的影响较小,此时可任选一类Bayes估计作为参数的估计值。

基金项目

江西省教育厅科技项目,编号:GJJ211604。

参考文献

[1] Ribeiro-Reis, L.D. (2022) Laplace Distribution: Properties, Regression Model and Simulation. Journal of Statistics & Management Systems, 25, 489-499.
https://doi.org/10.1080/09720510.2021.1930664
[2] Linden, M. (2001) A Model for Stock Return Distribution. Internatinal Journal of Finance and Economics, 6, 159-169.
https://doi.org/10.1002/ijfe.149
[3] 蒋春福, 李善民, 梁四安. 中国股市收益率分布特征的实证研究[J]. 数理统计与管理, 2007, 26(4): 710-717.
[4] 周晓娅. 偏广义误差-Laplace分布研究及在金融尾部风险中的应用[D]: [硕士学位论文]. 重庆: 重庆理工大学, 2022.
[5] 匡能晖. 拉普拉斯分布顺序统计量的分布性质[J]. 徐州师范大学学报(自然科学版), 2009, 27(3): 34-37.
[6] 尹真真, 邱珍珠. 标准拉普拉斯分布次序统计量的性质[J]. 大学数学, 2021, 37(6): 5-10.
[7] Lliopoulos, G. and Mirmostafaee, S.M.T.K. (2014) Exact Prediction Intervals for Order Statistics from the Laplace Distribution Based on the Maximum-Likelihood Estimators. Statistics, 4, 575-592.
https://doi.org/10.1080/02331888.2013.766795
[8] 史建红, 宋卫星. 测量误差为Laplace分布的非线性统计推断[J]. 系统科学与数学, 2015, 35(12): 1510-1528.
[9] 曹辉. Laplace分布的统计推断及应用[D]: [硕士学位论文]. 扬州: 扬州大学, 2018.
[10] 徐美萍, 于健, 马玉兰. 几种厚尾分布尺度参数的最短区间估计[J]. 统计与决策, 2014(10): 69-71.
[11] Rasheed, H.A. and Al-Shareefi, E.F. (2015) Minimax Estimation of the Scale Parameter of Laplace Distribution under Squared-Log Error Loss Function. Mathematical Theory & Modeling, 5, 183-193.
[12] 李芸. 基于拉普拉斯分布的稳健估计[D]: [硕士学位论文]. 扬州: 扬州大学, 2017.
[13] 周逸丽. 基于Contourlet的图像去噪方法研究[D]: [硕士学位论文]. 西安: 西安电子科技大学, 2012.
[14] 章坚武, 颜欢, 包建荣. 改进的基于拉普拉斯先验的贝叶斯压缩感知算法[J]. 电路与系统学报, 2012, 17(1): 34-40.
[15] Kong, L. and Wei, S. (2022) A Variational Method for Abel Inversion Tomography with Mixed Poisson-Laplace-Gaussian Noise. Inverse Problems and Imaging, 16, 967-995.
https://doi.org/10.3934/ipi.2022007
[16] Mclachlan, G., Majdak, P., Reijniers, J., et al. (2021) Towards Modelling Active Sound Localisation Based on Bayesian Inference in a Static Environment. Acta Acus-tica, 5, Article No. 45.
https://doi.org/10.1051/aacus/2021039
[17] Wand, M.P. and Yu, J.C.F. (2022) Density Es-timation via Bayesian Inference Engines. AStA Advances in Statistical Analysis, 106, 199-216.
https://doi.org/10.1007/s10182-021-00422-8
[18] 马云飞, 白华军, 温亮, 等. 基于Laplace先验和稀疏块相关性的旋转机械振动信号贝叶斯压缩重构[J]. 兵工学报, 2021, 42(12): 2762-2770.
[19] Pavone, A., Merlo, A., Kwak, S., et al. (2023) Machine Learning and Bayesian Inference in Nuclear Fusion Research: An Overview. Plasma Physics and Controlled Fusion, 65, Article ID: 053001.
https://doi.org/10.1088/1361-6587/acc60f
[20] Nassar, M., Alotaibi, R., Okasha, H., et al. (2022) Bayesian Estima-tion Using Expected LINEX Loss Function: A Novel Approach with Applications. Mathematics, 10, Article 436.
https://doi.org/10.3390/math10030436