正相协相依样本下分布函数的经验似然统计推断
Empirical Likelihood Statistic Inference for Distribution Function for PA Dependent Samples
DOI: 10.12677/PM.2019.91012, PDF, HTML, XML, 下载: 925  浏览: 1,184  科研立项经费支持
作者: 黄 娟:广东海洋大学,数学与计算机学院,广东 湛江
关键词: 正相协分组经验似然置信区间Positive Associate Group Empirical Likelihood Confidence Intervals
摘要: 本文将在正相协相依样本下,利用分组经验似然比方法,构造分布函数的置信区间。
Abstract: This paper studies distribution function by group empirical likelihood method under strongly sta-tionary PA random sample. And we develop empirical likelihood ratio method to construct ap-proximate confidence regions for distribution function.
文章引用:黄娟. 正相协相依样本下分布函数的经验似然统计推断[J]. 理论数学, 2019, 9(1): 89-97. https://doi.org/10.12677/PM.2019.91012

1. 引言

Joag-Dey和Proschan (1983, [1] )提出了PA (positive associate)随机变量在可靠性理论和多元统计分析中有广泛的应用。经验似然是由Owen (1988)提出的一种非参数推断方法 [2] [3] ,其有类似Bootstrap的抽样特性。这一方法与传统的统计方法比较有很多优点。比如:用经验似然方法构造置信区间拥有域保持性,变换不变性,置信域的形状由数据自行决定,以及Bartlett纠偏性和无需构造轴统计量等等。因而在相依情形下,经验似然方法研究成果少见 [4] - [10] ,尤其在PA相依样本见之甚少。目前,关于分布函数的研究多数局限于非参数核方法。本文将尝试在PA相依样本下,攻克普通经验似然方法的缺陷,重新利用分组经验似然方法,构造未知的分布函数置信区间。首先给出PA序列概念。

定义1: [1] 称随机变量 X 1 , X 2 , , X n ( n 2 )是PA的,如果对于集合 { 1 , 2 , , n } 的任何两个不相交的非空子集 A 1 A 2 ,都有

C o v ( f 1 ( X i , i A 1 ) , f 2 ( X j , j A 2 ) ) 0

此处, f 1 f 2 是任何两个使得协方差存在的对每个变量均非降(或非升)的函数。称随机变量序列 { X i , i N } 是PA序列,如果对任何 n 2 ,随机变量 X 1 , X 2 , , X n ( n 2 )都是PA (正相协)的。

X 1 , X 2 , , X n 为来自总体 X 的正相协样本,由于 E I { X i x } = F ( x )

经验似然 R ( F ( x ) ) = sup { i = 1 n n w i , w i 0 , i = 1 n w i = 1 , i = 1 n w i I { X i x } = F ( x ) }

对数经验似然为 l ( F ( x ) ) = 2 log R ( F ( x ) ) = 2 i = 1 n log ( 1 + s [ I { X i x } F ( x ) ] )

此处 s R 1 ,且满足 K ( s ) = 1 n i = 1 n I { X i x } F ( x ) 1 + s [ I { X i x } F ( x ) ] = 0

2. 主要的结论及其证明

条件:

1) X 1 , X 2 , , X n 是来自总体的强平稳PA样本;

2) 令 u n = sup k j : | j k | n C o v [ ( I { X j x } F ( x ) ) , ( I { X k x } F ( x ) ) ] < ,若对某个 r > 2 ,满足 u n = O ( n ( r 2 ) 2 )

3) i = 1 C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ] <

定理1:如果上述条件成立,我们有

l ( F ( x ) ) d A 2 σ 2 χ ( 1 ) 2 , n

此处 A 2 = V a r [ I { X x } F ( x ) ] + 2 i = 1 C o v [ ( ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ) ] σ 2 = V a r ( I { X i x } F ( x ) )

然而 A 2 σ 2 未知,定理1的结果不能应用,为了攻克这一缺陷,下面利用分组经验似然方法,重新构造经验似然比函数。

m = [ n α ] , g = [ n 2 m ] ,其中 [ ] 表示取整, 0 < α < 1 2 为简单起见,使 n = 2 m g

ξ i = j = 1 m [ I { X 2 ( i 1 ) m + j x } F ( x ) ] η i = j = 1 m [ I { X ( 2 i 1 ) m + j x } F ( x ) ] Y 2 i 1 = ξ i m , Y 2 i = η i m (对任意的 i = 1 , 2 , , g )

由于 { X i | i 1 } 的强平稳性, Y i ( i = 1 , , 2 g ) 有共同分布函数 G ,对应经验分布函数 G 2 g 。分组经验似然比为 R ( F ( x ) ) = sup { i = 1 2 g 2 g P i | i = 1 2 g P i = 1 , P i 0 , i = 1 2 g P i m Y i = 0 }

对数经验似然比为 l ( F ( x ) ) = 2 log R ( F ( x ) ) = 2 i = 1 2 g log ( 1 + λ m Y i )

此处 λ R 1 且满足 K ( λ ) = 1 2 g i = 1 2 g m Y i 1 + λ m Y i = 0

定理2:在定理1的条件下,我们有 l ( F ( x ) ) d χ ( 1 ) 2 n

利用定理2,当样本 n 比较大时,可构造未知的分布函数 F ( x ) 的置信水平为 1 α 的渐近置信区域: P ( F ( x ) | l ( F ( x ) ) C α ) 1 α ,其中 C α χ ( 1 ) 2 分布的上 α 分位点,例如 α 取0.05或0.01。

引理1:记 Z n = max 1 i n | [ E I { X i x } F ( x ) ] | ,有 Z n = ο p ( n 1 2 )

证明:由于 [ E I { X i x } F ( x ) ] 有界,易得

Z n = max 1 i n | [ E I { X i x } F ( x ) ] | = ο p ( n 1 2 )

引理2: [7] 若 X 1 , X 2 , , X n 为PA变量,有 | X j | C ,且 E X j = 0 j = 1 , , N 。令 S n = j = 1 n X j u n = sup k j : | j k | n C o v ( X j , X k ) ,假设对某个 r > 2 u n = O ( n ( r 2 ) 2 ) ,则

sup m N { 0 } E | S m + n S n | r C n r 2

引理3: [11] 设 { X i | i 1 } 是强平稳PA序列,并且 i = 1 C o v ( X 1 , X 1 + i ) < ,假定 E X 1 = 0 E | X 1 | 2 < ,则 A 0 2 = E X 1 2 + 2 i = 1 E ( X 1 X 1 + i ) 收敛,且有

sup < x < | P ( 1 n i = 1 n X i A 0 < x ) Φ ( x ) | 0 ,其中 Φ ( x ) 为标准正态分布。

引理4:设 { X i | i 1 } 是强平稳PA序列,则有 1 2 g i = 1 2 g m ( Y i ) 2 = A 2 + ο p ( 1 )

其中 A 2 = V a r [ I { X x } F ( x ) ] + 2 i = 1 C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ]

证明:令 S 2 = 1 2 g i = 1 2 g m ( Y i ) 2 ,利用引理2和条件2有

E ( S 2 E S 2 ) 2 = ( m 2 g ) 2 E [ i = 1 2 g ( ( Y i ) 2 E ( Y i ) 2 ) ] 2 C ( m 2 2 g ) E ( Y i ) 4 C m 2 2 g E | I { X i x } F ( x ) | 4 m 2 C 2 g E | I { X i x } F ( x ) | 4 0

此处 C 为某个正常数,不同的地方 C 取值可不同。

因此有 S 2 = E S 2 + ο p ( 1 )

由于 E S 2 = m 2 g i = 1 2 g E ( Y i ) 2 = m E ( Y i ) 2 = 1 m E ( i = 1 m I { X i £ x } F ( x ) ) 2 = 1 m { m V a r ( I { X i x } F ( x ) ) + 2 m i = 1 m 1 C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ] 2 i = 1 m 1 i C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ] } = V a r ( I { X i x } F ( x ) ) + 2 i = 1 m 1 C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ] 2 m i = 1 m 1 i C o v [ ( I { X 1 x } F ( x ) ) , ( I { X 1 + i x } F ( x ) ) ]

利用引理3和文献 [12] 知 E S 2 = A 2 + ο ( 1 )

综上可得 S 2 = E S 2 + ο p ( 1 ) = A 2 + ο ( 1 ) + ο p ( 1 ) = A 2 + ο p ( 1 )

定理1的证明:

由于

P { ( I { X i x } F ( x ) ) < 0 } ε > 0 , P { ( I { X i x } F ( x ) ) > 0 } ε > 0 (3.1)

这表明0是集合 { I { X 1 x } F ( x ) , 1 i n } 所构成的凸包的内点,

因此 R ( F ( x ) ) = sup { R ( F ) | I { X i x } F ( x ) d F = 0 , F F n } 存在为正。 (3.2)

观察到 R ( F ( x ) ) = sup i = 1 n n w i (3.3)

对上式右端对 w i 求上确界时,满足 w i 0 , i = 1 n w i = 1 , i = 1 n w i [ I { X i x } F ( x ) ] = 0

利用拉格朗日乘子法,可得 w i = 1 n ( 1 + s ( I { X i x } F ( x ) ) ) , 1 i n (3.4)

此处 s R 1 ,且满足

h ( s ) = 1 n i = 1 n I { X i x } F ( x ) 1 + s ( I { X i x } F ( x ) ) = 0

0 = | h ( s ) | = 1 n | i = 1 n ( I { X i i x } F ( x ) ) i = 1 n s ( I { X i x } F ( x ) ) 2 1 + ( I { X i x } F ( x ) ) | | s | 1 n i = 1 n ( I { X i x } F ( x ) ) 2 1 + | s | Z n | 1 n i = 1 n ( I { X i x } F ( x ) ) | (3.5)

再利用引理3知: | s | 1 + | s | Z n = Ο p ( 1 n ) ,利用引理2得 s = Ο p ( 1 n ) (3.6)

γ i = s ( I { X i x } F ( x ) ) , s 满足 h ( s ) = 0

利用(3.6)式及引理1知: max 1 i n | γ i | = Ο p ( 1 n ) ο p ( n ) = ο p ( 1 ) (3.7)

则有 0 = h ( s ) = 1 n i = 1 n ( I { X i x } F ( x ) ) 1 + s ( I { X i x } F ( x ) ) = 1 n i = 1 n ( I { X i x } F ( x ) ) 1 + γ i = 1 n i = 1 n ( I { X i x } F ( x ) ) ( 1 γ i + γ i 2 1 + γ i ) = 1 n i = 1 n ( I { X i x } F ( x ) ) s 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + 1 n i = 1 n ( I { X i x } F ( x ) ) γ i 2 1 + γ i

s = 1 n i = 1 n ( I { X i x } F ( x ) ) 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + β , 利用(3.6),(3.7)式和引理4可得

β = 1 n i = 1 n ( I { X i x } F ( x ) ) 3 s 2 1 n i = 1 n ( I { X i x } F ( x ) ) 2 ( 1 + γ i ) = ο p ( n ) Ο p ( 1 n ) = ο p ( 1 n )

借助Taylor展开,我们有 log ( 1 + γ i ) = γ i γ i 2 2 + η i ,对某正数 G

P { | η i | G | γ i | 3 , 1 i n } 1 , n

则有

l ( F ( x ) ) = 2 log R ( F ( x ) ) = 2 i = 1 n log ( 1 + γ i ) = 2 i = 1 n γ i i = 1 n γ i 2 + 2 i = 1 n η i = 2 i = 1 n ( 1 n i = 1 n ( I { X i x } F ( x ) ) 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + β ) ( ( I { X i x } F ( x ) ) ) i = 1 n ( 1 n i = 1 n ( I { X i x } F ( x ) ) 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + β ) 2 ( I { X i x } F ( x ) ) 2 + 2 i = 1 n η i = 2 n ( i = 1 n ( I { X i x } F ( x ) ) 2 ) 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + 2 β i = 1 n ( I { X i x } F ( x ) ) 1 n ( i = 1 n ( I { X i x } F ( x ) ) ) 2 1 n i = 1 n ( I { X i x } F ( x ) ) 2 2 β i = 1 n ( I { X i x } F ( x ) ) β 2 i = 1 n ( I { X i x } F ( x ) ) 2 + 2 i = 1 n η i

= n ( 1 n i = 1 n ( I { X i x } F ( x ) ) ) 2 1 n i = 1 n ( I { X i x } F ( x ) ) 2 n β 2 1 n i = 1 n ( I { X i x } F ( x ) ) 2 + 2 i = 1 n η i I 1 + I 2 + I 3 (3.8)

再利用引理3知: I 1 d A 2 σ 2 χ ( 1 ) 2 n (3.9)

由条件得: I 2 = ο p ( 1 ) (3.10)

又由(3.6)和引理2得 | 2 i = 1 n η i | 2 B | s | 3 i = 1 n | ( I { X i x } F ( x ) ) | 3 = ο p (1)

其中 B 为某个正数,故有 I 3 = ο p ( 1 ) (3.11)

综合(3.9)~(3.11)式便得 l ( θ 0 ) d A 2 σ 2 χ ( 1 ) 2 n (3.12)

定理2的证明:

只需证明 l ( F ( x ) ) = 2 log R ( F ( x ) ) d χ ( 1 ) 2 n (3.13)

观察到 R ( F ( x ) ) = sup i = 1 2 g 2 g P i ,对上式右端对 P i 求上确界时,

满足 P i 0 , i = 1 2 g P i = 1 , i = 1 2 g P i m Y i = 0

借助拉格朗日乘子法得 P i = 1 2 g ( 1 + λ m Y i ) , 1 i 2 g (3.14)

此处,且满足

利用引理1证明得。 (3.15)

。 (3.16)

。 (3.17)

展开 (3.18)

此处

利用引理4得。 (3.19)

利用(3.18)及(3.19)式得。 (3.20)

又由引理1,引理2,(3.17)及(3.20)式知。记

利用(3.17)和(3.18)式得:。 (3.21)

又展开可得

,有。 (3.22)

利用引理4和(3.18)式得

。 (3.23)

又利用(3.21),(3.22)和(3.24)式得

。 (3.24)

利用(3.23)式并利用Taylor展开式,则有

(3.25)

此处

利用引理3及引理4,得。 (3.26)

利用(3.24)式得。 (3.27)

利用(3.18)和(3.24)式得

从而可得。 (3.28)

综上(3.25)~(3.28)式得。 (3.29)

基金项目

本论文得到广东省自然科学基金项目资助(2016A030313812; 2018A030307070)。

参考文献

[1] Joag-Dev, K. and Proschan, F. (1983) Negative Association of Random Variable with Application. The Annals of Statistics, 11, 286-295.
[2] Owen, A.B. (1988) Empirical Likelihood Ratio Confidence Intervals for a Single Function. Biometrika, 75, 237-249.
https://doi.org/10.1093/biomet/75.2.237
[3] Owen, A.B. (1990) Empirical Likelihood Confidence Regions. The Annals of Statistics, 18, 90 -120.
https://doi.org/10.1214/aos/1176347494
[4] 张军舰, 王成名, 等. 相依样本情形下经验似然比置信区间[J]. 高校应用数学学报, 1999, 14(1): 63-72.
[5] Kitamura, Y. (1997) Empirical Likelihood Methods with Weakly Dependent Process. The Annals of Statistics, 25, 2084-2102.
https://doi.org/10.1214/aos/1069362388
[6] Lin, L. and Runchu, Z. (2001) Block Empirical Edulidean Likelihood for Weakly Dependent Process. Statistics & Probability Letters, 53, 143-152.
https://doi.org/10.1016/S0167-7152(01)00066-9
[7] Birkel, T. (1988) Moment Bounds for Dependent Associated Sequences. The Annals of Probability, 16, 1184-1193.
https://doi.org/10.1214/aop/1176991684
[8] Zhang, J.J. (2006) Empirical Likelihood for NA Series. Statistics & Probability Letters, 76, 153-160.
https://doi.org/10.1016/j.spl.2005.07.019
[9] Chen, S.X. and Wong, C.M. (2009) Smoothed Block Empirical Likelihood for Quantiles of Weakly Dependent Processes. Statistica Sinica, No. 19, 71-81.
[10] Zhang, J.J. (2007) Empirical Likelihood Ratio Confidence Interval for Positively Associated Series. Acta Mathematica Applicate Sinica-English Series, No. 23, 245-254.
[11] Newman, C.M. (1984) Asymptotic Independence and Limit Theorems for Positive and Negative Dependent Random Variable. Inequalities in statistics and Probability, Hayward, 127-140.
[12] 杨善朝. 随机变量部分和的矩不等式[J]. 中国科学, A辑, 2000, 30(3): 218-223.