1. 引言
考虑带等式约束的线性模型:
(1)
其中y是
的响应变量,X是
的已知设计矩阵,
为
未知参数向量,
和
分别表示随机误差向量
的均值和协方差矩阵,
表示n阶单位矩阵,R为
阶的行满秩非零矩阵。
针对模型(1)中未知参数向量
的估计问题,Rao [1] 提出了
的约束最小二乘估计:
其中
,
。
为克服模型中可能存在的复共线性问题,GroB [2] 将线性模型中的岭估计思想引入模型(1),提出了约束岭估计:
其中
,
。
类似的,徐建文 [3] 针对模型(1)中未知参数向量
的估计问题,提出了约束LIU估计:
其中
。
当给模型(1)加入微小扰动时,统计推断会发生改变,所以有必要对模型扰动的方式进行研究,同时给出度量扰动对统计推断影响大小的诊断统计量也是有必要的。
于义良和吴诗泳 [4] 研究了模型(1)中
的影响问题,得到了基于
的强影响点度量W-K统计量和Cook距离的表达式。赵帅 [5] 考虑了模型(1)的单个数据删除模型
(2)
扰动下含k、d参数LIU估计的影响分析问题,得到了模型(1)和模型(2)下LIU估计间的关系式,并给出度量模型(2)扰动前后LIU估计的影响大小的Cook距离表达式,模型(2)中
,
和
分别为模型(1)中的Y, X,
删除第i行数据所得的向量或矩阵。
张尚立和覃红 [6] 给出了模型(1)的协方差扰动模型
(3)
并研究了协方差阵扰动对最佳线性无偏估计(BLUE)的影响分析问题,得到了度量在约束条件下协方差阵对BLUE的影响程度的广义Cook距离的两个计算公式。其中G为正定矩阵。
邢慧娟 [7] 考虑了模型(1)的均值漂移模型
(4)
扰动前后岭估计的关系式,定义了用来度量模型(4)扰动前后影响大小的广义Cook距离计算表达式,得出一些有意义的理论结果。模型(4)中
为
维列向量,D是
矩阵。
本文主要研究在模型(2)、(3)和(4)扰动下的影响分析问题,得到扰动前后
间的关系,并给出度量扰动对约束LIU估计的影响程度的广义Cook距离的计算公式。
2. 模型(1)与三种扰动模型下LIU估计的关系
引理 1 [8]:设
可逆。若
,则
若
,则
其中
,
。
引理 2 [8]:若矩阵A, D可逆,则
2.1. 数据删除扰动
定理1模型(1)与模型(3)的LIU估计
与
有如下关系:
其中
,
,
,
,
。
证明:由模型(4)和约束LIU估计的定义给出
的表达式如下:
(5)
其中
,我们根据
,
,
,
。由引理2可将
表达成如下形式:
注意到
,由
,故而有:
(6)
把(6)式及
代入(5)式得
化简上式可得模型(1)与模型(2)的约束LIU估计
与
间的关系式,定理1得证。
2.2. 协方差扰动
定理 2模型(1)与模型(3)的LIU估计
与
有如下关系:
其中记
,
,
,
,
,
,
,
,
,
。。
证明:由LIU估计的定义可以给出在线性模型协方差扰动下的LIU估计为:
(7)
同理,模型(2)在协方差扰动下的约束LIU估计为:
(8)
其中
,
,
,
。
由引理2得到
(9)
(10)
(11)
(12)
将式(9)至(12)代入(7)整理得
(13)
又由(8)式得
,注意到
故
从而有
把(13)式代入上式得到
化简上式可得模型(1)与模型(3)的约束LIU估计
与
间的关系式,定理2得证。
2.3. 均值漂移扰动
定理3 记
,
,模型(4)可改写成
,参数
的最小二乘估计为
,若
可逆,则
其中
,
,
,
,
。
证明:因为
,由引理1得
的最小二乘估计为:
其中
,则有
,该定理给出了最小二乘估计与均值漂移后参数
间的关系,且定理3得证。
定理4 若
可逆,则有
证明:因为
,由引理1有
其中
,把
,
,
代入
整理得
(注:由于只考虑
的相关情况,非相关项用#省略)。
定理4得证。
定理5 模型(1)与模型(4)的约束LIU估计
与
有如下关系
证明:根据约束LIU估计的定义,给出模型(4)的约束LIU估计的表达式:
(14)
这里的M与前文的定义一样。
把定理4代入(14)式化简就可以得到定理5,证毕。
当模型(2)中
时,型(1)与模型(2)的LIU估计
与
退化为不带约束
与
间的关系式
与张莉莉和张尚立 [9] 的结论相同,同理,模型(2)和模型(3)退化后的结论也与之相同。
3. 诊断统计量
为了度量不同扰动模型下约束LIU估计的影响程度,类似Cook距离的思想,我们定义广义Cook距离
(15)
式(15)中
分别表示
,
,
,K与前文定义一样,
表示模型(1)的约束LIU估计。
由模型(2)可得Cook距离为:
根据模型(3)有:Cook距离为:
模型(4)的Cook距离如下:
当模型(2)中
时,
,cook距离为:
与张莉莉和张尚立 [9] 的结论一致,同理,模型(3)和模型(4)的结论也与其的相同。
4. 结论
在约束LIU估计下,得到了数据删除模型、协方差模型及均值漂移模型扰动下
、
及
与原模型
间的关系式,并根据度量最小二乘估计影响大小的诊断统计量Cook距离的思想,分别推导出了度量数据删除模型、协方差模型及均值漂移模型扰动前后影响大小的广义Cook统计量新的表达式。