1. 引言
随着频率学派模型平均理论的不断研究和进展,多模型下的置信区间整合也日益体现出其研究价值与实用价值。事实上,使用模型平均的主要原因之一是在计算这样一个区间时允许模型的不确定性。模型选择通常会导致一个比模型平均的区间覆盖率更低、稳定性更差的区间[1] [2]。
越来越多的方法被提出来构建频率模型平均的置信区间。最经典和简单的Wald区间形式为
,其中
是标准正态分布的
分位数,Wald区间取决于
的标准误差估计
的准确估计。但是,估计
是相当困难的。Burnham和Anderson (2002) [3]提出了一些
的估计形式。Turek和Fletcher (2012) [4]提出将每个置信限定义为单模型Wald区间误差率的加权和等于期望误差率的方法,因为涉及对单个模型估计的抽样分布尾部区域进行平均,因此该方法被称为模型平均尾部区域Wald区间。针对偏斜数据的模型平均置信区间构建,Zeng和Fletcher等人(2019) [5]提出了学生化Bootstrap模型平均尾部区域区间,利用参数Bootstrap方法来估计每个模型的学生化估计的分布,该方法只需要在模型是真实模型时,每个模型的学生化估计是渐近枢轴的。
MMA是一种以Mallow’s Cp准则为基础的经典模型平均方法Hansen (2007) [6],自提出以来被广泛的应用与拓展。Liu和Okui (2013) [7]将MMA的应用范围扩展到了异方差情况。Wan等(2010) [8]将其渐近最优性推广至非嵌套模型。Feng等(2020) [9]将MMA改进为一种类似于Lasso (Zou, 2006) [10]的凸优化方法,并提出了高效的稀疏权重解算法。Kun Cao等(2023) [11]提出了MMAe,一种修正的MMA方法,基于对Mallow’s Cp准则的惩罚修正,以应对模型之间不可避免的共线性问题。
本文在MMAe赋权方法下,构造了Wald,MATA,Bootstrap模型平均置信区间,通过模拟计算来分析说明。第二部分介绍如何得到权重表达式,Wald区间的构造方法以及相应的标准差的估计、MATA-Wald模型平均置信区间的方法及Bootstrap模型平均置信区间的构造方法。第三部分进行模拟研究,从平均区间长度、覆盖率、左右错误率方面分别比较了Wald区间、MATA区间和Bootstrap区间在不同信噪比下的表现情况;并且在中信噪比水平下,对比了四种不同赋权方法在不同置信区间下覆盖率与错误率的表现情况。第四部分进行了实证分析,展示了MMAe加权方法在不同置信区间下的表现。第五部分对模拟结果进行总结,得出结论。
2. 置信区间构建
本文在使用MMAe赋权方法得到的权重下,比较Wald,MATA,Bootstrap模型平均置信区间的表现情况。区间的频率性质使用覆盖率以及左右错误率这两个指标。
2.1. MMAe方法
MMAe方法是一种基于惩罚Mallow’s Cp的修正MMA,为了处理模型间不可避免的共线性,添加了一个加权弹性网惩罚项,文中通过CD算法得到了MMAe权重[11],在Kun Cao [11]的基础上,w的表达式通过以下过程计算:
其中,
,
,
,
,
,
决定了
和
惩罚的比例,
是完全模型或最大模型对
的估计。
2.2. Wald置信区间
假设
服从标准正态分布,其中
是
标准差的估计,模型平均的Wald置信区间为[12]:
其中z是标准正态分布的
分位数。本文中的
,其中
为自由度为
的t分布的分位数,
是与模型
相关的残差的自由度。
2.3. MATA置信区间
MATA区间[4]通过将模型平均的上下错误率设置为等于所需要的错误率来选择置信限,其置信限的定义是:每个候选模型的错误率的加权平均值等于所需的总体错误率。于是,
MATA置信区间的下限
满足:
其中,当模型
为真时,
是与使用
作为
的
置信下限相关的错误率的估计,置信上限同理。
2.4. Bootstrap置信区间
Bootstrap置信区间[13]假设恰有一个候选模型是真实的,记
为未知的指示变量,如果模型
为真,则
否则
,假设我们知道
的真实分布记为
,参数
的置信区间
满足下列方程:
由于
是未知的,我们用与模型相对应的基于某种信息准则的模型权重
来估计上述公式中的
,则参数
的置信区间
满足下列方程:
如果
的真实分布情况未知,假设每个模型的学生化的参数估计
服从标准正态分布或t分布,即
为标准正态分布或者t分布的分布函数,本文利用参数Bootstrap方法构造变量的分布,即用参数估计的Bootstrap分布
来近似上述公式中的分布
,从而计算参数的模型平均置信区间。获取的参数
的
的置信区间即为z版本或者t版本的MATA区间。
3. 数据模拟
考虑正态线性模型,包括8个候选模型,第m个模型中包含预测变量
,
,每个模型
。假设数据的产生过程如下[11]:
其中,
,
,
,
。Q的对角线元素为1,非对角线元素为
。
,其中q是协变量的数目。在这里令
,并且
满足
,
,
。x是在每轮模拟中随机产生的。样本量分别取
这7种情形。对于感兴趣的参数选取为预测空间x各个点的
值,这里考虑预测空间x在不同信噪比下不同值处的
值。这里模拟次数为103次,在计算Bootstrap模型平均置信区间时Bootstrap样本量取B = 1000。
3.1. MMAe权重下不同置信区间比较
由图3、图4和图5可以看出响应变量均值在不同置信区间的覆盖率和左、右错误率随样本容量n的变化趋势,图3右图、图4右图和图5右图的下方和上方分别为不同置信区间在不同样本量下的左、右错误率。为了表示方便,左错误率取负值后展示在图3右图、图4右图和图5右图的图下方,图1和图2展示了不同置信区间在R2 = 0.4、R2 = 0.6和R2 = 0.8时不同样本量下的平均区间长度。
通过图1、图2、图3、图4和图5的数据可以得到以下结论:1) 右错误率方面,Wald区间整体要好于其它两种区间,Bootstrap模型平均置信区间在样本量较小时具有较低的右错误率水平,在R2 = 0.4
Figure 1. The average interval length corresponding to different confidence intervals when R2 = 0.4 (left) and R2 = 0.6 (right)
图1. R2 = 0.4 (左)与R2 = 0.6 (右)时不同置信区间对应的平均区间长度
Figure 2. The average interval length corresponding to different confidence intervals when R2 = 0.8
图2. R2 = 0.8时不同置信区间对应的平均区间长度
Figure 3. The coverage rate (left) and error rate (right) corresponding to different confidence intervals when R2 = 0.4
图3. R2 = 0.4时不同置信区间对应的覆盖率(左),左右错误率(右)
Figure 4. The coverage rate (left) and error rate (right) corresponding to different confidence intervals when R2 = 0.6
图4. R2 = 0.6时不同置信区间对应的覆盖率(左),左右错误率(右)
Figure 5. The coverage rate (left) and error rate (right) corresponding to different confidence intervals when R2 = 0.8
图5. R2 = 0.8时不同置信区间对应的覆盖率(左),左右错误率(右)
Figure 6. Coverage rate (left) and error rate (right) of MATA interval when R2 = 0.6
图6. R2 = 0.6时MATA区间的覆盖率(左),左右错误率(右)
Figure 7. Coverage rate (left) and error rate (right) of Wald interval when R2 = 0.6
图7. R2 = 0.6时Wald区间的覆盖率(左),左右错误率(右)
Figure 8. Coverage rate (left) and error rate (right) of Bootstrap interval when R2 = 0.6
图8. R2 = 0.6时Bootstrap区间的覆盖率(左),左右错误率(右)
和R2 = 0.6的情况下更接近名义错误率;左错误率方面,三种区间表现差距不大,2) 覆盖率方面,Bootstrap区间整体要逊于MATA区间和Wald区间,在R2 = 0.4和R2 = 0.6情况下,Wald置信区间整体表现较好。3) 平均区间长度方面,随着样本量的增大,三种置信区间平均长度的差距减小;在较小样本条件下,Bootstrap的平均区间长度长,以达到较高的覆盖率。4) 随着样本量的增加,三种区间估计方法都逐渐接近名义覆盖率。5) 随着R2的增大,Bootstrap区间,MATA区间,Wald区间得到的平均区间长度均增大;且覆盖率在更低的样本量下到达名义覆盖率。
3.2. 不同赋权方法在不同置信区间下的比较
通过图6、图7、图8的数据可以得到以下结论:1) 右错误率方面,MMAe方法整体要好于其它三种方法,且更接近名义错误率,左错误率方面,四种方法表现差异不大;2) 覆盖率方面,MMAe方法无论在哪种区间下表现都好,均在更低的样本量下到达名义覆盖率,MATA置信区间和Wald置信区间相差不大,Bootstrap置信区间在该信噪比下在样本量较大时到达名义覆盖率;3) 随着样本量的增加,三种区间估计方法都逐渐接近名义覆盖率。
4. 实证分析
本节应用提到的模型平均方法,结合不同的模型平均区间方法,利用财产估值数据来说明这些模型平均区间方法之间的差异。我们所考虑的数据来自Subhash C. Narula & John F. Wellington [14]的论文。数据包含9个预测变量,分别为:x1 (地方的,学校的,国家的)税额/1000、x2浴缸数、x3占地面积(平方英尺 × 1000)、x4居住面积(平方英尺 × 1000)、x5车库数、x6房间数、x7卧室数、x8房龄(年)、x9壁炉数,响应变量是房屋销售价格/1000。我们的目标是通过预测变量来预测房屋销售价格/1000的值。我们考虑7个
模型,其中第m个模型中包含预测变量
,
,x0为截距项,每个模型
,本实例给定置信区间的名义置信水平为95%。
图9展示了关于财产估值数据预测均值在MMAe权重下不同置信区间(MATA, Bootstrap, Wald)的分析结果,Bootstrap区间的区间长度大于Wald置信区间和MATA置信区间,Bootstrap模型平均置信区间在样本量较小时具有较低的右错误率水平,且在样本量较小的情况下区间长度在三种方法中最长,这与我们的模拟情况表现一致。
Figure 9. 95% confidence interval for models with different confidence intervals
图9. 不同置信区间模型平均95%置信区间
5. 结论
通过上述模拟可知在一个数据集中,当样本量小且使用MMAe方法赋值权重时,使用Bootstrap置信区间会更好;当有用的信号相对较少,而噪音或随机变动相对较多时,使用Wald置信区间会得到更好的覆盖率;在噪音或随机变动相对较少时,在MMAe权重下,使用任意一种模型平均置信区间方法在覆盖率方面表现都较好,但是MATA置信区间区间长度更短,故在该情形下,MATA置信区间更适合。
文中模拟了在假设情形下MMAe赋权方法的表现情况,但是并未模拟模型平均置信区间的其它构造方法。随着模型平均的研究发展,利用模型平均构造置信区间的方法也是层出不穷。除了本文中提到的模型平均置信区间的方法,还有基于转换的模型平均尾部区域置信区间,学生化Bootstrap模型平均尾部区域区间等,因此其他的模型平均方法在MMAe赋权时还有待挖掘。
NOTES
*通讯作者。