1. 前言
Meta-分析是一种对同一问题的不同研究进行定量合并的一种方法。该方法是通过考虑每个研究内和研究间的差异性以及研究发表偏倚性得到一个综述结果,从而解决了单个研究样本量小,区域、种族差异大等的缺点。因此Meta-分析的结果对很多领域的科学研究都具有指导意义。针对具体问题的Meta-分析及其统计方法研究已持续了一个世纪之久。最早是在1904年Karl Pearson针对伤寒疫苗效果进行了合并研究 [1] ;接下来的很多年中对某些零星的问题做了类似的综合 [2] 。但是在过去的四十年中,人们逐渐意识到医学实验和临床操作需要基于整体的相关性和可靠证据,Meta-分析的影响得到极大的扩展 [3] 。仅在2018年,关于健康管理的Meta-分析发表文章将近4000篇。
虽然Meta-分析在很多领域都有很好的应用,但对Meta-分析本身的统计方法研究与其应用研究相比就少了很多。从广泛应用的意义上来讲,Meta-分析是以估计量的标准误差为权重的点估计加权平均。随机效应模型的Meta-分析在各个研究效应量不相等这一假设,具体是以估计量方差及研究间差异方差和的逆作为权重得到的加权平均效应量,并可扩展为合并研究间协变量估计 [4] 。
随着数据科学的快速发展,数据维度和数据量急速增加导致单变量Meta-分析无法满足现实应用的需求。多变量Meta-分析有许多优点:第一,可以在一个模型框架下得到所有效应量的估计量;第二,可以通过所有效应量的估计量的协方差矩阵描述多效应量之间的关系。第三,可以获得具有更好统计特性的参数估计量;第四,我们可以获得区别于单变量Meta-分析的潜在机理原因;第五,多变量分析的方法可以在一定程度上降低纳入文献的偏倚性。
由于多变量Meta-分析与单变量Meta-分析比较起来有很多的优点,因此多变量Meta-分析在各个领域的应用研究是很多的。然而,对于多变量Meta-分析本身统计方法的研究却很少。1988年,为了研究教练在SAT中的作用,Raudenbush SW等人通过广义最小二乘法建立了多效应量合并的模型 [5] ;1993年,van Houwelingen HC等人在文献 [6] 首次给出了基于比值比的二变量Meta-分析模型,并讨论了该模型的异质性检验和敏感性分析;1996年,Kalaian HA等人为了研究教练在SAT语言和数学方面的指导效果,在文献 [7] 建立了基于比值比的各研究内效应量不同情形下的多元Meta-分析模型,并通过REML方法估计了效应量的协方差矩阵;2002年,van Houw -elingen HC等人在广义多元混合线性模型的框架下,通过似然估计方法给出了多元Meta-回归模型,并将此模型扩展到了非正态分布情形 [8] 。2008年,Riley RD等人在文献 [9] 中通过极大似然估计法给出了一些特殊相关系数情形下的二变量Meta-分析的协方差矩阵估计;2008年,Ritz J等人在文献 [10] 中通过极大似然估计和估计方程给出了协方差矩阵已知情形下的多元效应量回归参数,并将此模型应用到肺癌发病率的临床推断中。2010年,Paul M等人在文献 [11] 中通过基于可积嵌套拉普拉斯近似的贝叶斯方法给出了多元Meta-分析的合并效应量估计,这种方法得到的方差估计偏移量更小且稳定。
本文通过极大似然估计法给出已知协方差矩阵的基于均差估值的二变量Meta-分析随机效应模型,并通过极大似然估计法给出效应量估计。通过计算估计效应量的协方差矩阵,给出效应分量的
置信区间。
2. 问题描述
在协方差矩阵的基于均差估值的二变量Meta-分析随机效应模型中,我们假设个体量
,
,
和
是独立的并且是正态分布,其均值分别为
,
,
和
,每个研究内的方差分别为
,
。因此
,
,
和
是独立的且服从正态分布,其均值分别为
,
,
和
,方差分别为
,
,
,
。
由上述假设,均差效应量
的分布可表示为:
其中
,
为均值,
,
及
是非随机的。一般地,
,
为未知参数。本文主要内容是通过极大似然估计法来估计
,
。为了方便讨论,记
为研究内均值效应量的协方差矩阵;
为描述研究间关系的协方差矩阵。
3. 均值效应量的极大似然估计
根据之前的假设效应量
服从正态分布,因此关于
的似然函数为:
其中
,
。其所对应的对数似然函数为:
定理3.1:设效应量
服从
的正态分布,则
的极大似然估计量的分量为:
证明:因为关于
的似然函数为:
其所对应的对数似然函数为:
上述对数似然函数对
,
的偏导数为:
令
即得:
整理可得:
因为
可逆,且
为:
其中
,
因此上述关于
,
的线性方程组的解为:
注:由
为:
,
其中
,
可以给出效应量
服从正态分布的合并效应量的矩阵形式为:
。
由上述效应量
服从正态分布的合并效应量均值估计量分量的具体形式,我们可以得到合并效应量均值估计量的如下性质:
性质2.1:设效应量设效应量
服从
的正态分布,其极大似然估计量为:
,则
对于
是无偏的。
证明:要证明估计量的无偏性,需证等式
成立。根据我们给出的效应量
服从正态分布的合并效应量均值估计量分量的具体形式,我们需要证明
,
。因为
,
,所以
综上所述,
对于
是无偏的。
4. 均值效应量极大似然估计量的协方差矩阵
假设所有的研究都提供所有的均值效应。由多变量统计学的大数定理,合并效应量均值估计量可以近似为一个多元正态分布,其对应的协方差矩阵可由下面的定理给出:
定理4.1:设效应量设效应量
服从
的正态分布,其极大似然估计量为:
,则
所对应的协方差矩阵
为:
,
,
,
。
其中
表示矩阵
第i行第j列的分量,
。
证明:根据多元随机变量的知识可知:如果随机变量
,则
,其中T表示矩阵的转置。由
且
,通过计算可得:
,
。则
因为
,
其中
,可得
所对应的协方差矩阵为:
,
,
,
。
其中
。
通过所对应的协方差矩阵可以给出单变量和联合变量的置信区域,其具体形式为:
性质3.1:设效应量设效应量服从的正态分布,其极大似然估计量为:,则合并均值效应量所对应各个分量的置信区间为:
和,其中表示正态分布的分位数, 表示矩阵第i行第j列的分量。
5. 结束语
本文给出已知协方差矩阵的基于均差估值的二变量Meta-分析随机效应模型,并通过极大似然估计法给出效应量估计。通过计算估计效应量的协方差矩阵,给出效应分量的置信区间。这些结论对临床医学,特别是流行病学会有较好的统计学和现实意义。
基金项目
本项目由如下基金支持:国家自然科学基金(61871475, 61471133, 61571444, 61473331),广东省科技计划(2017B010126001,2017A070712019, 2016A040402043, 2015A070709015, 2015A020209171, 2016B010125004, 2014B040404070,2015A040405014, 2016A070712020),广东省教育厅科技计划(2017GCZX001, 2016KQNCX075, 2016GCZX001, 2017KTSCX094, 2017KTSCX095, 2017KQNCX098),广州市科技计划(201707010221)。
NOTES
*通讯作者。