1. 引言
缺血性卒中是全球范围内导致死亡和长期致残的主要疾病类型,其病因复杂且高度异质[1]。根据TOAST分型,缺血性卒中可分为大动脉粥样硬化型(Large-Artery Atherosclerotic Stroke, LAA)、心源性栓塞型、腔隙性脑梗死及其他类型,其中LAA占所有缺血性卒中的一大比例[2],并与血管内皮功能异常、炎症反应及代谢紊乱密切相关[3] [4]。深入了解LAA的潜在因果风险因素对于疾病早期识别、精准预防及干预策略的制定具有重要意义。
近年来,多种代谢及肾功能相关生物标志物被报道与LAA的发病风险相关。载脂蛋白A (ApoA)作为高密度脂蛋白的主要组成成分,参与胆固醇逆转运及抗炎作用,可能对动脉粥样硬化斑块稳定性发挥保护作用[5]。谷氨酰转肽酶(GGT)参与谷胱甘肽代谢及氧化应激反应,其水平升高可能促进血管内皮损伤与动脉粥样硬化进展[6]。胱抑素C (Cystatin C)作为肾功能及炎症状态的重要指标,近年来也被提示与脑血管事件发生相关[7] [8]。然而,这些关联性研究大多存在混杂因素干扰,难以明确因果关系,且很少研究与卒中亚型之间的因果关系。
孟德尔随机化(Mendelian Randomization, MR)是一种基于遗传流行病学的方法,利用与暴露因素相关的遗传变异作为工具变量,在一定程度上避免混杂因素和反向因果的影响,从而用于推断暴露与疾病结局之间的潜在因果关联[9]。近年来,MR 方法已广泛应用于脑卒中及其危险因素的因果研究,两样本MR通过独立的GWAS数据进行分析,进一步提高了研究效率和统计效能,为疾病机制探索和干预靶点筛选提供了重要循证依据,已被广泛应用于脑血管疾病及代谢相关研究中。
基于上述背景,本研究旨在利用两样本MR方法系统评估ApoA、GGT及胱抑素C与LAA的因果关系,以期从遗传学角度揭示ApoA、GGT及胱抑素C在LAA发病中的潜在作用,为疾病防控和机制研究提供新的证据。
2. 方法
2.1. 研究设计
本研究基于公开可获得的全基因组关联研究(Genome-Wide Association Study, GWAS)汇总统计数据,开展两样本孟德尔随机化(Two-Sample Mendelian Randomization, MR)分析。本研究选择LAA作为结局进行MR分析。选择胱抑素C、载脂蛋白A、谷氨酰转肽酶作为MR暴露变量。
所有GWAS数据均为公开汇总统计数据,不涉及个体识别信息,因此无需额外伦理审批或知情同意。
2.2. 数据来源
本研究基于两样本孟德尔随机化(MR)分析,系统评估胱抑素C、载脂蛋白A、谷氨酰转肽酶(GGT)与LAA之间的潜在因果关系。暴露变量的遗传工具来源于公开可获取的全基因组关联研究(GWAS)汇总统计数据,具体包括:胱抑素C [全基因组关联研究识别码(Genome-Wide Association Study ID): ukb-d-30720_irnt];载脂蛋白A [全基因组关联研究识别码(Genome-Wide Association Study ID): ukb-d-30630_irnt];谷氨酰转肽酶[全基因组关联研究识别码(Genome-Wide Association Study ID): ukb-d-30730_irnt]。上述GWAS研究对象均依据国际疾病分类(International Classification of Diseases, ICD)标准进行表型定义。为进一步评估载脂蛋白A是否具有独立于血脂水平的保护作用,我们在选择高密度脂蛋白胆固醇(Genome-Wide Association Study ID: ieu-a-299)和低密度脂蛋白胆固醇(Genome-Wide Association Study ID: ieu-a-300)一起纳入模型作为协变量进行多变量孟德尔随机化(MVMR)分析。结局变量LAA的汇总统计数据来源于一项GWAS荟萃分析(GWAS ID: ebi-a-GCST006907),研究对象为欧洲人群,共纳入4373例病例,分析了8,418,349个单核苷酸多态性(Single Nucleotide Polymorphisms, SNPs)。相关研究表明,本研究所选暴露与结局GWAS数据来源于相互独立的欧洲人群样本,从而降低了样本重叠对MR结果可能造成的偏倚。
2.3. 工具变量的筛选
MR分析基于三个基本假设:① 遗传变异必须与暴露因素有强烈的关联;②遗传变异必须独立于混杂因素;③ 遗传变异不应受到结果因素的影响[10]。本研究首先设定全基因组显著性阈值为P < 5 × 10−8,以筛选与各暴露因素显著相关的SNP作为候选工具变量。为确保工具变量的独立性,进一步进行连锁不平衡(Linkage Disequilibrium, LD)剔除,设定阈值为r2 < 0.001并要求物理距离超过10,000 KB,确保所选SNPs之间不发生LD [11]。此外,我们为每一个工具变量(IV)计算了F统计量,以评估弱工具偏倚的可能性。F值通过方程F = (Beta/Se)2计算得出,其中Beta表示等位基因的效应大小,Se是Beta的估计标准误差。只有F值 > 10的IVs被保留用于进一步分析,从而最小化因弱工具带来的偏倚风险[12]。最后,为进一步确保我们分析的稳健性,所有选定的SNPs都使用Phenoscanner数据库(http://www.phenoscanner.medschl.cam.ac.uk/)进行了核查,排除可能与混杂表型相关的SNPs,确保本研究的有效性和可靠性[13]。
2.4. MR分析
本研究采用逆方差加权(Inversevariance Weighted, IVW)方法作为估计因果效应的主要方法。为了确保研究发现的稳健性,进行了补充分析,简单中位数法(Simple Median, SM)、加权模式法(Weighted Mode, WM)、加权中位数法(Weighted Median, WME)及MR-Egger回归(MR-Egger Regression)。此外,我们执行了一系列敏感性分析来进一步验证结果。为了检测可能偏倚MR结果的水平多效性,进行了MR-Egger截距检验。此外,还使用了MR-PRESSO离群值检测方法来识别并纠正SNPs中的离群值,从而解决任何潜在的水平多效性。应用Cochran Q检验来评估异质性,这可能影响因果估计。如果P > 0.05,表明异质性对因果关系的影响可以忽略。为进一步评估载脂蛋白A是否具有独立于血脂水平的保护作用,我们进行了多变量孟德尔随机化(MVMR)分析,将载脂蛋白A与高密度脂蛋白胆固醇(Genome-Wide Association Study ID: ieu-a-299)和低密度脂蛋白胆固醇(Genome-Wide Association Study ID: ieu-a-300)一起纳入模型作为协变量。通过选取与ApoA显著相关的SNP,并在三个暴露中提取同一批SNP的效应,再与LAAGWAS数据进行Harmonisation,实现MVMR分析,主分析采用多变量IVW方法,同时进行了MR-Egger敏感性分析,以检验潜在的多效性和稳健性。统计分析是在R软件(版本4.3.2)中进行的,使用“TwoSampleMR”和“MRPRESSO”包进行MR分析,并使用“forest plot”包进行可视化。P < 0.05为差异有统计学意义。
3. 结果
3.1. 工具变量
胱抑素C纳入284个独立SNP用于MR分析,载脂蛋白A纳入225个独立SNP用于MR分析,谷氨酰转肽酶纳入258个独立SNP用于MR分析,所有工具变量的F统计量均大于10,未发现明显弱工具偏倚。
3.2. MR分析
如表1所示,本研究采用多种MR方法评估暴露与LAA的因果关系。孟德尔随机化分析结果以效应估计值β、标准误(SE)及P值表示。其中,β反映遗传预测的暴露水平变化对结局发生风险的因果效应大小及方向;当结局为二分类变量时,β为对数比值比(log OR),并通过指数转换得到OR,用于直观反映暴露与结局风险之间的关联强度。SE用于衡量效应估计的精确性,SE越小表示估计越稳定。P值用于检验因果效应是否显著偏离零,P < 0.05被认为具有统计学意义。IVW分析结果显示,载脂蛋白A水平升高与LAA风险显著负相关(OR为0.838,95%CI 0.736~0.954,P = 0.0076)。Simple median方法亦显示类似显著负向效应(β = −0.23, P = 0.048),而Weighted median、Weighted mode及MR-Egger方法均呈负向趋势。整体结果提示载脂蛋白A水平升高对LAA具有保护作用。
Table 1. MR analysis results
表1. MR分析结果汇总表
暴露因素 |
方法 |
SNP数 |
β |
SE |
P值 |
胱抑素C |
IVW |
284 |
0.135 |
0.061 |
0.028 |
Simple median |
284 |
0.202 |
0.119 |
0.090 |
MR-Egger |
284 |
0.055 |
0.085 |
0.519 |
Weighted median |
284 |
0.073 |
0.079 |
0.353 |
Weighted mode |
284 |
0.077 |
0.073 |
0.296 |
载脂蛋白A |
IVW |
225 |
−0.177 |
0.066 |
0.0076 |
Simple median |
225 |
−0.23 |
0.116 |
0.048 |
MR-Egger |
225 |
−0.027 |
0.1 |
0.785 |
Weighted median |
225 |
−0.051 |
0.109 |
0.638 |
Weighted mode |
225 |
−0.056 |
0.097 |
0.564 |
GGT |
IVW |
258 |
0.209 |
0.062 |
0.0007 |
Simple median |
258 |
0.125 |
0.107 |
0.242 |
MR-Egger |
258 |
0.301 |
0.101 |
0.0031 |
Weighted median |
258 |
0.256 |
0.107 |
0.0166 |
Weighted mode |
258 |
0.219 |
0.091 |
0.0165 |
谷氨酰转肽酶水平与LAA的因果关系IVW分析显示,谷氨酰转肽酶水平升高显著增加LAA风险(OR为1.233,95%CI 1.092~1.393,P = 0.0007)。Weighted median、Weighted mode和MR-Egger方法均显示正向效应,Simple median方法虽未达到显著性(P = 0.242),但总体趋势一致,提示谷氨酰转肽酶升高为LAA的危险因素。
胱抑素C水平与LAA的因果关系IVW分析显示胱抑素C升高显著增加LAA风险(OR为1.145,95%CI 1.015~1.291,P = 0.028)。Simple median、Weighted median、Weighted mode及MR-Egger未显著,但方向一致。提示胱抑素C升高可能增加LAA风险。
如散点图1(A)~(C)所示,胱抑素C、谷氨酰转肽酶与LAA成正相关,载脂蛋白A与LAA风险显著负相关。
(A) (B)
(C)
Figure 1. Scatter plots showing the associations of cystatin C, ApoA, and GGT with LAA. (A) Scatter plot of the association between Cystatin C and LAA; (B) Scatter plot of the association between ApoA and LAA; (C) Scatter plot of the association between GGT and LAA
图1. 胱抑素C、ApoA、GGT与LAA关系的散点图。(A) 胱抑素C与LAA关系的散点图;(B) ApoA与LAA关系的散点图;(C) GGT与LAA关系的散点图
3.3. 可靠性评价
3.3.1. 多效性检验、敏感性分析
为评估因果推断结果的稳健性及潜在的方向性水平多效性,本研究进一步进行了MR-Egger回归及MR-PRESSO分析。MR-Egger截距用于检验遗传工具变量是否存在方向性水平多效性,截距接近于0且与0比较无统计学差异(P > 0.05)提示不存在明显方向性多效性。MR-PRESSO全局检验(Global Test)用于检测是否存在异常SNP,若P值<0.05提示性存在异常SNP。MR-PRESSO的Distortion Test P用于检验剔除异常SNP后因果效应是否显著变化。P值不显著(P > 0.05)表明因果效应稳健,不受异常SNP影响。
结果如表2显示,载脂蛋白A、谷氨酰转肽酶(GGT)及胱抑素C的MR-Egger截距均接近于0,且与0比较差异无统计学意义(均P > 0.05),提示未发现明显的方向性水平多效性。MR-PRESSO全局检验结果显示,载脂蛋白A、胱抑素C存在异常信号(Global Test P < 0.05),而谷氨酰转肽酶未检测到异常SNP。尽管在载脂蛋白A、胱抑素C的分析中检测到异常SNP,但进一步的异常SNP校正分析显示,剔除异常SNP后因果效应Distortion Test P无统计学差异(P > 0.05),且校正结果与原始IVW分析方向一致,提示异常SNP对总体因果推断影响有限,研究结果具有较好的稳健性。各组MR漏斗图显示因果关联效应的散点基本呈对称分布,结果不存在潜在偏倚,见图2(A)~(C)。
3.3.2. 异质性分析
异质性采用Cochran Q检验进行评估,Q检验用于判断不同SNP的效应估计是否存在差异。Q检验P < 0.05表明存在异质性,P > 0.05表明SNP间效应一致性良好。结果如表2所示。
载脂蛋白A(ApoA)存在一定异质性(IVW Q P = 0.0066; MR-Egger Q P = 0.00997),Distortion Test P通常用于判断异常SNP是否实质性改变因果估计有无统计学效应。载脂蛋白A的Distortion Test P值为0.993,说明异常SNP对于因果关系估计无统计学效应,且IVW结果显著,载脂蛋白A水平升高与大动脉粥样硬化型缺血性卒中风险降低存在稳健的因果关联证据。
Table 2. Reliability tests of MR analysis for the causal associations of cystatin C, ApoA, and GGT with LAA
表2. 胱抑素C、ApoA、GGT与LAA因果关联MR分析的可靠性检验
暴露 |
IVW Q P值 |
MR-Egger Q P值 |
MR-Egger截距 |
MR-PRESSO Global Test P |
Distortion Test P |
胱抑素C |
0.008 |
0.009 |
0.00365 |
P = 0.011 |
0.445 |
载脂蛋白A |
0.0066 |
0.00997 |
−0.00685 |
P = 0.003 |
0.993 |
GGT |
0.061 |
0.064 |
−0.0038 |
P = 0.07 |
- |
(A) (B)
(C)
Figure 2. Funnel plots of MR analysis showing causal associations of Cystatin C, ApoA, and GGT with LAA. (A) Funnel plot of the association between cystatin C and LAA; (B) Funnel plot of the association between ApoA and LAA; (C) Funnel plot of the association between GGT and LAA
图2. 胱抑素C、ApoA、GGT与LAA因果关联MR分析漏斗图。(A) 胱抑素C与LAA关系的漏斗图;(B) ApoA与LAA关系的漏斗图;(C) GGT与LAA关系的漏斗图
胱抑素C存在轻度异质性(IVW Q P = 0.008; MR-Egger Q P = 0.009)。MR-PRESSO识别3个异常SNP,Distortion Test P = 0.445,剔除异常值对效应影响不显著。原始IVW估计稳健(β = 0.135, P = 0.028),提示胱抑素C升高与LAA风险增加存在因果关联。
谷氨酰转肽酶异质性检验均不显著(IVW Q P = 0.061; MR-Egger Q P = 0.064),未识别到异常SNP,原始IVW估计稳健(β = 0.209, P = 0.0007),进一步支持其与LAA风险的正向因果关系。
胱抑素C、载脂蛋白 A、谷氨酰转肽酶与LAA的leave-one-out(留一法)检验结果显示依次剔除单个SNP后,剩余的SNP的IVW分析结果与纳入全部SNPs的分析结果相近,以上MR分析均未发现对因果关联估计值影响较大的SNP。进一步确保了结果的稳定性,见图3(A)~(C)。
3.3.3. 多变量MR分析
MVMR分析结果显示,在控制HDL-C和LDL-C后,ApoA对LAA的因果效应不显著(β = −0.063, SE = 0.164, P = 0.702),而LDL-C与LAA风险呈显著正相关(β = 0.202, SE = 0.098, P = 0.040),HDL-C与LAA不显著(β = −0.162, SE = 0.169, P = 0.337)。这一结果表明ApoA的单变量保护效应可能在一定程度上通过血脂水平(尤其是LDL-C)发挥作用,其独立效应较弱。
4. 讨论
孟德尔随机化(Mendelian Randomization, MR)可以利用遗传变异作为工具变量来探索暴露因素与疾病结局之间因果关系[14],该方法基于遗传变异在受精时的随机分布规律,可在一定程度上克服混杂因素和反向因果的影响,为评估暴露与结局之间的潜在因果关系提供更为稳健的证据。
本研究应用双样本孟德尔随机化分析进一步探讨了胱抑素C、谷氨酰转肽酶水平、载脂蛋白A与LAA之间的潜在因果关系。在单变量分析中,IVW分析发现胱抑素C、谷氨酰转肽酶水平升高与LAA风险显
(A) (B)
(C)
Figure 3. Leave-one-out analyses of MR analysis for causal associations of cystatin C, ApoA, and GGT with LAA. (A) Leave-one-out analysis of the association between cystatin C and LAA; (B) Leave-one-out analysis of the association between ApoA and LAA; (C) Leave-one-out analysis of the association between GGT and LAA
图3. 胱抑素C、ApoA、GGT与LAA因果关联MR分析留一法分析。(A) 胱抑素C与LAA关系留一法分析;(B) ApoA与LAA关系的留一法分析;(C) GGT与LAA关系的留一法分析
著正相关;而载脂蛋白A与LAA风险呈负向因果关系,提示其可能具有保护作用。3个特征的MR-Egger截距与0比较无统计学差异,提示未发现明显方向性水平多效性;异质性分析显示,载脂蛋白A、胱抑素C在IVW与MR-Egger模型中存在一定程度的异质性,而谷氨酰转肽酶未检测到显著异质性。针对存在异质性的暴露因素,MR-PRESSO分析进一步识别并校正了潜在的异常SNP。结果显示,在剔除异常SNP后,各暴露因素的IVW效应估计值与原始结果在效应方向和效应大小上基本一致,且Distortion Test P均未达到统计学显著性,提示异常SNP对总体因果效应估计的影响有限,研究结果整体稳健。但在多变量分析控制HDL-C和LDL-C后ApoA与LAA因果关系不显著,提示ApoA的保护作用可能部分通过调节血脂水平实现,而非完全独立于血脂作用。这与ApoA参与HDL生成和胆固醇逆转运的生物学机制一致,强调ApoA对LAA风险的影响可能主要是血脂介导的间接效应,而独立效应较弱。
本研究结果与既往多项观察性研究及部分MR研究结果总体一致。既往相关MR研究证实胱抑素C与总卒中风险呈正相关[15],虽另一研究不支持胱抑素C在心血管疾病病因学中起因果作用[16],但既往未有研究分析卒中亚型LAA与胱抑素C的因果关系,本研究创新性分析了胱抑素C与卒中亚型LAA之间的因果关系结果提示胱抑素C与LAA风险显著正相关,与既往研究结果相似。既往研究发现谷氨酰转肽酶卒中存在关联[17],Gurbuzer等人进行了急性缺血性卒中患者GGT水平升高的观察性病例对照研究,该研究发现在急性缺血性卒中患者的血清GGT水平显著高于对照组[18]。我们在这些研究的基础上应用不同GWAS数据与LAA进行MR分析,结果与既往研究结果一致。既往研究提示载脂蛋白A水平降低与任何缺血性卒中、大动脉性卒中和小血管性卒中风险增加显著相关与本研究结果一致[5],Yanwei Guo也同时应用MR的方法发现载脂蛋白A与缺血性卒中呈显著负相关[19],本研究基于不同GWAS数据,进一步在卒中亚型LAA层面验证了载脂蛋白A与LAA风险之间的负向因果关联,其效应方向与既往研究一致,提示该关联具有一定稳健性。
载脂蛋白A是高密度脂蛋白的主要蛋白组分[20],在动脉粥样硬化防御中起关键作用。本研究的孟德尔随机化分析显示,遗传预测的载脂蛋白A水平升高在单变量分析中与LAA风险降低相关;然而,在进一步纳入高密度脂蛋白胆固醇和低密度脂蛋白胆固醇进行多变量MR调整后,该关联不再具有统计学显著性。该结果提示,载脂蛋白A对LAA的潜在保护作用可能主要通过血脂代谢相关通路间接介导,而非完全独立于传统血脂水平之外发挥直接因果效应。机制上,载脂蛋白A可能通过多条途径发挥抗动脉粥样硬化和卒中保护效应,包括促进胆固醇逆转运、抑制炎症反应以及改善血管内皮功能等[5]。这些生物学功能有助于减少脂质在动脉壁内沉积、稳定动脉粥样硬化斑块并降低血栓形成风险,从而降低缺血性卒中的发生概率。谷氨酰转肽酶作为合成谷胱甘肽所需氨基酸的必要酶,参与机体氧化应激反应,其水平升高可能标志机体炎症水平升高[6],可能通过促进自由基生成和脂质过氧化反应,加速血管壁损伤和内皮功能障碍,并促进动脉粥样硬化斑块形成与进展,从而增加缺血性卒中风险。胱抑素C是肾功能评价指标,其水平升高往往反映肾小球滤过率下降及潜在的慢性低度炎症状态[21] [22],肾功能减退与全身炎症反应均可通过多种机制促进动脉粥样硬化的发展,包括加重血管壁结构重塑、诱导内皮功能障碍及降低斑块稳定性[7] [8]。综上,本研究在卒中亚型LAA层面应用孟德尔随机化方法,从遗传因果角度验证了载脂蛋白A、谷氨酰转肽酶及胱抑素C与缺血性卒中风险之间的潜在机制联系,为相关生物标志物的精准风险分层提供了新的遗传学依据。
传统流行病学研究中,血浆生物标志物如ApoA、GGT或胱抑素C与LAA的关联,常受混杂因素(如年龄、性别、生活方式、合并慢性疾病)影响,同时存在反向因果的可能。MR利用遗传变异作为工具变量,通过自然随机分配的等位基因模拟“随机对照”,在方法学上显著减少混杂偏倚和反向因果问题,从而更可靠地评估因果关系。本研究基于全基因组关联研究(GWAS)数据,选取与暴露因素显著相关且独立的SNP作为工具变量,为代谢与肾功能相关生物标志物与LAA的关系提供遗传学层面的因果推断。这不仅强化了观察性关联的生物学合理性,也为潜在干预靶点的优先级排序提供了依据。通过将暴露和结局GWAS来源于独立样本,避免了样本重叠对效应估计的偏倚,同时通过多种MR方法(IVW、加权中位数、加权模式、MR-Egger)和敏感性分析(MR-PRESSO, leave-one-out)系统验证结果的稳健性。这种设计使因果推断更精确、可信。
MR结果揭示了ApoA、GGT、胱抑素C与LAA的相互关系。这不仅丰富了卒中病因学理解,还可为个体化预防和早期干预策略提供科学依据。在临床实践中,可通过血浆GGT、胱抑素C和ApoA水平作为辅助指标,对高危人群进行早期风险评估,从而优化卒中预防策略进而降低卒中的发病率。基于遗传因果证据,可以将代谢和肾功能相关生物标志物纳入多指标风险预测模型,从而为不同人群制定个体化干预方案,提高预防和治疗的精准度。未来可结合转录组、蛋白组及代谢组数据,进一步探究ApoA、GGT及胱抑素C在动脉粥样硬化及脑血管事件发生中的分子机制。尽管本研究提供了因果推断证据,但仍需前瞻性队列研究或随机对照试验验证ApoA升高或GGT、胱抑素C降低对LAA发生的实际干预效果。本研究基于欧洲人群数据,未来可在不同种族和地区人群中进行验证,并探索其在心源性栓塞性、腔隙性脑梗死等其他卒中亚型的适用性,以完善卒中防控策略的普适性。
本研究还存在以下不足:① 部分暴露变量可用的工具SNP数量有限,可能在一定程度上影响统计功效。② 所使用的GWAS数据主要来源于欧洲人群,研究结论在其他种族人群中的适用性仍需进一步验证。
5. 结论
遗传预测的胱抑素C、谷氨酰转肽酶水平升高可能在大动脉粥样硬化性缺血性卒中(LAA)的发生中具有潜在的因果作用,而载脂蛋白A则可能具有保护效应。这些结果提示,通过改善代谢状态及优化脂质代谢,可能有助于降低LAA及相关动脉粥样硬化性卒中的发生风险。
声 明
所有GWAS数据均为公开汇总统计数据,不涉及个体识别信息,因此无需额外伦理审批或知情同意。
NOTES
*通讯作者。