摘要: 目的:利用综合生物信息学分析鉴定致心律失常性右室心肌病(ARVC)相关的核心基因并探讨其潜在机制,以期为ARVC患者的靶向治疗提供重要依据。方法:利用R语言鉴定出数据集GSE29819差异表达基因(DEGs)。采用加权基因相关网络分析(WGCNA)构建共表达网络,识别与ARVC相关的重要相互作用基因,与DEGs取交集,得到ARVC相关核心基因。对核心基因进行免疫浸润分析、功能富集分析和蛋白质互作网络分析识别中枢基因,并探索中枢基因的诊断价值。结果:差异分析共识别出329个DEGs,WGCNA共识别出18个共表达模块,其中绿松石模块(5597个基因,r = −0.95,P = 2e−12)与ARVC相关性最强,表明该模块中的基因可能与疾病状态相关。DEGs和绿松石模块基因取交集共得到254个核心基因。免疫浸润分析显示核心基因在促进ARVC的发生发展中与单核细胞、M1型巨噬细胞、休眠树突状细胞密切相关(P < 0.05)。功能富集分析提示这些核心基因的生物学过程主要集中在趋化性、白细胞迁移、细胞因子活性、肿瘤坏死因子信号通路、脂代谢和粥样硬化、核因子
κB信号通路和趋化因子信号通路。蛋白质互作网络分析共识别出9个枢纽基因(IL6、PTGS2、CCR1、CXCL1、IL1B、CCL11、CCL2、CXCR4、CCL19),均有一定诊断潜力,其中CCR1、CCL19和PTGS2基因表现出强大的诊断能力(AUC = 1),对于区分ARVC患者与健康人群具有最佳诊断价值。结论:本研究通过综合生物信息学分析筛选出ARVC相关核心基因,揭示其与免疫浸润及多条信号通路的关联。这些核心基因有望作为ARVC诊断与预后评估的新型生物标志物及潜在治疗靶点。
Abstract: Objective: This study aims to identify core genes associated with arrhythmogenic right ventricular cardiomyopathy (ARVC) and investigate their underlying mechanisms using comprehensive bioinformatics approaches, thereby providing a crucial basis for targeted therapy in ARVC patients. Methods: Differentially expressed genes (DEGs) were identified from the dataset GSE29819 using R software. A weighted gene co-expression network analysis (WGCNA) was employed to construct co-expression networks and identify key genes interacting with ARVC. The intersection of DEGs and key module genes yielded ARVC-associated core genes. Subsequently, immune infiltration analysis, functional enrichment analysis, and protein-protein interaction (PPI) network analysis were conducted on these core genes to pinpoint hub genes and explore their diagnostic value. Results: Differential expression analysis identified 329 DEGs. WGCNA revealed 18 co-expression modules, among which the turquoise module (comprising 5597 genes, r = −0.95, P = 2e−12) demonstrated the strongest correlation with ARVC, indicating its potential relevance to the disease state. The intersection of DEGs and turquoise module genes resulted in 254 core genes. Immune infiltration analysis demonstrated that these core genes were significantly associated with monocytes, M1 macrophages, and resting dendritic cells in promoting ARVC pathogenesis (P < 0.05). Functional enrichment analysis revealed that the biological processes of these core genes were primarily concentrated in chemotaxis, leukocyte migration, cytokine activity, TNF signaling pathway, lipid and atherosclerosis metabolism, NF-kappa B signaling pathway, and chemokine signaling pathway. PPI network analysis identified 9 hub genes (IL6, PTGS2, CCR1, CXCL1, IL1B, CCL11, CCL2, CXCR4, CCL19), all exhibiting diagnostic potential. Notably, CCR1, CCL19, and PTGS2 demonstrated powerful diagnostic capability (AUC = 1), indicating optimal value for distinguishing ARVC patients from healthy controls. Conclusion: This study, through integrated bioinformatics analysis, screened out ARVC-related core genes and revealed their associations with immune infiltration and multiple signaling pathways. These core genes, particularly the highlighted hub genes, show promise as novel biomarkers for ARVC diagnosis and prognosis assessment, as well as potential therapeutic targets.
1. 引言
心肌病是一类患病率高、病因复杂、临床表现多样、预后较差且与遗传密切相关的疾病,已成为精准医学理念下心血管疾病防治的重要领域。近年来,影像学与分子遗传学技术的进步推动心肌病诊疗进入“复兴时代”。根据最近出版的《中国心肌病综合管理指南(2025)》,心肌病可分为心室心肌病与心房心肌病,前者包括肥厚型心肌病(hypertrophic cardiomyopathy, HCM)、扩张型心肌病(dilated cardiomyopathy, DCM)、限制型心肌病、致心律失常性心肌病(arrhythmogenic cardiomyopathy, ACM)、代谢性心肌病等九类[1]。其中ACM是一类以心室心肌被纤维脂肪组织进行性替代为病理特征的遗传性心肌病,其分型包括致心律失常性右心室心肌病(arrhythmogenic right ventricular cardiomyopathy, ARVC)、致心律失常性左心室心肌病和致心律失常性双室心肌病,以ARVC最为常见。
ARVC是一种遗传性心肌疾病,其病理特征是心肌组织进行性被纤维脂肪组织替代,临床表现为室性心律失常、右心室扩张和心功能不全,常于青少年期起病,表型变异大且外显不全,是青少年心源性猝死(sudden cardiac death, SCD)的病因之一[2]。据报道,ARVC患病率约为1/5000~1/2000,男性患者居多[3]。在尸检确诊的SCD病例中,ARVC约占4%,在无冠状动脉疾病或结构性心脏病的“不明原因”心脏骤停中ARVC占比10% [4]。ARVC的病因与发病机制尚未完全阐明,现有研究表明其与桥粒基因突变密切相关[5]。ARVC的诊断依赖于临床表现(如症状、心电图、影像学检查)和基因检测。但仍需进一步发掘新型生物标志物及潜在基因诊断靶点。
近年来,生物信息学技术迅速发展,其在疾病分子机制探索及生物标志物挖掘中展现出重要价值。生物信息研究已被证明对包含ARVC在内的许多多基因遗传代谢疾病有效。因此,综合生物信息学分析可能有助于探讨ARVC的致病基因和潜在机制。然而,传统的生物信息学分析方法有时会忽视基因之间的相互作用以及基因与临床特征的关联,导致结果特异性不足。加权基因相关网络分析(weighted gene correlation network analysis, WGCNA)是一种分析多个样本的基因表达模式的方法,它将基因聚类成具有相似表达模式的模块,并分析模块与表型(如患者的临床特征、诊断)间的关联。WGCNA提供了对相关网络的系统洞察,并已成为探索众多基因之间隐藏联系的可靠且有效的工具[6]。
早期诊断与干预对改善ARVC预后至关重要,对ARVC相关的信号传递的遗传方面和机制的更深入的掌握有助于通过采用靶向分子的治疗来逆转其病理进展。本研究基于基因表达综合库(gene expression omnibus, GEO)中ARVC的测序数据,综合运用差异表达分析、WGCNA、免疫浸润分析、功能富集分析及蛋白质–蛋白质相互作用(protein-protein interaction, PPI)网络构建等方法,筛选ARVC相关核心基因并探讨其潜在机制,以期能为针对某一途径以预防或逆转心肌病和心律失常的靶向治疗创造机会,寻求ARVC治疗新思路,以提升ARVC患者的预后水平。
2. 材料与方法
2.1. 数据收集与处理
从GEO数据库(http://www.ncbi.nlm.gov/geo/)下载ARVC数据集GSE29819 [7]。GSE29819的微阵列数据基于GPL570平台(Affymetrix Human Genome U133 Plus 2.0 Array)。该数据集以心室肌组织为研究组织,其中6例ARVC患者的左、右心室组织作为ARVC组(GSM738990-GSM739001),6例正常人心脏的左、右心室组织作对照组(GSM739016-GSM739027),共24份样本。使用R统计软件(R-4.5.1)对数据集进行标准化处理。
2.2. 差异表达基因(Differentially Expressed Genes, DEGs)的筛选
为了鉴定ARVC和正常心肌之间的DEGs,采用R包“limma”(v3.64.3)对基因表达矩阵进行了差异分析。筛选标准为|logFC| > 1且校正P值<0.05。使用R包“ggplot2”(v4.0.0)和“pheatmap”(v1.0.13)绘制DEGs的火山图和热图。
2.3. WGCNA的构建与关键模块识别
R包“WGCNA”(v1.73)构建基因共表达网络并识别与ARVC高度相关的模块。通过聚类树检测样本离群值,基于网络拓扑分析选择软阈值功率,计算邻接矩阵并转换为拓扑重叠矩阵。本研究中软阈值设置为4,相关系数阈值设置为0.88来构建无标度网络。通过动态剪枝法识别并合并表达模式相似的模块,最小模块基因数设置为50,模块合并切割高度设置为0.6,深度拆分设置为2。选取与临床特征最相关模块中的基因进行后续分析,结合基因显著性(gene significance, GS)与模块成员度(module membership, MM)评估关键基因(GS设置为≥0.5,MM设置为≥0.8)。使用R包“ggVennDiagram”(v1.5.4)可视化DEGs与关键模块基因的交集作为核心基因。
2.4. 免疫浸润分析
DEGs和关键模块的基因取交集得到重叠的核心基因,为了研究ARVC和核心基因的免疫微环境,采用CIBERSORTx在线工具(https://cibersortx.stanford.edu/)分析ARVC组与对照组心脏组织中免疫细胞浸润差异,并计算22种免疫细胞亚型的比例。
2.5. 功能富集分析
采用R包“clusterProfiler”(v4.16.0)对核心基因进行基因本体(Gene Ontology,GO)与京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路富集分析。GO包括生物过程(biological process, BP)、细胞成分(cellular component, CC)和分子功能(molecular function, MF)。P < 0.05为显著阈值。
2.6. PPI网络构建与枢纽基因的筛选
采用STRING数据库(https://string-db.org/)构建核心基因的PPI网络(最低互动分数≥0.7)。将结果导入Cytoscape软件(v3.8.2),使用MCODE插件(v2.0.2)对关键PPI网络进行过滤和可视化,从而识别出包含关键基因的关键模块。设置参数为:degree cut-off = 2,node score cut-of = 0.2,K-core = 3,Max.Depth = 100。
2.7. 受试者工作特征(receiver operating characteristic, ROC)分析
GEO数据库下载ARVC验证数据集GSE253224。GSE253224的高通量测序数据基于GPL24247平台。该数据集以小鼠心室肌组织为研究组织,其中8例ARVC小鼠的左、右心室组织作为ARVC组,8例正常小鼠心脏的左、右心室组织作对照组,共16份样本。采用R包“pROC”(v1.19.0.1)绘制ROC曲线,计算曲线下面积(area under the curve, AUC)评估枢纽基因的诊断效能。AUC > 0.5表明分类器优于随机猜测,具有一定的预测能力。AUC越接近1.0,检测方法真实性越高。
3. 结果
3.1. 数据标准化及DEGs的筛选
使用R软件对数据集进行标准化处理,标准化后箱线图显示各样本基因表达中位数及分布一致(图1(a))。
经limma分析共鉴定出329个DEGs,包括100个上调基因和229个下调基因。这些DEGs的可视化由火山图(图1(b))和热图显示(图1(c))。其中热图还标识出校正P值前10的上调基因和前10的下调基因。
3.2. WGCNA与关键模块识别
我们对数据集中的基因进行了WGCNA,通过层次聚类分析揭示与ARVC最相关的关键模块。设置软阈值为4有良好的拟合和平均连通性,相关系数阈值设置为0.88来构建无标度网络(图2(a),图2(b)),通过动态剪枝法识别并合并表达模式相似的模块,共识别出18个共表达模块(图2(c))。然后,我们对特征基因进行聚类,它可以提供有关成对基因与共表达模块之间关系的信息,构建模块基因与临床特征之间的相关图(图2(d))。其中绿色模块(1181个基因,r = 0.74,P = 4e−05)和绿松石模块(5597个基因,r = −0.95,P = 2e−12)与ARVC相关性最强,是ARVC的基本模块。此外,绿松石模块中的MM与GS高度相关,表明该模块中的基因可能与疾病状态相关(图2(e))。故选取该模块基因与DEGs取交集,筛选出254个核心基因(图2(f))。
(a)
(b) (c)
Figure 1. (a) Box shape diagram after standardization processing. (b) Heat map of the differential gene expression profile. (c) Volcano plot of differentially expressed genes (Note: Blue represents down-regulation and red represents up-regulation)
图1. (a) 标准化处理后的箱型图。(b) 差异基因表达谱的热图。(c) 差异基因表达谱的火山图(注:蓝色代表下调,红色代表上调)
(a) (b)
(c) (d)
(e) (f)
Figure 2. Using WGCNA to identify the modules related to ARVC. (a) Scale-free index analysis of various soft threshold powers (β). (b) Average connectivity analysis of various soft threshold powers. (c) A tree diagram of all differentially expressed genes based on dissimilarity measurement clustering. (d) Heat map of the correlation between module characteristic genes and clinical features of diabetes. (e) Bubble chart of turquoise module gene significance and module membership degree. (f) Venn diagram of the intersection of WGCNA and DEGs. WGCNA: Weighted Gene Correlation Network Analysis. DEGs: Differentially expressed genes. ARVC: Causes arrhythmia, right ventricular cardiomyopathy
图2. 使用WGCNA识别与ARVC相关的模块。(a) 各种软阈值幂(β)的无标度指数分析。(b) 各种软阈值功率的平均连通性分析。(c) 基于相异性测量聚类的所有差异表达基因的树状图。(d) 模块特征基因与ARVC临床特征之间相关性的热图。(e) 绿松石模块基因显著性与模块成员度的气泡图。(f) WGCNA和DEGs取交集的韦恩图。WGCNA:加权基因相关网络分析。DEGs:差异表达基因。ARVC:致心律失常右心室心肌病
3.3. 免疫浸润分析
使用CIBERSORT算法评估和量化心脏样本浸润免疫细胞的相对比例(图3(a))。生成小提琴图以可视化对照组和ARVC组中22种免疫细胞亚型的表达谱(图3(b))。小提琴图显示ARVC组的单核细胞、M1型巨噬细胞的细胞浸润少于对照组,相反,ARVC组的休眠树突状细胞高于对照组,具有统计学差异。热图显示核心基因中校正P值前10的上调与前10的下调基因与上述免疫细胞显著相关(图3(c)),其中LINC02436与PIK3R1与单核细胞、M1型巨噬细胞呈负相关,与静止树突状细胞正相关;CCL2、CCL11、CD14、CCR1等基因则呈相反趋势。
3.4. 功能富集分析
我们对这254个核心基因的生物学意义进行了富集分析,包括GO分析和KEGG分析。GO分析中的BP分析显示,核心基因显著富集于趋化性、白细胞迁移、细胞粘附、血管生成与发育等生物过程(图4(a));CC分析主要涉及细胞外基质、分泌颗粒、细胞质囊腔和质膜的外侧(图4(b));MF分析提示核心基因与细胞因子活性、细胞因子受体结合、糖胺聚糖结合、生长因子活性和免疫受体活性高度相关(图4)c))。KEGG分析提示核心基因参与细胞因子–细胞因子受体相互作用、肿瘤坏死因子(tumor necrosis factor, TNF)信号通路、脂代谢和粥样硬化、核因子κB (nuclear factor kappa-B, NF-κB)信号通路和趋化因子信号通路(图4(d))。基因–通路网络图进一步揭示了核心基因与通路间的复杂互作(图4(e))。这些结果表明核心基因通过多个基因功能和途径之间复杂的相互作用来参与ARVC的进展。
(a)
(b)
(c)
Figure 3. Results of immune infiltration analysis. (a) Accumulation map of infiltrating immune cells in ARVC and normal myocardial samples. (b) Violin plots of infiltrating immune cells from ARVC and normal myocardial samples. (c) Heat map of the correlation between genes and immune-infiltrating cells in ARVC samples. ARVC: Causes arrhythmia, right ventricular cardiomyopathy
图3. 免疫浸润分析结果。(a) ARVC和正常心肌样本的浸润免疫细胞堆积图。(b) ARVC和正常心肌样本的浸润免疫细胞小提琴图。(c) ARVC样本中基因和免疫浸润细胞的相关性热图。ARVC:致心律失常右心室心肌病
(a)
(b)
(c)
(d)
(e)
Figure 4. Functional enrichment analysis of core genes. (a) BP bubble chart. (b) CC Bubble chart. (c) MF bubble chart. (d) KEGG bubble chart. (e) Chord diagrams of core genes and related pathways. BP: Biological processes, CC: Cellular components, MF: Molecular functions. KEGG: Kyoto encyclopedia of genes and genomes
图4. 核心基因的功能富集分析。(a) BP气泡图。(b) CC气泡图。(c) MF气泡图。(d) KEGG气泡图。(e) 核心基因和相关通路的弦图。BP:生物过程,CC:细胞成分,MF:分子功能。KEGG:京都基因与基因组百科全书
3.5. PPI网络分析和枢纽基因的识别
STRING在线数据库构建PPI网络,Cytoscape软件将结果可视化为PPI网络(图5(a))。使用MCODE插件来识别PPI网络内的重要功能模块。网络中的最关键的一个集群由具有9个节点和31条边的功能模块组成,包括IL6、PTGS2、CCR1、CXCL1、IL1B、CCL11、CCL2、CXCR4和CCL19共9个基因。图5(b)和图5(c)揭示了核心基因和枢纽基因之间的相互作用。
(a)
(b)
(c)
Figure 5. Identification of PPI networks and hub genes. (a) PPI network diagram of the core gene (Note: Nodes represent genes, and edges indicate the interaction and association between nodes). (b) Crosstalk between the maximum group centrality algorithm and other core genes (Note: The depth of the circle color represents the ranking of the genes). (c) PPI network diagram of hub genes (Note: The depth and size of the circle color represent the ranking of genes). PPI: Protein-Protein Interaction
图5. PPI网络和枢纽基因的识别。(a) 核心基因的PPI网络图(注:节点代表基因,边表示节点之间的交互关联)。(b)基于最大团中心性算法和其他核心基因之间的串扰(注:圆圈颜色的深浅代表基因的排名)。(c) 枢纽基因的PPI网络图(注:圆圈颜色的深浅和大小代表基因的排名)。PPI:蛋白质–蛋白质相互作用
3.6. 枢纽基因的诊断价值
为了确定哪些枢纽基因对ARVC患者具有诊断意义,我们进行了ROC分析,以探讨枢纽基因对ARVC诊断的敏感性和特异性。在GSE253224数据集中,生成ROC曲线以评估这9个枢纽基因的诊断功效(图6)。结果显示,所有枢纽基因的AUC值均>0.6,表明与ARVC相关,具有一定预测潜力。此外,观察到CCR1、CCL19和PTGS2基因表现出强大的诊断能力(AUC = 1),对于区分ARVC患者与健康人群具有最佳诊断价值。
4. 讨论
ARVC是一种常染色体显性遗传性心脏病,病理特征为桥粒功能异常导致心肌纤维脂肪替代,临床易发室性心律失常与SCD,是35岁以下人群SCD的第二大原因[8]。尽管临床与影像学评估在诊断与风险分层中起关键作用,但由于其病理生理学分子机制及基因相关突变靶点尚不明确,目前仍缺乏特异性高的诊断方法。因此,深入探索ARVC的遗传机制与关键靶点对早期诊断与精准治疗具有重要意义。
随着DNA测序和芯片技术的进步,生物信息学方法已被广泛应用于研究各种代谢疾病。本研究整合多种生物信息学方法,系统分析ARVC的潜在机制。首先通过差异性分析获得了100个上调基因和229个下调基因。此外,我们应用WGCNA分析筛选出与ARVC最相关的关键模块。对差异表达的基因和关键模块所含的基因取交集,得到254个重叠的核心基因。进一步通过免疫浸润分析、功能富集分析和PPI网络分析揭示这些核心基因在ARVC发展中的作用和可能机制。
Figure 6. Results of ROC curve analysis of IL6, PTGS2, CCR1, CXCL1, IL1B, CCL11, CCL2, CXCR4 and CCL19 in the validation dataset GSE253224. ROC: Receiver operating characteristic. AUC: Area under the curve
图6. 验证数据集GSE253224中IL6、PTGS2、CCR1、CXCL1、IL1B、CCL11、CCL2、CXCR4和CCL19的ROC曲线分析。ROC:受试者工作特征。AUC:曲线下面积
免疫微环境在ARVC中扮演重要角色。研究表明,ARVC心肌纤维化与免疫细胞浸润密切相关[9]。Mesquita等人发现,抑制单核细胞源性的巨噬细胞活性可以缓解促胶质蛋白2突变体小鼠的ACM特征(即纤维脂肪替代、收缩功能障碍和室性心律失常) [10]。M1型巨噬细胞通过释放肿瘤坏死因子α、白细胞介素1α、白细胞介素1β、白细胞介素6等促炎因子参与心肌病的进展[11]。树突状细胞介导单核细胞和巨噬细胞募集的调节,它们在先天性免疫系统和适应性免疫系统的交界处发挥着独特的作用。研究发现,诱发树突状细胞激活,可以引发小鼠心肌炎症和DCM [12]。上述研究结果与本实验结果相似,本研究结果显示,ARVC组中单核细胞、M1型巨噬细胞浸润减少,而静止树突状细胞比例升高,提示树突状细胞的激活可能会促进ARVC的进展,而单核细胞和M1型巨噬细胞可能在ARVC发展中起保护作用。免疫浸润分析的结果为了解免疫系统在ARVC发展中的作用提供了宝贵的见解。然而,目前的研究并没有通过具体的实验来验证免疫浸润细胞与核心相关基因之间的关系,未来需要在这一领域进行进一步的研究和证明。
GO功能分析和KEGG通路分析表明,这些核心基因与ARVC相关的各种生物过程、细胞成分和分子功能密切相关。BP分析显示,核心基因在白细胞迁移、血管生成调控、脉管系统发育调控中显著富集。而既往研究也表明,心肌损伤后,心脏组织巨噬细胞吞噬死亡的心肌细胞,调节心肌祖细胞的增殖和血管生成[13]。抑制白细胞的迁移性可以对特发性DCM的心肌细胞提供保护[14]。MF分析揭示了ARVC患者心肌病发生过程中细胞因子活性、细胞因子受体结合、糖胺聚糖结合、生长因子活性和免疫受体活性等的激活。Xie等人发现TNF信号通过激活心脏内皮细胞促进心肌炎的发展,在心肌病心脏重构和功能障碍中发挥调控作用[15]。脂肪代谢紊乱可以破坏线粒体功能障碍,导致心力衰竭的发生[16]。而脂质相关蛋白的过表达或缺失也可引发心肌功能障碍,并可能导致心肌病的发展[17]。此外,粥样硬化参与缺血性心肌病、糖尿病心肌病、DCM等各种心肌病的发生发展[16] [18] [19]。NF-κB的超激活直接驱动促纤维化基因转化生长因子β的表达,并增强下游信号,促进ARVC心肌纤维化的进展[20]。以上研究结果提示,TNF信号通路、脂代谢和粥样硬化、NF-κB信号通路是ARVC的重要通路,与本研究的KEGG通路分析相一致。其中,CD14、GADD45G与NF-κB在信号通路中高度富集,CCL2、SELE、IL6、PIK3R1,提示上述基因可能参与了ARVC的发生发展。
通过PPI网络分析我们筛选出9个枢纽基因(IL6、PTGS2、CCR1、CXCL1、IL1B、CCL11、CCL2、CXCR4、CCL19),这些枢纽基因的诊断价值通过ROC分析进行验证评估,结果显示上述基因均表现出一定的预测潜力,提示这些枢纽基因可能在ARVC的发生和预后中起关键作用。我们注意到,ROC分析中,CCR1、CCL19和PTGS2基因在ARVC中具有非常高的诊断价值,有望成为ARVC的治疗新靶点。趋化系统指导免疫细胞在体内的迁移、定位和功能,是免疫应答不可或缺的组成部分,与感染、肿瘤和自身免疫性相关疾病密切相关,其构成包括趋化因子受体和趋化因子。CCR1基因是一个负责编码一种名为C-C基序趋化因子受体1 (C-C motif chemokine receptor 1, CCR1)的蛋白质的基因,CCR1主要表达于中性粒细胞、单核/巨噬细胞等免疫细胞,其常见的配体包括CCL3 (巨噬细胞炎症蛋白-1α)和CCL5 (调节活化正常T细胞表达和分泌的因子) [21]。CCR1功能失常或过度激活与多种炎症性和自身免疫性疾病密切相关。研究发现,CCR1在恰加斯病心肌病中提供保护作用[22]。此外,CCR1通过参与炎症与免疫反应,在慢性心肌病、缺血性心肌病及自身免疫性心肌炎中均发挥作用[23]-[25]。CCL19基因是一个负责编码C-C基序趋化因子配体19 (C-C motif chemokine ligands 19, CCL19)蛋白质的基因。CCL19是一种免疫稳态趋化因子,属于CC亚族(β-趋化因子),通过结合CCR7,主要引导成熟的树突状细胞和初始T细胞和中央记忆T细胞的迁移和定位,它在自身免疫病、癌症和移植排斥等过程中扮演着复杂而重要的角色,对于启动适应性免疫应答至关重要,是一个潜在的免疫治疗调控靶点[26]。研究发现,蒽环类药物相关心肌病中,CCL19的表达明显升高,是免疫中枢基因之一[27] [28]。除了趋化免疫外,炎症也在ARVC的发生发展中发挥重大作用。PTGS2基因编码的蛋白通常被称为环氧化酶2 (Cyclooxygenase-2, COX-2),COX-2是一种诱导型酶,将细胞膜磷脂转化为各种具有生物活性的前列腺素和血栓烷,是肿瘤、炎症性疾病、疼痛和发热过程中的关键介质。PTGS2参与脓毒性心肌病的发病机制[29]。先前的生信分析亦表明,PTGS2是缺血性心肌病的关键枢纽基因,是心肌梗死恶化的潜在靶点[30]。
尽管有重要的发现,但当前的研究也存在一定的局限性。首先,本研究的样本量较小,存在一定的研究误差,后续的研究应增加样本量以提高结果的可靠性,同时横断面性研究尚缺乏一定的论证能力,需要进行更全面的前瞻性研究来验证本研究的结果。其次,本文仅限于关键基因在转录组水平的表达验证,应增加对核心基因的蛋白质表达水平的验证,需要临床样本和动物模型来进一步阐明核心基因的功能机制。
综上所述,本研究通过综合生物信息学分析筛选出ARVC相关核心基因,揭示其与免疫浸润及多条信号通路的关联。提示了这些核心基因(尤其是CCR1、CCL19、PTGS2),作为ARVC诊断与预后评估的新型生物标志物及潜在治疗靶点的可能性,但需要大量的实验进一步验证。
NOTES
*通讯作者。