1. 引言
多囊卵巢综合征(polycystic ovary syndrome, PCOS)是一种常见的内分泌紊乱,主要影响育龄女性,其特征表现为月经不规律、高雄激素血症和排卵障碍[1]。PCOS在全球范围内的发病率约为5%~20% [2],不仅影响广泛育龄期女性生殖健康,还增加了肥胖、胰岛素抵抗和心血管疾病等代谢问题的风险[3] [4]。尽管PCOS普遍存在,但由于其临床表现多样、缺乏单一明确的诊断标志物,使早期诊断PCOS仍然具有挑战性,常常导致疾病治疗的延误[4] [5]。因此,迫切需要开发新的诊断方法或生物标志物。
铜死亡(Cuproptosis)是一种由铜触发的非凋亡性细胞死亡途径。当铜与三羧酸循环中的脂酰化组分相互作用时,会导致蛋白质聚集和铁硫簇的耗竭,最终引发蛋白质毒性应激和细胞死亡[6]。研究发现,PCOS患者中存在线粒体异常,例如氧耗减少和活性氧(ROS)产量增加[7] [8]。鉴于铜在线粒体酶中的作用以及其与铜死亡的关联,以及高铜水平对PCOS卵泡发育的潜在有害影响[9] [10],铜死亡可能与PCOS的发病机制有关。此前,铜死亡相关基因在癌症和心血管疾病等疾病中已显示出诊断价值[11] [12],研究这些基因的表达可能为PCOS的诊断提供新的见解。
N6-甲基腺苷(N6-methyladenosine, m6A)修饰是表观遗传调控的重要特征,是一种可逆的RNA修饰,指腺嘌呤(A)上第六位氮原子(N)受甲基转移酶催化作用形成的一种特异性的甲基化修饰[13]。近年来研究发现,信使RNA (mRNA)中发生的m6A甲基化修饰过程受甲基转移酶、去甲基酶和结合蛋白三类相关蛋白的调控和作用,参与了肿瘤、神经性疾病、胚胎发育迟缓等多种疾病的发生、发展[14]。这些修饰在RNA的稳定性、剪接、翻译和相互作用中发挥重要作用[15]。关于m6A修饰在PCOS中的研究表明,它们在颗粒细胞功能中,如增殖和凋亡,发挥作用,并且m6A相关基因也参与其中[16]-[18]。然而,m6A修饰在PCOS诊断中的潜力仍不明确。
此前研究提示,铜死亡中的关键基因—铁氧还蛋白1 (Ferredoxin 1)与PCOS的发展密切相关,且与m6A、m5C和m1A相关基因表现出显著的相关性[19]。同时,m6A调控因子和铜死亡相关基因的整合在肝细胞癌中已被证明对建立预后特征具有重要意义[20]。这些发现促使我们进一步探讨将m6A和铜死亡相关基因纳入PCOS诊断体系的潜力。因此,本研究旨在研究m6A和铜死亡相关基因的表达模式,并评估它们作为PCOS新型诊断标志物的可行性。
2. 材料与方法
2.1. 数据获取
从基因表达综合数据库(GEO; https://www.ncbi.nlm.nih.gov/geo/)获取了转录组表达谱数据。所用的数据集包括GSE34526、GSE137684、GSE80432、GSE114419和GSE102293,这些数据集包含了从28例PCOS患者卵巢和22例正常卵巢中分离的人类颗粒细胞样本,见表1。通过合并这些数据集来进行基因的筛选和分析。对每个数据集中的探针与相应基因进行匹配,并排除那些未能与任何已知基因匹配的探针。如果多个探针映射到一个基因,则使用这些探针的中位表达值来代表该基因的表达水平。为了消除数据集间的批次效应,使用“sva”包中的ComBat函数进行了数据校正。
2.2. 差异表达基因的鉴定
使用R软件包“limma”鉴定PCOS组与正常对照组之间的差异表达基因(DEGs)。筛选条件为P值小于0.05。与铜死亡相关的差异表达基因被标记为DECuRGs,而属于m6A修饰靶基因的差异表达基因被标记为DEm6ARGs。
2.3. 富集分析
使用R软件包“clusterProfiler”对DECuRGs和DEm6ARGs进行了基因本体(Gene Ontology, GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)功能富集分析。P值经过Benjamini-Hochberg校正,展示了最显著的前15个富集结果。
2.4. 免疫浸润分析
使用单样本基因集富集分析(ssGSEA)评估了28种免疫细胞亚型的富集分数,并使用“GSVA”包进行了ssGSEA分析。使用Wilcox检验比较两组之间的免疫细胞丰度差异,运用Pearson相关分析评估风险评分与免疫细胞浸润之间的关系。
2.5. 药物敏感性预测
利用NCI-60细胞系在CellMiner数据库(https://discover.nci.nih.gov/cellminer/home.do)中的表达数据以及药物活性数据,分析了特征基因与药物之间的相关性。相关性分析采用Pearson方法,并使用Cytoscape对特征基因与药物之间的关系进行了可视化。
2.6. 统计分析
所有统计分析均使用R (v4.3.0)进行。使用“pheatmap”包可视化热图。使用“ggvenn”包创建Venn图,并使用“ggplot2”或plot函数生成其他结果图。相关性分析采用Pearson方法,两组之间差异的检验使用Wilcoxon检验。p值 < 0.05时,结果被认为具有统计学显著性。
Table 1. Sample size and sample types
表1. 样本量及样本类型
数据集 |
技术平台 |
样本类型 |
样本量(n = 50) |
数据类型 |
GSE34526 |
GPL570 |
从正常或PCOS患者
卵巢中分离的人颗粒
细胞 |
10 |
mRNA array |
GSE137684 |
GPL17077 |
12 |
mRNA array |
GSE80432 |
GPL6244 |
6 |
mRNA array |
GSE114419 |
GPL17586 |
6 |
mRNA array |
GSE102293 |
GPL570 |
6 |
mRNA array |
GSE168404 |
GPL16791 |
10 |
RNA-seq |
3. 结果
3.1. 鉴定多囊卵巢综合征(PCOS)与对照组之间的差异表达基因(DEGs)
为了识别能够区分PCOS与健康对照的差异表达基因(DEGs),从五个数据集(GSE34526、GSE137684、GSE80432、GSE114419和GSE102293)中收集了基因表达数据。合并后的数据集包括28个PCOS样本和22个对照样本。初步的聚类分析显示了不同数据集之间的聚类模式差异(图1),这些差异在批次效应移除后得到解决。批次效应移除后,样本显示出一致的聚类(图2)。通过设定p值 < 0.05的显著性阈值,共鉴定出1179个DEGs,其中520个基因上调,659个基因下调(图3)。图4中的热图显示了前20个DEGs。
(a) (b)
注:批次效应去除前的箱线图和主成分分析(PCA)显示不同数据集之间的表达模式差异。
Figure 1. Differences in clustering patterns between different data sets
图1. 不同数据集之间的聚类模式差异
(a) (b)
注:批次效应去除后的箱线图和PCA展示了不同数据集之间的一致表达模式。
Figure 2. Box plot, principal component analysis (PCA)
图2. 箱形图和主成分分析
注:火山图展示了1179个差异表达基因(520个上调基因和659个下调基因),其中红色表示上调基因,蓝色表示下调基因,灰色表示无显著变化的基因。
Figure 3. Volcano plot
图3. 火山图
注:热图展示了前20个差异表达基因。
Figure 4. Volcano pl
图4. 热图
3.2. 铜死亡相关基因(DECuRGs)和m6A靶基因(DEm6ARGs)的鉴定及功能富集分析
1) 接下来,通过将DEGs与铜死亡和m6A修饰相关的基因进行了交集分析。最初,研究尝试将DEGs与m6A的WER成分进行交集,但未发现重叠,因此研究将重点转向m6A靶基因的交集。铜死亡相关的差异表达基因(DECuRGs)包括102个上调基因和119个下调基因(图5(a))。相比之下,m6A靶基因中的差异表达基因(DEm6ARGs)包括39个上调基因和24个下调基因(图5(b))。通过基因本体(GO)和京都基因与基因组百科全书(KEGG)功能富集分析对这些基因进行了功能探索。DECuRGs富集的生物过程(BP)包括细胞因子生产的正向调控、对脂多糖的反应以及对细菌来源分子的反应。显著的细胞成分(CC)包括分泌颗粒膜、分泌颗粒腔和胞质囊泡腔。分子功能(MF)包括模式识别受体活性、Toll样受体结合以及甘露糖基转移酶活性(图6(a))。KEGG通路分析突出显示了C型凝集素受体信号通路、脂质和动脉粥样硬化、军团菌病、EB病毒感染以及细胞凋亡(图6(b))。
2) 对于DEm6ARGs,显著的BP包括内源性凋亡信号通路、病毒过程和细胞因子介导的信号通路。主要的CC包括胞质应激颗粒、线粒体外膜和细胞器外膜。然而,MF中未观察到显著的富集(图7(a))。主要的KEGG通路包括EB病毒感染、癌症中的PD-L1表达和PD-1检查点通路以及细胞凋亡(图7(b))。DECuRGs和DEm6ARGs之间的重叠通路包括内源性凋亡信号通路、细胞因子介导的信号通路、细胞对生物刺激的反应以及外源性凋亡信号通路。此外,共享的KEGG通路包括C型凝集素受体信号通路、脂质和动脉粥样硬化、细胞凋亡、NF-kappa B信号通路以及HIF-1信号通路。这些数据表明,与铜死亡和m6A修饰相关的基因在免疫反应、脂质代谢和细胞凋亡的特定生物通路中显示出差异表达和潜在的交集。
(a)
(b)
注:韦恩图展示了DEGs与铜死亡相关基因(a)以及与m6A靶基因(b)的交集。
Figure 5. Venn diagrams
图5. 韦恩图
Figure 6. (a) GO functional enrichment analysis (DECuRGs); (b) KEGG functional enrichment analysis (DECuRGs)
图6. (a) DECuRGs的GO功能富集分析;(b) DECuRGs的KEGG功能富集分析
Figure 7. (a) GO functional enrichment analysis (Dem6ARGs); (b) KEGG functional enrichment analysis (Dem6ARGs)
图7. (a) Dem6ARGs的GO功能富集分析;(b) Dem6ARGs的KEGG功能富集分析
3.3. 免疫浸润分析
为了了解PCOS潜在的免疫学相关性及机制,使用单样本基因集富集分析(ssGSEA)分析了PCOS和正常对照之间免疫浸润的差异。热图展示了28种免疫细胞类型在样本中的分布(图8(a))。结果观察到在28种免疫细胞类型中,有10种显示出显著差异(图8(b)),包括未成熟树突状细胞、嗜酸性粒细胞、中性粒细胞、γδT细胞、自然杀伤细胞、活化的树突状细胞、未成熟B细胞、中心记忆CD4 T细胞、效应记忆CD8 T细胞和髓样来源抑制细胞(MDSC)。提示在PCOS可能与铜死亡及m6a相关共享基因的免疫学调控相关联。
(a)
(b)
注:热图和箱形图展示了PCOS患者与对照组中的免疫细胞分布。
Figure 8. Immune infiltration analysis
图8. 免疫浸润分析
3.4. 特征基因与药物反应之间的相关性分析
为了解特征基因与药物反应之间的联系,研究使用CellMiner数据库中的NCI-60细胞系表达数据和药物敏感性数据,探讨基因表达与药物敏感性之间的相关性。通过Pearson相关性分析,筛选出在p < 0.05且相关系数|r| > 0.4标准下显著的基因–药物对(图9)。ACLY和CLDN1分别与长春碱呈现出最强的负相关和正相关,同时CLDN1还与XAV-939呈现出最强的正相关性。AGMAT则与MTX-211呈现出最强的负相关性,与Barasertib呈现出正相关性;CASK与Dolastatin 10呈现出最强的负相关性,并与XAV-939呈现正相关性。此外,DDX3X与甲基泼尼松龙呈现出最强的正相关性,PTGES3则分别与AZD-3147和ST-3595呈现出最显著的负相关性和正相关性。这些发现揭示了这些基因在指导PCOS个性化治疗策略中的潜在作用。
注:橙色表示特征基因,绿色表示与特征基因显著相关的药物。
Figure 9. Correlation between feature genes and drugs
图9. 特征基因与药物的相关性
4. 讨论与展望
本研究通过整合生物信息学工具和多组基因表达数据,系统分析了铜死亡相关基因(DECuRGs)与m6A修饰相关基因(DEm6ARGs)在PCOS中的潜在作用机制。通过差异表达分析、基因功能富集分析和免疫浸润评估,本研究揭示了铜死亡与m6A修饰在PCOS发病机制中的潜在交互作用。
首先,研究鉴定出221个与PCOS密切相关的DECuRGs和63个DEm6ARGs,并通过GO和KEGG富集分析发现,这些基因主要涉及细胞凋亡、脂质代谢、免疫反应等生物过程。本研究结果与先前研究相一致,已有文献表明,PCOS患者常表现出代谢紊乱和免疫系统异常[21] [22]。值得一提的是,铜死亡在调控细胞内铁代谢和线粒体功能中起关键作用,这与PCOS患者中常见的线粒体功能障碍高度一致[23]。
此外,本研究首次揭示了铜死亡相关基因和m6A修饰之间可能存在协同作用。m6A修饰是一种重要的RNA表观遗传修饰,已被证明在调节RNA代谢、稳定性和翻译过程中发挥重要作用[24]。本研究提示,PCOS患者中的m6A修饰可能通过调控铜死亡相关基因的表达,进一步加剧PCOS的发病机制。这一发现拓展了目前关于m6A修饰与PCOS的认识,提供了新的分子机制解释。
免疫浸润分析显示,PCOS患者的卵巢组织中免疫细胞的浸润显著高于正常对照组,尤其是调节性T细胞和巨噬细胞的增加,这与之前研究指出的PCOS与慢性低度炎症之间的关联相吻合[25]。这些结果表明,免疫反应可能通过铜死亡途径进一步影响PCOS的病理进展。铜死亡不仅与铁代谢相关,还可能通过触发炎症反应,参与PCOS的免疫病理过程。未来的研究应深入探讨铜死亡途径对PCOS中免疫细胞活化的具体影响机制。
为了探索特征基因与药物反应之间的潜在联系,基于CMap (Connectivity MAP)的分析,筛选出了与PCOS相关基因显著相关的药物靶点。研究发现,ACLY与长春碱呈现最强的负相关性,表明ACLY的高表达可能降低对该药物的敏感性。相反,CLDN1与长春碱和XAV-939均呈现强正相关性,提示CLDN1可能作为调控PCOS治疗中重要靶点。此外,AGMAT、CASK、DDX3X和PTGES3等基因分别与多种药物(如MTX-211、Dolastatin 10、甲基泼尼松龙和AZD-3147)表现出显著相关性,进一步证明这些基因在药物反应和治疗策略中的重要性。
这些基因与药物敏感性之间的显著相关性为PCOS的个性化治疗提供了潜在的分子靶标。例如,DDX3X与抗炎药物甲基泼尼松龙的正相关性提示,该基因可能在调节炎症反应中发挥作用,而PTGES3则与AZD-3147和ST-3595的不同反应表明其可能参与PCOS相关的免疫调控。这些结果表明,未来可通过药物基因组学进一步优化PCOS的治疗方案,基于患者特定的基因表达谱开发个性化治疗策略,以提高治疗效果并减少副作用。
尽管本研究利用了丰富的公共数据和多种生物信息学分析方法,但也存在一些局限性。首先,PCOS作为一种异质性疾病,可能涉及复杂的遗传和表观遗传机制,单纯通过生物信息学手段难以全面揭示其全部分子机制。其次,本研究主要基于公开数据集,尚未在临床样本中进行实验验证。因此,未来的研究应结合实验数据,进一步验证铜死亡和m6A修饰在PCOS中的具体功能和作用机制。
为了更好地理解铜死亡与m6A修饰在PCOS发病过程中的具体作用,未来应开展更多体内外实验来验证这些基因的功能,特别是铜死亡相关的ATP7B和SLC31A1在PCOS发病中的具体机制。此外,未来的研究还可以通过大规模的临床样本来验证本研究的发现,进一步评估这些基因作为诊断标志物和治疗靶点的临床潜力。
基金项目
云南省兴滇英才支持计划名医项目(编号:XDYC-MY-2022-0057);昆明医科大学中青年学科带头人及后备人选–“乘风”人才培养计划(编号:2023(108))。
NOTES
*通讯作者。