1. 引言
宫颈癌(cervical cancer)是女性群体中最常见的恶性肿瘤之一,其发病率和致死率在女性恶性肿瘤中长期居高不下[1]。近年来,我国宫颈癌发病年龄呈现逐渐年轻化的趋势[2],大多数患者被诊断出宫颈癌时,病情已处于晚期阶段[3]。目前,治疗宫颈癌的主要方法是手术切除病灶、放疗和化疗,但部分宫颈癌患者在接受这些治疗后仍面临复发的风险,并可能经历多种不良反应,大大降低了患者生活质量[4]。因此,开发安全有效且副作用小的药物成为了亟待解决的临床问题。
莪术醇(Curcumol)是莪术中的主要活性成分,具有良好的抗癌潜力[5]。据报道,莪术醇对宫颈癌细胞增殖具有明显的抑制作用,能够诱导细胞自噬和发生凋亡,具有潜在的治疗宫颈癌的作用[6],但其药理作用的确切机制仍不清楚。本研究旨在通过GEO芯片分析,结合网络药理学与分子对接技术,探讨莪术醇作为宫颈癌潜在治疗药物的作用靶点和药理机制,为宫颈癌治疗提供参考。
2. 材料与方法
2.1. 莪术醇作用靶点预测
利用PubChem数据库(https://pubchem.ncbi.nlm.nih.gov/)获取莪术醇的2D结构和Canonical SMILES,将莪术醇2D结构上传到PharmMapper数据库(https://www.lila-ecust.cn/pharmmapper/)获取其作用靶点,再利用Uniprot数据库(http://www.uniprot.org/)对靶点进行校正;利用在线数据库Swiss Target Predictio (http://www.swisstargetprediction.ch/)和TargetNet (http://targetnet.scbdd.com/)对莪术醇潜在作用靶点进行预测;此外,在CTD数据库(https://ctdbase.org/)中,以“Curcumol”作为检索关键词,获取莪术醇作用靶点。以上数据库分析获得的所有靶点取并集用于后续分析。
2.2. GEO芯片分析和宫颈癌靶点获取
从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)下载GSE9750和GSE63514表达谱芯片数据集。利用R语言4.3.2版本的“limma”包对基因表达数据进行差异分析,依据|logFC| ≥ 1及P < 0.05的筛选标准.筛选差异表达基因(differentially expressed genes, DEGs),并绘制火山图展示DEGs的分布。从GeneCards (https://www.genecards.org/)数据库中以“Cervical Cancer”为关键词,检索宫颈癌相关基因,将其与GSE9750和GSE63514两个数据集获得的DEGs进行合并,获得宫颈癌相关基因。
2.3. 莪术醇–宫颈癌交集靶点的获得和蛋白质互作网络构建
使用Venny2.1.0 (https://bioinfogp.cnb.csic.es/tools/venny/)在线工具,将莪术醇和宫颈癌的靶点取交集,并绘制Venn图。将交集靶点导入STRING (https://cn.string-db.org/)数据库,构建PPI网络并下载TSV文件。使用Cytoscape(3.9.1)软件进行可视化,利用CytoNCA插件计算接近中心性(closeness centralities, CC)、介数中心性(betweenness centralities, BC)、度中心性(degree centralities, DC)、特征向量中心性(eigenvector centralities, EC)、局部平均连接性(local average connectivity-based method centralities, LAC)和网络中心性(network centralities, NC)的拓扑值,以大于上述6项指标中位数为标准,筛选莪术醇靶向宫颈癌的候选核心靶点[7]。
2.4. GO和KEGG富集分析
利用R软件的“clusterProfiler”和“org.Hs.eg.db”包进行功能注释,对细胞组分(cellular components, CC)、分子功能(molecular functions, MF)和生物过程(biological process, BP)进行GO富集分析。使用“enrichplot”和“ggplot2”包进行KEGG富集分析,选取GO中排名前10位条目和KEGG排名前20的通路绘制柱状图。根据GeneRatio排名确定关键的信号通路并进行可视化。
2.5. 莪术醇–宫颈癌关键靶点鉴定
利用UALCAN (https://ualcan.path.uab.edu/)数据库分析候选关键基因在宫颈癌中的表达水平。通过GEPIA2 (http://gepia2.cancer-pku.cn/)数据库探讨其表达水平与患者总生存期(overall survival, OS)的相关性,将在宫颈癌中存在差异表达且与患者预后显著相关的基因定义为莪术醇–宫颈癌关键靶点,使用Spearman系数对关键靶点进行相关分析。
2.6. 莪术醇与关键靶蛋白的分子对接
通过PubChem数据库获取莪术醇的二维结构,采用Chem3D (14.0.0.117)构建其三维结构并进行优化。利用PDB数据库(https://www.rcsb.org/)获得受体蛋白的晶体结构,经Autodock Tools (1.5.7)进行结构优化,利用AutoDock Vina进行分子对接,并借助PyMOL (2.5.7)实现对接构象的可视化呈现。
3. 结果
3.1. 莪术醇作用靶点的鉴定
利用PharmMapper、CTD、SwissTargetPrediction和TargeNet四个数据库,分别预测得到213、28、100和67个作用靶点,合并后获得359个莪术醇作用的靶点。
3.2. 宫颈癌相关基因预测
在GSE9750数据集中,共筛选出1570个DEGs,其中849个基因高表达,721个低表达(见图1(A))。在GSE63514数据集中,检测到791个具有统计学意义的DEGs,包括431个表达上调的基因和360个表达下调的基因(见图1(B))。Genecards数据库分析获得5225个宫颈癌相关基因,将以上结果进行合并,最终得到6637个与宫颈癌相关基因。
Figure 1. Differential gene volcano maps for the GSE9750 and GSE63514 datasets
图1. GSE9750和GSE63514数据集差异基因火山图
3.3. 莪术醇–宫颈癌交集靶点和蛋白质互作网络分析
将莪术醇作用靶点与宫颈癌相关基因取交集,获得莪术醇靶向宫颈癌的作用靶点239个(见图2)。PPI分析结果显示有234个节点和3830条边(见图3)。根据拓扑分析结果,筛选得到16个候选关键靶点(见图4)。
Figure 2. Venn diagram of curcumol and cervical cancer intersection genes
图2. 莪术醇–宫颈癌交集基因韦恩图
Figure 3. PPI networks for intersecting targets
图3. 交集靶点PPI网络
Figure 4. PPI network topology analysis
图4. PPI网络拓扑分析
3.4. GO富集和KEGG通路分析结果
GO功能注释表明,莪术醇作用宫颈癌的靶点显著富集在对营养水平的反应、对脂多糖的反应以及对细菌来源分子的反应等生物学进程。细胞组分分析显示这些靶点主要分布在囊泡腔、细胞质囊泡腔和分泌颗粒腔等细胞部位。分子功能主要涉及酪氨酸激酶活性、蛋白质丝氨酸/苏氨酸激酶活性以及羧酸结合等功能。KEGG分析得到165条信号通路,主要涉及PI3K-AKT信号通路、MAPK信号通路和Ras信号通路等(见图5),其中最显著富集的通路为PI3K-AKT信号通路,莪术醇的作用靶点以红色方块进行标记(见图6)。
Figure 5. GO enrichment and KEGG pathway analysis results
图5. GO富集和KEGG通路分析结果
Figure 6. Curcumol and cervical cancer targets of action in the P13K-AKT signaling pathway
图6. 莪术醇–宫颈癌作用靶点在P13K-AKT信号通路中的分布
3.5. 莪术醇–宫颈癌关键靶点鉴定
对16个候选关键靶点进行分析,结果如图7所示,与癌旁组织相比,STAT1、PARP1、MTOR、HIF1A、EGFR、CASP3、TNF和BCL2L1在宫颈癌组织中显著高表达(P < 0.05)。进一步分析发现,EGFR、HIF1A和TNF高表达患者的预后较差(P < 0.05),并且EGFR、HIF1A和TNF在宫颈癌患者中的表达水平呈显著正相关(P < 0.05,见图8),,提示EGFR、HIF1A和TNF可能是莪术醇治疗宫颈癌的关键靶点。
Figure 7. Differential expression analysis of core target genes in cervical cancer
图7. 核心靶基因在宫颈癌中表达差异分析
Figure 8. Prognostic analysis and correlation of key core genes
图8. 关键核心基因预后分析及其相关性
3.6. 核心靶点分子对接验证
莪术醇与EGFR、HIF1A和TNF的分子对接结果显示,莪术醇与EGFR结合能为−7.2 kcal/mol,其在ARG-841、ASP-855处形成氢键;与HIF1A的结合能为−6.9 kcal/mol,其在SER-274处形成氢键;与TNF结合能为−5.8 kcal/mol,其在GLN-25、ASN-46处形成氢键,见图9。
Figure 9. Molecular docking results of curcumol and core target proteins
图9. 莪术醇和核心靶蛋白分子对接结果
4. 讨论
本研究基于GEO芯片分析和数据库靶点预测,一共获得239个莪术醇治疗宫颈癌潜在的作用靶点,主要参与了PI3K-AKT信号通路、MAPK信号通路及Ras信号通路的调控。有研究报道,PI3K-AKT信号通路通过调节细胞存活、凋亡和细胞周期进展等细胞功能,在肿瘤的进展中发挥重要作用[8]。黄作香[9]研究发现,PI3K-Akt信号通路过度激活促进宫颈癌细胞的增殖和侵袭。张慧等人[10]研究发现,通过调节PI3K-Akt信号通路抑制胶质瘤细胞增殖并促进其凋亡,从而发挥抗癌作用。据报道,MAPK信号通路在宫颈癌恶性转化过程中被激活[11],MAPK通路已成为治疗宫颈癌的重要靶点[12]。因此,我们推测莪术醇可能通过调控多个信号通路发挥治疗宫颈癌的作用。
利用UALCAN数据库和GEPIA2数据库进行分析发现,EGFR、HIF1A和TNF在宫颈癌组织中显著高表达,并与患者预后不良密切相关。EGFR是一种多功能糖蛋白,广泛分布于细胞膜上,与细胞信号传导密切相关[13],有研究报道,体外过表达EGFR显著促进宫颈癌细胞的增殖、侵袭以及淋巴结转移[14]。EGFR通过促进其下游炎症因子活化,激活PI3K-Akt信号通路[15]。利用靶向EGFR的药物治疗宫颈癌,在临床研究中具有良好疗效,阻断EGFR磷酸化能够显著提升放化疗效果[16]。已有研究证实,莪术醇能够下调EGFR的表达,抑制血管内皮细胞的增殖及毛细血管样结构的生成[17]。HIF1A是一种在低氧条件下响应的转录因子[18],研究发现HIF1A高表达在宫颈癌发展中发挥关键作用[19],其高表达与宫颈癌患者较差的5年总体生存率相关[20]。HIF1A通过调控血管内皮生长因子(VEGF)促进宫颈肿瘤的血管生成[21]。也有研究证实,莪术醇通过下调HIF1A的表达,影响宫颈癌的生长和转移[22];TNF是一种具有多效性生物学效应的细胞因子[23],通过激活MAPK信号通路,促进宫颈癌细胞的迁移、侵袭及淋巴管生成[24]。李宁[25]研究发现,莪术醇可以减少TNF的表达,发挥治疗宫颈癌的作用。分子对接结合能越低,药物和靶蛋白两者结合越稳定[26]。本研究的分子对接结果表明,莪术醇与EGFR、HIF1A及TNF的结合能均 < −5.0 kcal·mol−1,表明莪术醇与关键受体蛋白可形成稳定的配体–受体复合物,莪术醇可能通过调控这三个关键靶点发挥治疗宫颈癌的作用。
本研究将GEO芯片与网络药理学分析和分子对接技术相结合,发现莪术醇对主要通过调控PI3K-AKT信号通路和MAPK信号通路发挥治疗作用,EGFR、HIF1A和TNF可能是莪术醇作用的关键靶点。
基金项目
桂林医学院博士科研启动基金项目(2021年);桂林医学院大学生创新创业项目(项目编号:X202310601231)。
NOTES
*通讯作者。