1. 引言
乳腺癌是女性确诊最多的癌症之一,在女性因癌症死亡的原因中排名第二[1]。现阶段认为早期乳腺癌是可以治愈的[2],但伴有远处转移的晚期乳腺癌是无法治愈的[3]。乳腺癌异质性注重先进的分子检测,这有助于及时诊断和提高生存率[4]。分子特征包括HER2、ER和PR的激活以及BRCA的突变[5]。随着乳腺癌综合治疗的不断完善,乳腺癌患者的生存期逐渐延长。但除手术外,现有的化学治疗及放疗在部分患者中效果不佳,且癌症患者的转移呈年轻化趋势,因此,探索新的生物标志物对乳腺癌的早诊早治及生存预后仍有重要意义[6]。
基质金属蛋白酶11 (matrix metallopeptidase 11, MMP11)基因,位于第22号染色体上,其中编码的MMP11蛋白包含488个氨基酸。MMP-11对肿瘤有“双重作用”,一个方面来看,MMP-11在肿瘤发生发展的早期阶段可凭借抑制细胞的凋亡过程以及促进癌细胞进行迁移和侵袭来发挥促进作用,而在晚期肿瘤中,MMP-11对肿瘤的生长与转移发挥着保护功能[7]。在肺腺癌中MMP11的高表达与EGFR突变有关,MMP11高表达的患者对免疫治疗反应较差[8]。关于结肠和结直肠腺癌的数据显示,MMP11表达上调与肿瘤发生和肿瘤恶性程度相关,MMP11基因变异可以增加结直肠癌细胞的致瘤特性[9]。关于前列腺癌的研究表明,MMP11可能改变前列腺癌的基质微环境以刺激肿瘤血管生成[10]。基质金属蛋白酶11 (MMP11)还被认为是尿路上皮癌、肝癌转移的肿瘤标志物和低生存率的预测因子[11]。然而在乳腺癌方面基质金属蛋白酶11 (MMP11)的表达情况以及预后状况尚未完全阐明,本研究拟通过TIMER数据库[12]、GEPIA数据库[13]、Kaplan-Meier Plotter数据库[14]、UALCAN数据库[15]、HPA数据库[16]以及CancerSEA数据库[17]进行数据在线分析,明确MMP11在乳腺癌组织及细胞中的表达情况及其相关临床意义,为以MMP11基因为靶点的临床治疗提供依据。
2. 资料与方法
2.1. GEPIA2数据库
GEPIA2数据库是一种对网络上TCGA数据库和GTEx数据库中肿瘤样本与正常样本的RNA测序数据进行在线分析的工具。本研究利用此在线工具中的表达差异分析功能,探索乳腺癌组织和正常乳腺组织中MMP11的表达差异;还利用此在线工具中的相关分析功能,分析目标基因MMP11与和肿瘤干细胞标志物CD133、Oct4、ANTXR1、CD55之间的关系。
2.2. UALCAN数据库
UALCAN数据库是一个交互式在线工具,用于分析TCGA和CPTAC数据,提供基因表达、生存关联、表观遗传调控(如甲基化)的可视化分析,支持癌症类型、分期、分子亚型等多维度查询,助力肿瘤研究(https://ualcan.path.uab.edu/index.html)。
2.3. HPA数据库
HPA数据库是人体蛋白质图谱数据库(Human Protein Atlas),提供组织、细胞和肿瘤的蛋白质表达数据,结合免疫组化、单细胞RNA测序和亚细胞定位信息,帮助研究人员了解蛋白质在不同组织和细胞类型中的表达及定位(https://www.proteinatlas.org)。
2.4. TIMER数据库
TIMER数据库是一个综合数据库,基于TCGA数据量化免疫细胞浸润水平,主要功能是通过算法系统在线分析乳腺癌的肿瘤微环境中免疫细胞的浸润与MMP11基因的表达的关系(https://cistrome.shinyapps.io/timer/)。
2.5. KM Plotter数据库
KM Plotter数据库是一个在线进行生存分析的网站,可针对GEO数据库和TCGA数据库中的基因和癌症样本展开研究,评估在多种癌症中基因对生存率的影响,包括4种肿瘤的预后信息,分别为乳腺癌,卵巢癌,肺癌和胃癌(https://kmplot.com/analysis/)。
2.6. Cancer SEA数据库
Cancer SEA数据库是一个单细胞测序数据库,专注于肿瘤单细胞功能状态分析,整合了来自25种癌症类型的单细胞RNA-seq数据,可系统解析14种关键功能状态(如转移、耐药、代谢重编程等)相关的基因特征(http://biocc.hrbmu.edu.cn/CancerSEA/)。
2.7. 统计学方法
统计方法均采用生信数据库默认的方法,认为P < 0.05有统计学意义。
3. 结果
3.1. MMP11基因相对表达量
使用GEPIA数据库在线分析,在291例乳腺正常组织和1085例乳腺癌组织中,MMP11在癌组织中高表达(P < 0.05) (图1(a))。使用TIMER数据库进行泛癌分析发现MMP11在乳腺癌组织中高表达(图1(b))。
(a)
(b)
(c) (d) (e)
Figure 1. Expression of MMP11 in breast cancer tissues and normal tissues and its relationship with clinicopathology
图1. MMP11在乳腺癌组织和正常组织中的表达及其与临床病理的关系
(a) 正常乳腺组织; (b) 乳腺癌组织; (c) 亚细胞定位
Figure 2. Immunohistochemical image of MMP11 protein in HPA database (×100)
图2. HPA数据库中MMP11蛋白的免疫组织化学图像(×100)
Figure 3. Differences in methylation levels of the MMP11 gene
图3. MMP11基因甲基化水平的差异
使用UALCAN数据库进一步探究临床病理特征与表达量的关系,发现MMP11表达水平与病理学分子分型有关,其中Luminal型乳腺癌相比于三阴性乳腺癌表达上调(图1(c));与淋巴结转移程度也相关(N2与N0) (图1(d));但MMP11的表达在不同分期的乳腺癌中无统计学意义(P > 0.05) (图1(e))。通过HPA数据库中的免疫组化染色证实MMP11蛋白在乳腺癌组织中相比于正常乳腺组织中高表达,且在高尔基体和细胞质中表达尤为明显(图2)。
3.2. MMP11基因与甲基化之间的关系
通过UALCAN数据库在线分析我们发现MMP11是1个去甲基化基因,甲基化的差异程度在乳腺癌组织和正常乳腺组织中有统计学意义(P < 0.05) (图3)。
3.3. MMP11表达水平与乳腺癌干细胞之间的关系
通过GEPIA2数据库在线分析,我们发现乳腺癌干细胞标志物ANTXR1、CD55与MMP11基因的表达呈正相关(P < 0.05),而CD133、Oct4与MMP11基因的表达无明显相关(R < 0.3) (图4)。
Figure 4. Relationship between MMP11 expression and ANTXR1, CD55, CD133, and Oct4 in breast cancer tissues
图4. 乳腺癌组织中MMP11的表达和ANTXR1、CD55、CD133、Oct4的关系
3.4. MMP11基因表达与乳腺癌患者总生存期的关系
通过KM Plotter数据库进行生存预后分析我们发现MMP11高表达患者相比于MMP11低表达患者相比有更短的总生存期(P < 0.05) (图5)。
Figure 5. Relationship between MMP11 gene and overall survival (OS) in breast cancer patients
图5. MMP11基因与乳腺癌患者总生存期(OS)的关系
3.4.1. 不同亚型乳腺癌患者
在4种乳腺癌分型中,Her2阳性型、Luminal A型、Luminal B型患者的MMP11的表达和患者总生存期(OS)呈正相关,差异有统计学意义(P均<0.05),见图6。
3.4.2. 不同淋巴结转移状态下乳腺癌患者MMP11基因表达与总生存期的关系
在未发生淋巴结转移的患者中,MMP11的表达和患者总生存期(OS)呈正相关,差异有统计学意义,见图7。
3.5. MMP11在单细胞中的功能状态分析
通过CancerSEA数据库进行功能相关性分析表明,在单细胞水平,乳腺癌细胞中MMP11基因表达与表皮间质转化、细胞增殖呈负相关(r = −0.600、−0.540,P均<0.05) (图8)。
注:(A) Her2 阳性型;(B) Luminal A型;(C) Luminal B型;(D) 基底型。
Figure 6. Relationship between MMP11 gene expression and overall survival in patients with different subtypes of breast cancer
图6. 不同亚型乳腺癌患者MMP11基因表达与总生存期的关系
注:(A) 淋巴结未转移患者;(B) 淋巴结转移患者。
Figure 7. Relationship between MMP11 gene expression and overall survival in breast cancer patients with different lymph node metastases
图7. 不同淋巴结转移状态下乳腺癌患者MMP11基因表达与总生存期的关系
(a)
(b)
(c)
Figure 8. Functional correlation analysis of MMP11 in a single cell
图8. MMP11在单个细胞里的功能相关性分析
4. 讨论
随着高通量检测和分析技术的快速发展,生物信息学技术可对海量的肿瘤数据进行收集和整理,它是以计算机为工具,利用信息技术收集、组织和分析肿瘤学研究中的数据,并根据不同的研究目的建立了多个具有不同功能的数据库。仅仅依靠传统的实验观察手段并不能挖掘其中隐匿且未被认识的大量生物学知识,而生物信息学的出现可以做到理论先行,再行实验验证,为我们预测癌症靶点提供了方向[18]。
本研究基于GEPIA、TINER数据库分析发现,MMP11在乳腺癌中高表达。基于UALCAN数据库发现,MMP11的表达水平与乳腺癌分型以及淋巴结转移状态有关。除了分析表达差异,还分析了乳腺癌中MMP11的表达水平与预后的关系,结果显示MMP11高表达的乳腺癌患者的总体生存期更短,从而推测MMP11是一种促癌基因。为了更进一步了解MMP11在乳腺癌中的上下游分子及功能网络,利用STRING数据库和Cancer SEA数据库分析了与MMP11蛋白的上下游及相互作用的蛋白,在单细胞水平上分析了MMP11蛋白在乳腺癌中发挥的作用,结果显示MMP11基因表达与表皮–间质转化、细胞增殖呈负相关。
预后分析提示MMP11高表达与预后差相关,然而在单细胞中MMP11表达与细胞增殖呈负相关,两者看似矛盾,可能有以下原因。第一,预后反映的是患者所有基因改变的整体结果,单个基因表达的改变未必反映出整体情况。第二,MMP11作为一种上皮膜蛋白,其可能的作用机制是肿瘤微环境中的介质与周围细胞的相互作用,生信中的单细胞分析无法实现这一点。尽管如此,单细胞分析仍为我们提供了在单个细胞水平上的预测。
与生信在线分析得出的结果一致,Zhuang Y通过临床样本和TCGA数据集证实MMP11在乳腺癌中高表达且与乳腺癌患者的不良预后密切相关,且通过MTT实验证实MMP11促进癌细胞的进展[19]。Han J等人则证实所有乳腺癌亚型中淋巴结阳性患者发生远处转移的风险增加显著[20]。现有研究表明,在胰腺癌和EGFR突变的肺腺癌中MMP11作为预后生物标志物与免疫浸润相关[8] [21],而在乳腺癌中的关系尚不明确,通过分析与免疫微环境中多种干细胞标志物的关系发现,MMP11的表达会影响原始干细胞数量,正因如此,免疫微环境才同时具有抗癌和促癌两方面的效果,既有消灭肿瘤细胞的潜力,也可能促进肿瘤的发展与迁移,取决于干细胞的动态变化。
尽管如此,本文仍存在一定的局限性。第一,本研究使用了大量公开数据库中的数据,但是否适合于国人仍需进一步考虑。第二,涉及MMP11的分子机制和通路的问题还需通过体内外实验进一步来验证。但尽管存在如此多的不确定性,该研究仍可为以MMP11为靶点的乳腺癌的诊治提供新的思路。
NOTES
*通讯作者。