1. 引言
全基因组关联分析(genome-wide association study, GWAS)是通过整个人类基因组来寻找常见遗传变异的可见性状间关系的研究方法 [1] [2]。有关食管癌发病风险的分子基础研究已有许多报道,并发现许多基因多态变异与食管癌高风险有关 [3] [4] [5]。但是,这些研究检测的单核苷酸多态(single nucleotide polymorphism, SNP)位点太少,多数是以单个或数个SNP变异与食管癌关系分析,研究样本量较小(多数只有几百例),人群也比较单一,很难得出重要的结论。直到GWAS技术应用于食管癌研究,才一改以往的小样本、单基因的研究思路,而一跃成为一次检测100万个SNPs,大样本、多层验证并配以强大的统计分析,从而发现与我国汉族人群相关的食管癌易感基因。
2010年来,通过对中国人群食管癌进行大样本GWAS研究,研究者们相继发现了食管癌患者新的易感基因及变异SNPs。这些遗传变异不但存在累积作用而且其中一些变异以基因–环境交互作用方式共同增加了食管癌发病风险。
2. PLCE1、C20orf54
河南王立东教授领衔的研究小组在2010年对2.5万例中国汉族、哈萨克族、维族食管癌实验组和对照组进行GWAS初筛(1077例食管癌和1733例对照,506,666个SNPs)和验证(17,673例汉族食管癌和11,013例对照,2303例哈萨克族食管癌和537例对照,18个SNPs)基础上,发现2个中国人群食管鳞状细胞癌(esophageal squamous cell carcinoma, ESCC)重要易感位点rs2274223、rs13042395 [6],分别定位于10q23的磷脂酶CE1 (phospholipase C epsilon 1, PLCE1)和20p13的核黄素转运基因(chromosome 20 open reading frame 54, C20orf54,又称:human riboflavin transporter 2, hRFT2)上。rs2274223是一位于PLCE1基因第26个内含子处的一非同义SNP,可使组氨酸改变为精氨酸,从而改变其所编码蛋白质序列,增加食管癌发病风险。PLCE1在调节细胞的增生、分化、凋亡和血管增生中起重要作用;研究报道食管癌组织PLCE1基因突变频率较高(62%) [7],来自美国的研究也证明PLCE1基因变异与头颈鳞状细胞癌有关 [8]。RFT2是核黄素转运蛋白编码基因,其编码蛋白可将核黄素由细胞外转运入细胞内。核黄素有助于细胞自稳态的维持,其缺乏可增加食管癌发病风险,膳食补充核黄素可有效降低其发病风险 [9]。
3. PDE4D、RUNX1
林东昕教授领衔研究团队在2011年通过对2031例ESCC患者和2044例对照的外周血DNA进行GWAS,该研究团队对发现的相关666,141个SNP在6276例ESCC患者和6165例对照进行验证,结果显示位于5q11、6p21、10q23、12q24和21q22的7个SNP与食管癌易感性相关 [10]。其中rs10052657定位于5q11上的PDE4D基因的第5内含子上,是一C-AMP磷酸二酯酶成员,可控制CAMP水平,调节细胞周期分化、代谢,影响其基因的表达。相关研究曾报道肿瘤中PDE4D纯合子缺失,提示其可作为一潜在的肿瘤抑制因子 [11]。PDE4D基因多态性增加了食管癌易感性。rs2014300位于RUNX1基因第2内含子上,其可与周围环境相互作用演变为一致癌基因 [12]。研究显示RUNX1功能异常可导致某些自身免疫性疾病发生,提示其在维持免疫系统稳态方面发挥重要作用。
4. ADHIB、ALDH2
上述该研究团队在2012年通过对2031例中国ESCC,2044例对照进行GWAS初筛基础上,又对8092例ESCC和8620例对照验证,发现了9个新的食管癌易感位点 [13]。其中位于4q23,16q12.1,17q21,22q12,3q27,17p13和18p11染色体上的7个SNPs有重要边缘效应。我们知道,4q23染色体上有一个编码乙醛脱氢酶(ADH)家族(ADH7, ADH1C, ADH1B, ADH1A, ADH6, ADH4, ADH5)的基因富集区。ADH能氧化酒精为乙醛,参与与酒精代谢相关肿瘤的发生发展 [14]。ADH变异导致饮酒者食管癌发病风险增加。定位于12q24号染色体上的ALDH2与食管癌发病风险相关,其编码乙醛脱氢酶-2,可使乙醛快速分解为乙酸。联合基因型分析发现携带ADH1B基因多态性位点rs1042026 GA、GG基因型和携带ALDH2基因多态性位点rs11066015GA、GG基因型饮酒者与无其等为基因的饮酒者和有其等位基因的非饮酒者相比,食管癌发病风险增加。
5. SLC39A6
该研究团队在2013年在对1331例中国ESCC患者初筛和1962例ESCC进行GWAS 验证基础上,使发现的669,802个SNP进入最后的生存关联分析。生存分析结果显示位于SLC39A6基因的rs1050631变异与ESCC患者预后相关 [15],SLC39A6基因5'-UTR的rs7242481是具有生物学功能改变的遗传变异,其G > A变异改变了5'-UTR与未知核蛋白的结合能力,从而影响SLC39A6表达,这可能是该SNP与ESCC患者生存时间显著相关的生物学基础。
6. TMEM173、ATP1B2
2014年由上述两研究团队与美国Tailyor研究团队三方合作,通过对5337例ESCC和5787例健康对照初筛和9654例ESCC和10,058例对照验证的GWAS研究基础上,鉴定出两个变异SNPs位点rs7447927和rs1642764,分别位于TMEM173和ATP1B2基因上 [16]。研究发现定位于TMEM173上的rs7447927变异增加了食管癌发病风险。TMEM173能促进机体通过产生I型干扰素对抗细菌或病毒的初始化免疫反应 [17]。ATP1B2为Na+,K+-ATP酶β2亚基,广泛存在于组织细胞的细胞膜上,负责细胞膜内、外Na+、K+的被动转运,参与维持静息状态下细胞膜内外Na+、K+的不均衡分布。rs1642764为一17p13.1上的ATP1B2基因上的内含子SNP,该变异存在于包括TP53 3'区的一连锁不平衡区。rs1642764变异可增加食管癌发病风险。
7. 展望
GWAS研究发现的SNPs效应相互联系,其对机体产生影响的方式可能是多个基因变异体相互作用或者与环境的相互作用。通过找寻中国人群食管癌遗传易感基因位点,进一步阐明食管上皮细胞癌变的演进机制以及SNP变异造成的体内蛋白水平的改变等,可为临床食管癌患者的个体化分子药物靶向治疗奠定基础,并有望建立食管癌个体化防控新策略。
基金项目
河南省教育厅高等学校重点科研项目(17B320012,20B320011);南阳医专博士基金项目(2015NYYZBSJJ01)。