1. 背景
经典的家族性高胆固醇血症(familial hypercholesterolemia, FH)是一种常染色体(共)显性遗传病,其主要临床表现为血清低密度脂蛋白胆固醇(low density lipoprotein-cholesterol, LDL-C)水平明显升高,以及皮肤/腱黄色瘤[1]。FH患者也有着较高的动脉粥样硬化性心血管疾病(arteriosclerotic cardiovascular disease, ASCVD)发病风险,原因可能与全身动脉胆固醇沉积所致动脉粥样硬化斑块形成有关[2]。最新的一项涉及730万人的荟萃分析数据显示,FH的总体患病率约为1:313,冠心病患者的患病率是普通人群的18倍[3]。尽管FH对心血管系统的危害较大,但大多数国家对于FH的明确诊断不足1% [4]。我国研究显示在心肌梗死患者中FH的检出率为0.41% [5]。FH病因机制复杂,考虑是遗传、环境等多种因素共同作用的结果[6]。目前,关于FH诊断主要依据临床表现,需要结合基因检测来进一步明确。近年来,随着分子生物学技术的发展,全基因组测序应用于临床辅助诊断技术已经成熟[7] [8]。而且FH基因检测已经成为国际公认的FH早期诊断方法和金标准[9],大约85%~90%确诊FH患者和大约40%疑似FH患者可以确定已知的致病基因突变[10]。
FH主要由于低密度脂蛋白受体(low density lipoprotein recepter, LDLR)代谢通路上影响着LDLR对血浆游离LDLC进行回收的相关基因发生突变[11],目前发现导致FH发病的主要基因突变包括LDLR基因、载脂蛋白-B基因(apolipoprotein-B, APOB)、前蛋白转化酶枯草溶菌素9 (proprotein convertase subtilisin/kexin type 9, PCSK9),最常见的是LDLR基因突变[12]。目前已知其他罕见基因突变有LDLR衔接蛋白1 (low density lipoprotein receptor adaptor protein 1, LDLRAP1)、载脂蛋白E (Apolipoprotein E, APOE)、信号转导衔接蛋白-1突变(STAP1) [13]、三磷酸腺肝结合转运蛋白G5和G8 (ATP-binding cassette sub-family G member 5 or 8, ABCG5 or ABCG8) [14]、胆固醇酯酶(lysosomal acid lipase, LIPA) [15]等。了解基因变异的功能是揭示FH的遗传基础的关键,因此,本实验拟通过对内蒙古地区FH患者进行全外显子测序,检测内蒙古地区FH人群常见基因突变的发生情况以及是否具有罕见基因突变,为FH的发病机制提供重要的遗传学依据,早期发现FH患者,科学管理以降低心血管疾病发病率。
2. 研究方法
2.1. 研究对象
本实验选择自2022年9月至2024年12月内蒙古地区20例FH患者,抽取患者空腹静脉血测定血脂水平,包括总胆固醇(Total Cholesterol, TC)、甘油三酯(Triglycerides, TG)、高密度脂蛋白胆固醇(High density lipoprotein cholesterol, HDL-C)及低密度脂蛋白胆固醇(Low-density Lipoprotein cholesterol, LDL-C)的测定,秉承自愿原则并签署知情同意书,详细采集20位患者病例资料。
2.1.1. 诊断标准
《家族性高胆固醇血症筛查与诊治中国专家共识》[1]中提出的FH的诊断标准。
2.1.2. FH患者纳入标准
(1) 符合FH临床诊断标准或基因检测诊断明确的家族性高胆固醇血症患者。
(2) 临床资料完整,具有血液样本。
(3) 血压正常、无肝脏、肾脏及甲状腺疾病和糖代谢疾病。
(4) 一级亲属中有FH或冠心病患者。
2.1.3. FH患者排除标准
肝肾功能异常、甲状腺功能异常、垂体功能异常、系统性红斑狼疮、多发性骨髓瘤等疾病导致的血脂异常,植物固醇血症、全身免疫性疾病或恶性肿瘤等。
2.2. 研究方法
(1) 提取DNA收集到20位患者外周血标本进行基因检测,提取血液DNA,使用试剂盒为德国Qiagen公司全血DNA提取试剂盒,按照说明书进行实验。
(2) 全外显子测序将采集的20个gDNA样本送至诺禾致源生物科技有限公司进行全外显子测序,所有患者标本得到参考序列或参考基因组,将20位患者得到的参考序列进行生物信息分析。
(3) 千人基因组计划数据库、ESP数据库、dbSNP 数据库以及ExAC数据库,对测序结果中的多态性位点予以剔除。完成筛选后,针对剩余12位患者的基因数据进行FH已知基因的筛选。
(4) 通过SIFT、MutationTaster以及PolyPhen-2功能预测软件对候选基因突变进行有害性预测。
(5) Sanger测序对筛选出的候选基因设计突变引物,PCR扩增;对得到的PCR产物电泳后使用紫外分光仪验证,确定扩增产物的存在;然后对PCR扩增产物进行Sanger测序,验证患者FH基因突变的存在。
(6) MutationTaster对突变后产生的氨基酸序列进行保守性分析。
(7) 运用ExPASY软件预测突变后蛋白质的疏水性,应用Swiss Model、pymol构建突变前后三维蛋白结构。
3. 结果
3.1. 临床结果
在本研究中最终纳入12名内蒙古地区受试者,受试者之间不存在血缘关系,并且他们的配偶也非近亲。有关受试者的详细临床信息,见表1,男性患者10名,女性患者2名,初次就诊年龄38.63 ± 6.15岁,血LDL-C平均值9.59 ± 1.63 mmol/L,ASCVD患者占比33.33%,66.67%具有FH家族史,详细临床统计信息见表2。
Table 1. Analysis of the clinical characteristics of 12 patients with FH
表1. 12例FH患者临床特征分析
编号 |
初次就诊
年龄(岁) |
性别 |
TG
(mmol/L) |
TC (mmol/L) |
HDL-C (mmol/L) |
LDL-C (mmol/L) |
ASCVD |
FH家族史 |
1 |
14 |
男 |
1.04 |
15.15 |
1.81 |
12.62 |
否 |
是 |
2 |
5 |
男 |
1.04 |
21.02 |
0.42 |
15.78 |
否 |
是 |
3 |
14 |
男 |
1.20 |
21.5 |
2.47 |
18.57 |
否 |
是 |
4 |
13 |
男 |
1.31 |
20.98 |
0.75 |
19.28 |
否 |
是 |
5 |
33 |
男 |
1.64 |
10.6 |
2.05 |
7.83 |
否 |
是 |
6 |
32 |
男 |
1.36 |
9.87 |
0.82 |
9.00 |
否 |
是 |
7 |
49 |
男 |
1.32 |
5.73 |
1.07 |
4.01 |
是 |
否 |
8 |
53 |
女 |
1.22 |
9.59 |
1.51 |
7.53 |
否 |
是 |
9 |
50 |
男 |
2.11 |
9.15 |
1.18 |
7.44 |
否 |
否 |
10 |
68 |
女 |
1.75 |
4.95 |
1.31 |
3.27 |
是 |
是 |
11 |
49 |
男 |
1.76 |
6.29 |
1.00 |
5.22 |
是 |
否 |
12 |
62 |
男 |
6.04 |
6.04 |
0.76 |
4.58 |
是 |
否 |
注:TG:甘油三酯;TC:总胆固醇;HDL-C:高密度脂蛋白胆固醇;LDL-C:低密度脂蛋白胆固醇;ASCVD:动脉粥样硬化性心血管疾病;FH:家族性高胆固醇血症。
Table 2. Statistics of the clinical data of 12 patients
表2. 12例患者临床资料统计
资料 |
数据 |
初次就诊平均年龄(岁) |
38.63 ± 6.15 |
性别 |
|
男/女 |
10/2 |
TG平均值(mmol/L) |
1.82 ± 0.40 |
TC平均值(mmol/L) |
11.73 ± 1.82 |
HDL-C平均值(mmol/L) |
1.26 ± 0.17 |
LDL-C平均值(mmol/L) |
9.59 ± 1.63 |
ASCVD |
|
是/否 |
4/8 |
FH家族史 |
|
是/否 |
8/4 |
3.2. 全外显子测序结果
本研究纳入12名患者均进行FH基因检测,结果显示,12名患者FH突变基因全部为LDLR基因突变,突变基因详细信息见表3。
LDLR基因突变位点有10个,各突变位点分布在 3、4、5、9、10、13、14、17号外显子,基因突变以点突变为主,错义突变6个,同义突变1个,其中4个点突变导致该位点氨基酸突变后成为终止密码子对应氨基酸,移码突变2个,剪切突变2个。患者2和4为复合突变,患者4发现c.2416InsG为第2416位发生了鸟嘌呤插入突变,c.1216C>A为第1216位,胞嘧啶突变为腺嘌呤,为同义突变。患者7和10发生g.17327G>A,内含子5的起始位置的第一个核苷酸位置上,正常的鸟嘌呤被替换为腺嘌呤,破坏正常的剪接信号,患者12发现的g.13426G>A,内含子3起始位置的第一个核苷酸,鸟嘌呤被替换为腺嘌呤,并破坏了该内含子的供体剪接位点。这导致转录本出现3号外显子的框内缺失。这些基因导致了由LDLR基因编码的LDLR结构及功能发生改变,根据全外显子测序及数据分析所得的基因利用Sanger测序法将突变点进行逐一验证,12名患者Sanger测序结果见图1。
Figure 1. Results of Sanger sequencing
图1. Sanger测序结果
Table 3. The information of gene mutations in 12 patients
表3. 12位患者基因突变信息
编号 |
基因 |
染色体位置 |
外显子 |
核苷酸改变 |
蛋白质改变 |
功能改变 |
1 |
LDLR |
chr19:11224300 |
10exon |
c.1448G>A |
p.W483* |
终止 |
2 |
LDLR |
chr19:11224300 |
10exon |
c.1448G>A |
p.W483* |
终止 |
chr19:11230782 |
13exon |
c.1860G>A |
p.W620* |
终止 |
3 |
LDLR |
chr19:11216187 |
4exon |
c.605T>C |
p.F202S |
错义 |
4 |
LDLR |
chr19:11240214_11240215 |
17exon |
c.2416InsG |
p.V806Gfs |
移码 |
chr19:11223983 |
9exon |
c.1216C>A |
- |
同义 |
5 |
LDLR |
chr19:11224300 |
10exon |
c.1448G>A |
p.W483* |
终止 |
6 |
LDLR |
chr19:11216187 |
4exon |
c.605T>C |
p.F202S |
错义 |
7 |
LDLR |
chr19:11200037 |
exon5+1 |
g.17327G>A |
- |
剪切 |
8 |
LDLR |
chr19: 1120382 |
14exon |
c.2000delG |
p.C667Lfs |
移码 |
9 |
LDLR |
chr19:11217309 |
5exon |
c.763T>C |
p.C255R |
错义 |
10 |
LDLR |
chr19:11200037 |
exon5+1 |
g.17327G>A |
- |
剪切 |
11 |
LDLR |
chr19:11224020 |
9exon |
c.1253A>G |
p.E418G |
错义 |
12 |
LDLR |
chr19:11102787 |
exon3+1 |
g.13426G>A |
- |
剪切 |
注:LDLR:低密度脂蛋白受体基因;APOB:载脂蛋白-B基因;Exon:外显子;Intron:内含子;c,编码DNA序列;del,缺失;>:碱基替换;ins:表示插入;*:终止;fs表示从该位置开始移码突变;A:腺嘌呤;G:鸟嘌呤;C:胞嘧啶;T:胸腺嘧啶;G:甘氨酸;V:缬氨酸;F:苯丙氨酸;W:色氨酸;S:丝氨酸;C:半胱氨酸;H:组氨酸;R:精氨酸;E:谷氨酸。
3.3. 基因致病性预测
将发现的LDLR基因突变位点进行致病性预测,发现12位患者基因突变位点,运用SIFT、MutationTaster、Polyphen-2进行致病性预测,结果显示:c.605T>C导致原本处于蛋白质第202位的苯丙氨酸被丝氨酸所取代,c.763T>C导致原本处于蛋白质第255位的半胱氨酸被精氨酸所取代,c.1253A>G导致原本位于蛋白质第418位的谷氨酸被甘氨酸所取代,SIFT、MutationTaster、Polyphen-2预测均提示该突变基因为致病基因,剩余基因突变位点运用MutationTaster预测为致病突变,结果显示见表4。
Table 4. The pathogenicity of mutation sites predicted by the functional prediction software
表4. 功能预测软件突变位点致病性
基因名称 |
碱基改变 |
氨基酸改变 |
SIFT |
MutationTaster |
Polyphen-2 |
LDLR |
c.1448G>A |
p.W483* |
- |
Disease causing |
- |
LDLR |
c.1860G>A |
p.W620* |
- |
Disease causing |
- |
LDLR |
c.605T>C |
p.F202S |
Damaging |
Disease causing |
Damaging |
LDLR |
c.2416InsG |
p.V806Gfs |
- |
Disease causing |
- |
LDLR |
c.1216C>A |
- |
- |
Disease causing |
- |
LDLR |
g.17327G>A |
- |
- |
Disease causing |
- |
LDLR |
c.2000delG |
p.C667Lfs |
- |
Disease causing |
- |
LDLR |
c.763T>C |
p.C255R |
Damaging |
Disease causing |
Damaging |
LDLR |
c.1253A>G |
p.E418G |
Damaging |
Disease causing |
Damaging |
LDLR |
g.17327G>A |
- |
- |
Disease causing |
- |
3.4. 突变区域保守性分析
本研究使用蛋白保守性分析软件预测各突变位点氨基酸保守性分析,对比了多个物种LDLR的序列,结果发现多个物种的LDLR蛋白在该位点处高度保守,这证明了c.1448G>A、c.1860G>A、c.605T>C、c.2416InsG、c.2000delG、c.763T>C、c.1253A>G在进化上是保守的,该位点的突变容易导致疾病的产生,c.1216C>A、g.17327G>A、g.13426G>A无保守性发生改变,保守性分析结果见图2。
Figure 2. Conservation analysis
图2. 保守性分析
3.5. 蛋白亲水性与疏水性预测
对突变后的LDLR进行亲水–疏水性预测是否改变LDLR的功能。ExPASY软件预测结果显示:c.1448G>A、c.1860G>A、c.605T>C、c.2416InsG、c.2000delG、c.763T>C、c.1253A>G突变前后蛋白质亲疏水性发生改变,c.1216C>A、g.17327G>A、g.13426G>A无亲疏水性改变,亲疏水性分析结果见图3。
Figure 3. Analysis of hydrophilicity and hydrophobicity
图3. 亲疏水性分析
3.6. 构建突变前后三维蛋白结构
使用Swiss Model、pymol软件对突变后的蛋白质进行建模预测,结果显示:c.1448G>A、c.1860G>A、c.2416InsG、c.2000delG可见明显的蛋白质结构缺失,c.605T>C、c.763T>C、c.1253A>G可见突变前后蛋白质发生改变,这可能影响蛋白之间的相互作用,同时破坏蛋白本身的性质,结果见图4。
Figure 4. Three-dimensional protein structures before and after mutation
图4. 突变前后三维蛋白结构
4. 讨论
本研究中针对内蒙古地区20位FH患者的gDNA进行全外显子测序,对得到的结果进行过滤分析,筛查结果提示12名患者LDLR基因突变,设计引物对患者外周血进行Sanger验证,证实12个标本中的基因突变,分别是:c.1448G>A、c.1860G>A、c.605T>C、c.2416InsG、c.1216C>A、g.17327G>A、c.2000delG、c.763T>C、c.1253A>G、g.13426G>A。利用预测软件预测各个突变位点提示有害突变且有致病性,MutationTaster预测多个物种的LDLR在该位点处高度保守,这证明了c.1448G>A、c.1860G>A、c.605T>C、c.2416InsG、c.2000delG、c.763T>C、c.1253A>G在进化上是保守的,该位点的突变容易导致疾病的产生。ExPASY软件预测突变后编码的LDLR结果提示亲疏水性发生了改变,软件构建的模型显示突变后LDLR空间结构发生改变,从而影响了蛋白功能。
LDLR基因由18个外显子和17个内含子组成,长度约为45 kb,定位于染色体19p13.2,由839个氨基酸组成,其中包括21个氨基酸的信号肽,有5个结构域:半胱氨酸富集区(Cysteine-rich region),主要功能是结合配体,亦称为配体结合结构域(Ligand binding structuredomain);表皮生长因子前体结构域(EGFprecursor structure domain),大约由400个氨基酸残基组成,其结构与EGF前体有33%的同源,有5个重复序列;含O-连接糖链结构域(O-linked sugarsstructure domain),位于膜外,由58个氨基酸残基组成;跨膜结构域(Memberrance spanning structuredomain),由22个氨基酸残基组成;胞浆结构域(Cytoplasmic structure domain),位于受体的C末端,深埋于胞浆中[16]。
LDLR是一种存在于细胞膜中的跨膜蛋白,通过与血浆中的LDL结合,并促进其作为受体-配体复合物通过网格蛋白介导的内吞作用被细胞内化,在早期核内体(endosomes, EE)中,LDLR从低密度脂蛋白中分离出来,并被分类到再循环核内体(recycling endosomes, RE)中运输到质膜。不能从LDL中分离或被细胞外或细胞内因子标记为降解的受体留在成熟的内体系统中,在晚期内体和溶酶体(late endosomes and lysosomes LELs)中降解。LDL受体介导的内吞作用、受体再循环和受体的反馈调节,在维持胆固醇稳态中起着至关重要的作用[17]-[19]。LDLR基因突变导致单基因FH的最主要原因之一,可导致肝脏表面特异性的LDLR数量减少或缺乏,或产生无功能活性的LDLR,使得肝脏对循环中LDL的清除下降,从而造成血浆TC和LDL-c水平升高,引发高胆固醇血症[20]。LDLR致病突变引起的FH严重程度与LDLR蛋白产物的功能直接相关[21]。高胆固醇血症患者血管中积聚的LDL颗粒逐渐被氧化形成氧化低密度脂蛋白( oxidized LDL, ox-LDL),较高浓度的ox-LDL破坏内皮细胞完整性,并诱导血管壁内巨噬细胞泡沫化引发一系列的炎症反应,从而促进动脉粥样硬化的发生发展[22]。
外显子10中发现c.1448G>A,导致第483位氨基酸由色氨酸突变为终止密码子,导致蛋白质截短,缺乏EGF前体结构域[23],导致剩余的LDLR表达水平为81%,但LDL结合活性只有17%,LDL内化只有39% [24]。c.605T>C位于配体结合域中,该区域包含7个重复序列,重复序列5由外显子4编码。重复序列5的突变可能会影响LDLR与其受体通过APOB-100 (Apolipoprotein B-100, APOB)的结合,c.2000delG突变位于编码表皮生长因子前体同源结构域的区域,移码突变导致可能会阻断细胞内 LDLR 蛋白的转运[25]。c.763T>C位于配体结合域,由外显子2至6编码,基因突变可能影响配体结合结构域介导与脂蛋白的相互作用。c.1860G>A、c.2000delG、c.1253A>G三个突变位于由外显子7至14编码的EGF前体同源结构域上,参与内吞机制中受体和脂蛋白的解离。c.2416InsG位于外显子17,外显子17的剩余部分和外显子18的5'末端编码的50个氨基酸胞质尾部参与蛋白质的内吞作用[26]。因此发生在以上位置上的LDLR基因突变可能对LDLR识别LDL以及其自身的循环可能产生较大的影响。g.17327G>A是LDLR基因第5号内含子的第一个碱基由G突变为A (IVS5+1G>A)是一种剪切突变,这种突变会影响mRNA的剪接过程,导致异常的mRNA生成,进而影响LDLR蛋白的正常合成和功能,g.13426G>A (IVS3+1G>A)为剪切突变,碱基替换改变了高度保守的二核苷酸GT,GT是供体剪接位点GT(A/G)AG识别信号的一部分[27],导致了mRNA错误剪接,从而产生一种缺失结合域中第二个富含二硫键重复序列的突变受体蛋白,导致低密度脂蛋白受体缺陷[28]。
本研究的优点在于运用对FH全外显子测序的方法,对FH患者进行遗传学分析,筛选出内蒙古地区FH基因突变位点,筛查得出关于LDLR基因突变的10个位点,为FH患者进行遗传学诊断,全外显子测序结果经Sanger测序验证,为FH的遗传学研究做出了一定贡献。
同时,我们也充分认识到本研究的不足:样本数量相对较少、收集样本为内蒙古地区是我们研究的一个局限性,这可能导致在特殊的候选基因中鉴定变异。需要更多的样本量来验证这些发现,需要更多的功能研究来确认这些变异的致病作用。
5. 结论
我们运用WES结合正常人数据库过滤的方法,在内蒙古地区FH患者中筛选到LDLR基因10个位点基因突变。为内蒙古地区FH患者早期发现提供可靠的技术手段与坚实的科学依据,助力实现疾病的早诊早治,有效改善患者的生活质量与预后状况。FH的常见遗传方式为常染色体显性遗传,大部分FH患者的致病基因遗传来源于父母,FH患者的孩子有50%的患病可能。对患者及其家庭成员提供必要的遗传咨询,同时对高风险胎儿进行产前诊断,为家系优生优育提供理论基础。