1. 引言
G蛋白偶联受体(G-protein-coupled receptors, GPCRs)是最大的一类细胞膜蛋白家族,批准上市的药物中超过三分之一作用于GPCRs [1] 。神经降压素受体-1 (the neurotensin receptor 1, NTSR1)属于A类GPCR家族,主要与内源性多肽神经降压素(neurotensin, NTS)特异性结合,在中枢神经系统、心血管系统、胃肠道消化系统中表现出重要的生物学活性,被认为是治疗帕金森病、精神分裂症、高血压和癌症的关键靶点 [2] [3] [4] [5] 。深入理解NTSR1的功能机制对于合理药物设计而言至关重要。
在实验研究方面,2012年White等人首次解析了NTSR1结合多肽激动剂NTS的复合物晶体结构,揭示了内源性配体的结合模式 [6] 。2019年Kato等人报道了NTSR1偶联Gi1蛋白的复合物冷冻电镜结构,展示了受体处于完全活化状态的构象 [7] 。然而,静态的实验结构不足以描述NTSR1复杂的激活过程。在理论研究方面,分子动力学(molecular dynamics, MD)模拟被广泛地用于探索NTSR1的结构与功能关系。2015年Lee等人利用MD模拟研究了影响NTSR1热稳定性的结构和能量因素 [8] 。2018年Cong等人的MD模拟指出NTSR1中正构口袋的小幅振荡能够改变W3216.48残基的侧链指向,进而调控受体激活 [9] 。2020年Nagarajan等人的MD模拟捕捉到了NTSR1 F3587.42A突变体的构成性激活 [10] 。
对于研究生物大分子的结构与功能关系而言,实验成本过于昂贵,MD模拟又耗时漫长,粗粒化的弹性网络模型(elastic network model, ENM)恰好能够解决这些问题。高斯网络模型 [11] (Gaussian network model, GNM)和各向异性网络模型 [12] (anisotropic network model, ANM)是研究蛋白质结构动力学的两种有效的ENM,后者额外考虑了残基运动的方向性,能够提供更丰富的动力学信息。在ENM中,低频慢运动模式通常描述了与蛋白质功能相关的大尺度协同运动,而高频快运动模式则反映了蛋白质局部结构的不规则性,其下高涨落的残基被认为是稳定蛋白质结构的热点 [13] 。此外,基于ENM的运动相关性分析可以揭示残基间的协同关联程度 [14] 。进一步,微扰响应扫描(perturbation-response scanning, PRS)方法还可被用于进一步识别蛋白质变构效应中的关键残基 [15] 。
2. 材料与方法
2.1. 研究体系
从蛋白质数据库(Protein Data Bank)中下载类活性态的NTSR1晶体结构(PDB ID: 6YVR [16] ) (见图1(a))。去除融合蛋白后,初始结构包含7个跨膜螺旋(transmembrane helixes, TMs, TM1-TM7: I61-K92, S97-V131, G138-H173, S182-M208, T231-G275, P297-I334, T340-V372)、2个胞内环(intracellular loops, ICLs, ICL1-ICL2: K93-Q96, P174-M181)和3个胞外环(extracellular loops, ECLs, ECL1-ECL3: H132-F137, G209-D230, S335-W339),ICL3未被解析,共计285个残基,采用Ballesteros等人定义的GPCR残基编号方案 [17] ,残基的上标被标记为X.YY,数字X对应于残基所在的TM螺旋(从1到7),YY为相对于该螺旋中最保守的残基(YY值为50)的位置。若TM3中最保守的残基是Arg167,则其标识符为3.50,即Arg1673.50。对于残基Y3246.51,表示在TM6中最保守残基Pro3236.50之后的第1个残基处。
Figure 1. (a) Crystal structure of NTSR1 (PDB ID: 6YVR) and (b) distribution of important conserved motifs
图1. (a) NTSR1的晶体结构(PDB ID: 6YVR)和(b) 重要保守基序的分布
2.2. 各向异性网络模型
在ANM中,蛋白质的三维结构被粗粒化为弹性网络,残基简化为网络中的节点,通常用Cα原子表示。当节点间距离小于截断半径rc (本文选取30 Å)时,认为节点间存在相互作用,用弹簧连接。基于上述简化,体系的势能可表示为:
(1)
其中,Rij和
分别为节点i和节点j之间的瞬时向量和平衡向量,γ为连接两节点间弹簧的力常数,N为网络中节点的个数。蛋白质的运动模式由Hessian矩阵H决定:
(2)
势能的二阶导数hij是H的子矩阵,当i ≠ j时,hij可表示为:
(3)
当i = j时可表示为:
(4)
分解H矩阵得到3 × N个特征值和特征向量,特征值小的特征向量描述的低频慢运动模式对应与蛋白质功能相关的大尺度协同运动;特征值大的特征向量则反映了与蛋白质结构稳定性相关的高频快运动模式。在ANM中,残基的均方涨落(mean square fluctuations, MSFs)可表示为:
(5)
残基间的交叉相关涨落可表示为:
(6)
kB是玻尔兹曼常数,T是绝对温度。H−1是H的逆矩阵。
残基间归一化的运动相关系数可表示为:
(7)
其中,Cij介于−1和1之间,正值表示残基间的运动方向相似,绝对值越接近于1,残基间的运动相关性越高。
2.3. 微扰响应扫描
微扰响应扫描用于计算扰动残基i时残基j的响应,识别与蛋白质变构有关的重要残基。基于胡克定律F = HΔR,计算受到外力扰动后所有残基位置的改变量ΔR。对残基i施加外力Fi:
(8)
所有残基的位置改变量ΔR可表示为:
(9)
在本项工作中对每个残基分别施加7个方向的单位力,包括x、y、z、xy、xz、yz和xyz方向(xy方向:1,1,0),得到响应矩阵P。矩阵中每列的平均值用来衡量该残基影响其他残基的能力,代表该残基的效应性,位于效应性曲线峰值附近的残基与信号转导有关;每行的平均值对应该残基的敏感性,对应峰值处的残基通常是与蛋白质变构有关的功能性位点 [18] 。
3. 结果与讨论
3.1. 基于ANM的实验与理论均方涨落比较
B因子(B-factor),又称温度因子,可以表征生物大分子的结构柔性。B因子越大,蛋白质的结构柔性越高。残基的均方涨落与B因子的变化趋势一致 [11] ,准确预测MSFs是基于ANM研究蛋白质结构动力学的基础。如图2(a)所示,白色背景标记了跨膜螺旋区域(TM1-TM7),灰色背景则标记了连接跨膜螺旋的Loop区域(ICL1-ICL2, ECL1-ECL3),在最优参数下ANM计算的理论MSFs与实验B因子之间的皮尔逊相关系数(Pearson’s correlation coefficient, PCC)达到0.62。将ANM计算的理论MSFs映射到受体的三维结构上,红色和蓝色分别表示MSF值的高低(见图2(b))。其中,MSF较大的残基主要分布在连接跨膜螺旋的Loop区域,这与其相对松散的残基排列方式有关;MSF较小的残基则集中在跨膜螺旋区域,体现了α-螺旋内残基的紧密堆叠,这与此前研究一致 [8] 。综上,ANM能够较好地再现NTSR1的结构柔性数据,适用于后续的详细分析。
Figure 2. (a) Distribution of MSFs calculated by ANM and experimental B-factors at the residue level; (b) mapping of theoretical MSFs calculated by ANM on the three-dimensional structure of NTSR1
图2. (a) ANM计算的MSFs和实验B-factors在残基水平上的分布;(b) ANM计算的理论MSFs在NTSR1三维结构上的映射
3.2. NTSR1的低频慢运动模式分析
在生物大分子中,大尺度的功能性构象变化通常与全局低频慢运动模式相关。此前研究表明,慢运动模式下MSF较小的残基可能充当了GPCR激活过程中的关键节点 [19] 。为了进一步研究NTSR1的结构动力学性质,图3(a)展示了受体在前两个慢运动模式下的均方涨落分布。如图所示,MSF分布的低谷多位于跨膜螺旋区域,峰值则对应胞外侧与胞内侧的连接Loop区域,表明基于ANM的低频慢运动模式可以较好地区分NTSR1不同的结构域。
在A类GPCR中有6个序列保守但空间疏离的重要基序:CWxP、PI (A) F、NPxxY、钠离子结合口袋(Na+-binding pocket)、疏水锁(hydrophobic lock)和离子锁(ionic lock) (见图1(b))。在钠离子结合口袋中,钠离子的结合将受体的构象系综偏向失活状态,从而减弱受体与激动剂的亲和力 [6] 。如图3(a)所示,从前两个慢运动模式下MSF较小的区域中(如图3(a)中标记)成功识别出了保守的钠离子结合口袋残基,如TM2中的D1132.50、TM3中的T1563.39、TM7中的S3617.45和N3657.49。其中,D1132.50是NTSR1关键的钠离子配位残基,此前研究发现D1132.50A突变严重削弱了NTSR1与G蛋白(G-proteins)的偶联并显著抑制了内源性激动剂NTS介导的生物学活性 [20] 。此外,D1132.50与T1563.39、S3627.46和NPxxY基序中的N3657.49共同构成了广泛的氢键网络,从而稳定钠离子结合口袋,驱使受体偏向活性状态 [21] 。因此,上述残基可能充当了NTSR1信号转导路径的关键微开关。
3.3. NTSR1的高频快运动模式分析
蛋白质局部结构的不规则性可以由高频快运动模式描述。在快运动模式下,MSF较大的残基通常作为稳定蛋白质结构的热点。图3(b)展示了受体在前两个快运动模式下残基的MSF分布。高涨落的残基集中在跨膜螺旋的中心区域,其中包含:D1132.50、A1573.40、V3136.40/V3146.41和F3587.42,它们均位于NTSR1的重要保守基序。D1132.50参与钠离子结合口袋的形成,再次体现了其重要作用。A1593.40位于PI (A) F基序,被称为经典的传输开关(transmission switch),偶联胞外侧正构口袋和胞内侧G蛋白结合位点,进而调控受体激活 [22] [23] 。V3136.40和空间上邻近的V3146.41、V1603.43共同构成了TM6-TM3之间的疏水锁,在受体激活过程中,疏水锁的打开促进了TM6胞内侧外移 [24] 。F3587.42位于NTSR1正构口袋下方,与W3216.48和Y3246.51共同构成了一个疏水簇。F3587.42A突变直接影响了W3216.48的动力学性质,导致NTSR1构成性激活 [8] 。综上,基于ANM的高频快运动模式识别出的残基在NTSR1激活过程中发挥着关键作用。
Figure 3. Distribution of MSFs calculated by ANM corresponding to the first two slow (a); and fast; (b) motion modes at the residue level
图3. ANM计算的前两个慢运动(a);和快运动;(b) 模式对应的MSFs在残基水平上的分布
3.4. 运动相关性分析
Figure 4. (a) Motion correlation between residues in NTSR1; (b) distribution of motion correlation coefficients between the CWxP motif and the rest of the receptor
图4. (a) NTSR1中残基间的运动相关性;(b) CWxP基序与受体其他部分之间的运动相关系数分布
残基间的运动相关系数可以衡量蛋白质内部运动的关联程度 [14] 。为了提高信噪比,基于对残基均方涨落贡献大于50%的慢运动模式集合进行了运动相关性分析。如图4(a)所示,红色区域代表了残基间的正相关运动,蓝色区域则表示负相关。沿运动相关性矩阵的对角线可以较为清晰地将受体结构划分为7个独立的区域,分别对应TM1-TM7,且相邻跨膜螺旋间的运动呈现出显著的正相关性,再次表明ANM能够准确区分NTSR1不同的结构域。此外,重要保守基序之间也存在较强的正相关运动。特别地,CWxP和NPxxY基序分别调控TM6和TM7胞内侧的移动,直接影响下游效应蛋白的结合 [7] [25] 。将CWxP基序与其他残基之间的运动相关系数(见图4(a),R1区域)加和后计算平均值,得到其与受体其他部分之间的运动相关系数分布(见图4(b))。
如图所示,TM2中的D1132.50、TM3中的T1563.39、A1573.40、E1663.49和R1673.50、TM5中的P2495.50和TM7中的NPxxY与CWxP基序之间的运动均呈现出显著的正相关性。其中,D1132.50和T1563.39是钠离子的配位残基,E1663.49和R1673.50属于胞内侧的离子锁,A1573.40和P2495.50是PI (A) F基序的一部分。钠离子结合口袋和PI (A) F基序在前文中已有提及,这里不再赘述。E1663.49与R1673.50之间的盐桥又被称为离子锁,在受体的激活过程中,TM6外移会破坏该组静电相互作用,重新定位R1673.50的侧链至受体G蛋白结合位点的中心,直接参与G蛋白α5亚基的识别 [7] 。综上,NTSR1中重要基序间的运动相互关联,是受体激活通路中的重要组成节点。
3.5. 微扰响应扫描分析
Figure 5. (a) Sensitivity-effector matrix of NTSR1 and distribution of sensitivity, (b) and effectiveness, (c) coefficients at the residue level
图5. (a) NTSR1的敏感–效应性矩阵及敏感性,(b) 和效应性,(c) 系数在残基水平上的分布
基于线性响应理论,微扰响应扫描是研究蛋白质变构路径的有效方法,已被广泛地用于揭示信号转导过程中的关键节点 [15] 。如图5(a)所示,通过构建NTSR1的敏感–效应性矩阵以识别受体胞外侧正构口袋与胞内侧G蛋白结合位点之间变构通讯的关键残基。高敏感性残基主要分布在靠近正构口袋和效应蛋白结合位点的Loop区域及TM5/TM6胞内侧(见图5(b))。实验结构表明,正构口袋附近的Loop区域直接与内源性多肽NTS接触,这种结合模式导致了正构口袋的收缩,与受体激活有关 [16] 。此外,ECL2作为A类GPCR的门控开关,其构象变化影响配体的亲和力和选择性 [26] 。胞内侧效应蛋白结合位点附近的高敏感残基(包括TM5/TM6胞内侧、ICL1和ICL2)则选择性参与不同效应蛋白介导的信号通路 [7] [27] 。如图5(c)所示,效应性曲线共有6个局部峰值,其中包含D1132.50、T1563.39和W3216.48。重要的是,W3216.48被称为A类GPCR中的“toggle switch” [22] 。此前研究表明,W3216.48的侧链指向受到F3587.42控制,前者的侧链倾斜弯曲了TM6胞内侧,打开一个容纳G蛋白的空腔 [9] 。综上,通过PRS识别出的关键残基参与配体的结合与变构信号传递,主导了NTSR1的变构调控。
4. 结论
本项工作探索了NTSR1的结构动力学并识别出了与受体变构信号转导相关的重要残基。首先,通过构建最优参数的ANM,实验与理论B-factor的PCC达到0.62,较好地区分了受体不同的结构域,验证了理论模型的合理性。然后,从低频慢运动模式下的MSF中识别出了保守的钠离子结合口袋,强调了钠离子配位残基在NTSR1激活过程中的调控作用。对高频快运动模式而言,从高涨落的残基中识别出了一些重要的保守基序,如PI (A) F基序、疏水锁等,共同构成了NTSR1变构信号转导路径上的关键节点。此外,运动相关性分析表明受体重要基序之间的运动还存在较强的正向关联。最后,采用PRS方法对受体进行微扰,敏感性高的区域主要位于胞外侧正构口袋和胞内侧效应蛋白结合位点附近,分别参与配体识别和效应蛋白偶联。重要的是,从效应性曲线中识别出了高度保守的W3216.48“toggle switch”。作为A类GPCR激活过程中最为关键的结构元件,W3216.48的侧链构象变化直接触发了TM6胞内侧的运动。这项工作有助于深入对NTSR1功能机制的理解,为基于结构的药物设计提供了理论指导。
NOTES
*通讯作者。