1. 引言
2型糖尿病(T2DM)是一种由胰岛素抵抗和胰岛素分泌不足引起的慢性代谢性疾病,已经成为全球公共卫生领域的重大挑战,且其血糖管理问题亟待解决。二肽基肽酶-4 (DPP-4)是体内广泛分布的一类酶[1],能够降解胰高血糖素样肽-1 (GLP-1)等重要的肽类激素,从而抑制胰岛素分泌,影响血糖的代谢调节。由于GLP-1在餐后能够促进胰岛素分泌、抑制胰高血糖素的释放,并增强饱腹感,从而显著降低血糖水平,抑制DPP-4活性以延长GLP-1的生物学效应时间,已成为2型糖尿病治疗中的重要策略之一。
目前,DPP-4抑制剂作为一种提升内源性GLP-1水平的药物,已在临床上广泛应用,如西格列汀、维格列汀和沙格列汀等[2]。这些药物展现出温和的降糖效果,并且具有较低的低血糖风险。然而,现有的DPP-4抑制剂在选择性、持续作用时间以及安全性方面仍存在一定的局限性,因此,研发新型高效、长效且安全的DPP-4抑制剂,已成为2型糖尿病治疗领域的重要研究方向。
传统DPP-4抑制剂研发依赖经验法筛选靶点,效率低下、成本高昂且成功率低。为此,计算机辅助药物设计(CADD)技术应运而生,成为突破传统药物发现瓶颈的创新手段。CADD技术凭借其精确模拟生物体内复杂分子间相互作用及有效预测化合物生物活性的能力,显著加速了药物研发进程,降低了研发成本和失败风险[3]。其中,结构为基础的药物设计(SBDD)方法尤为关键,已成功推动伊马替尼[4]、茚地那韦[5]、尼洛替尼[6]和Lifitegrast [7]等突破性药物的发现,验证了CADD技术的高效性和可靠性,并凸显了分子动力学模拟在SBDD中的广泛应用。
为开发新型DPP-4抑制剂,本研究将采用基于结构的虚拟筛选技术对化合物库进行高效筛选,并运用分子动力学模拟对筛选出的化合物进行深入分析。该方案旨在快速筛选并验证具有成药潜质的DPP-4抑制剂,为后续实验研究提供有力参考,推动T2DM治疗药物的研发进程。
2. 方法
2.1. 蛋白和配体小分子蛋白准备
蛋白质结构数据从RCSB PDB数据库下载,检索得到DPP4与抑制剂西格列汀结合的共晶结构(PDB ID: 1X70)作为本研究的计算分析基础。该共晶结构的分辨率为2.10 Å,西格列汀的结合亲和力在0.35~18 nM范围内。为了准备蛋白质结构,我们使用了Maestro 13.0软件包中的Protein Preparation Wizard模块进行处理。首先,添加了必要的键序和电荷,并去除了所有水分子。接着,向蛋白质体系中添加了氢原子,并进行了氢原子的取向优化。此外,在pH值为7.2的条件下,我们对氨基酸进行了正确的质子化预测,并使用OPLS4力场对整个结构进行了能量最小化。这些准备步骤确保了蛋白质模型在后续计算和分析中具备正确的化学和物理特性。
本研究中使用的天然产物库由上海桃术生物科技有限公司提供,该库专为高通量虚拟筛选设计。化学结构通过Chemdraw绘制,并导出为mol格式。随后,利用Maestro 13.0中的LigPrep模块对分子进行OLPS4力场优化,模拟生理条件。优化步骤包括能量最小化、固定手性构型,并生成至少5个构象。最终,将优化结果存储为mo12格式,完成小分子配体的准备工作。
2.2. 对接盒子的准备
对接盒子文件就是一个描述受体结合位点周围的三维空间区域的结构文件,通常由格点坐标和与每个格点相关的能量信息组成。这些信息被用于在对接过程中指导分子在该区域内进行合适的空间搜索,使得小分子配体与受体蛋白有一个合理的结合构象
对接盒子是对接模拟中用于限定小分子搜索空间的关键工具,其作用是精确包裹活性口袋,从而提高对接的准确性。在本研究中,我们使用Maestro 13.0中的受体格点准备模块(Receptor Grid Generation)生成了对接盒子文件。在生成过程中,我们选择了共晶结构中小分子的质心作为活性口袋的中心,以确保对接盒子能够精确覆盖目标区域。基于此设置,我们计算并生成了体积为10 × 10 × 10 Å3的对接盒子文件。这一配置不仅有效限定了小分子的搜索空间,还提高了对接模拟的准确性,确保小分子与受体之间的相互作用能够被精准捕捉。
2.3. 分子对接
分子对接是一种广泛应用于虚拟筛选的建模工具,旨在预测配体与靶标蛋白之间的结合模式与结构[8]。这种方法不仅能够揭示配体小分子与靶标蛋白之间的相互作用,还能推测化合物的亲和力和潜在活性。在进行基于结构的虚拟筛选时,我们计划利用Maestro 13.0软件中的Virtual Screening Workflow (VSW)模块,结合Qikprop、Ligprep、Glide等核心工具进行筛选。首先,我们将运用深度学习分类过滤技术对候选分子进行初步筛选,为后续的结构基础虚拟筛选做准备。接下来,通过Receptor Grid Generation模块生成适用于对接的格点文件,并使用Glide的高通量虚拟筛选(HTVS)进行对接。在对接中,我们将选取得分前10%的化合物进入下一轮筛选,从而提升最终筛选的质量,并结合现有的药物化学经验对筛选结果进行目视筛选,从中挑选出潜在的活性化合物供进一步研究。
2.4. 分子动力学模拟
分子动力学模拟是一种通过计算机模拟方法研究物质分子在特定条件下的运动和相互作用的技术。该方法基于经典力学,通过数值计算解决原子或分子随时间变化的运动轨迹[9]。
在本研究中,我们使用了Maestro软件的Desmond模块进行分子动力学模拟,并在Linux系统上进行计算。首先,通过Desmond的SystemBuilder模块构建周期性溶剂模型,力场为OPLS3e,水溶剂模型为SPC,周期性盒子设置为正交立方体,溶剂与蛋白质之间的边界距离设定为10 Å。为了保证体系的电中性,加入Na+和Cl-离子。
使用Minimization模块对体系进行了优化,优化过程的参数设置为最大迭代次数2000次,能量收敛值为1 kcal/mol。优化后的体系在NPT系综下进行分子动力学模拟。模拟过程中,温度控制使用Nose-Hoover热浴,压力使用Martyna-Tobias-Klein压浴(1 atm)。模拟的总时长为100 ns,每0.1 ns输出一次能量和坐标信息。
模拟结束后,我们得到了100 ns的分子动力学轨迹,并使用Simulation Interaction Diagram模块对轨迹进行了分析。通过计算RMSD (均方根偏差)来评估蛋白质–配体复合物的稳定性,同时计算RMSF (均方根波动)、蛋白–配体接触等数据,以观察蛋白结构的波动性。
此过程的结果为进一步分析和筛选潜在的高活性化合物提供了可靠的模拟依据。
2.5. ADMET预测
在完成虚拟筛选后,我们计划对筛选出的候选分子进行详细的ADMET (吸收、分布、代谢、排泄和毒性)评估以及Lipinski规则[10]的计算,以全面评估其药物类似性和生物学适应性。具体而言,我们将利用Qikprop工具来预测这些分子的ADMET特性,包括生物降解性、肝毒性、以及血脑屏障的穿透能力等关键指标。同时,我们将检验候选分子是否符合Lipinski规则,从而确保其具备药物化学空间的基本要求,如适宜的分子量、合理的疏水性、以及氢键供体和受体的数量。通过这一步骤,我们将筛选出具有优良药物性质的化合物,为后续的药物开发奠定坚实的基础,并优化其在临床应用中的潜力。
3. 结果
3.1. 筛选结果
我们针对内部化合物库(包含303,171个分子)执行了全面的ADMET预测,成功筛选出了286,373个分子。随后,在HTVS (高通量虚拟筛选)阶段,我们进一步缩减了候选分子范围,获得了222,122个分子。为了进一步优化筛选结果,我们选取了HTVS阶段得分前10%的分子,即22,292个分子,进行了更为精确的SP计算。经过这一轮的精细化筛选,我们又从中挑选了前10%的分子,共计2,256个,进行了MM-GBSA计算,以评估其结合能。最终,从这些分子中筛选出209个具有较高潜在活性的化合物。结合所有筛选数据,我们进行了手动筛选,挑选出若干具有高潜力的化合物用于活性测试。筛选结果如表1所示,表中包含了每个化合物的2D结构、分子量、对接打分及其主要相互作用残基。
Table 1. The top 6 compounds in terms of docking score
表1. 对接打分前6的化合物
Compound |
Structure |
Weight |
Docking score |
Interacting residues |
1 |
|
277.2788 |
−8.829 |
TYR666 TYR662 PHE357 GLU206 GLU205 |
2 |
|
369.5010 |
−9.580 |
TYR666 PHE357 GLU206 GLU205 |
3 |
|
305.4400 |
−9.673 |
TYR666 TYR662 GLU206 GLU205 |
4 |
|
352.3980 |
−8.761 |
TYR666 TYR662 PHE357 GLU206 GLU205 ARG125 |
5 |
|
295.4300 |
−10.217 |
TYR666 GLU206 GLU205 |
6 |
|
326.8144 |
−8.556 |
TYR666 TYR662 PHE357 |
3.2. 对接结合模式分析
Figure 1. Schematic diagram of the interaction between compounds 1-6 (A-F)
图1. 化合物1-6 (A-F)相互作用模式图
对排名前五的化合物与DPP4蛋白的结合模式进行分析,结果表明,这些化合物与DPP4蛋白的主要相互作用包括氢键、π-π堆积相互作用和盐桥作用(图1)。
化合物1:与DPP4蛋白的结合主要通过与五个氨基酸残基的相互作用来稳定。具体而言,化合物1通过与残基TYR666和PHE357形成π-π堆积相互作用,并与TYR662、GLU206和GLU205形成氢键。同时,GLU206与化合物1之间形成了盐桥。
化合物2:与DPP4蛋白的结合通过与四个氨基酸残基的相互作用来稳定。化合物2与残基TYR666和PHE357形成π-π堆积相互作用,并与GLU206和GLU205形成氢键。同时,GLU206和GLU205也与化合物2形成盐桥。
化合物3:与DPP4蛋白的结合主要通过与四个氨基酸残基的相互作用来稳定。化合物3通过与TYR666和TYR662形成π-π堆积相互作用,并与GLU206形成氢键。此外,GLU206和GLU205也与化合物3形成盐桥。
化合物4:与DPP4蛋白的结合通过与六个氨基酸残基的相互作用来稳定。化合物4与TYR666、TYR662和PHE357形成了π-π堆积相互作用,并与GLU206形成氢键。同时,GLU205与化合物4形成盐桥,并且ARG125与化合物4之间形成了π-cation相互作用。
化合物5:与DPP4蛋白的结合通过与三个氨基酸残基的相互作用来稳定。化合物5与TYR666形成π-π堆积相互作用,并与GLU206和GLU205形成氢键,同时,GLU206和GLU205也与化合物5形成盐桥。
化合物6:与DPP4蛋白的结合通过与三个氨基酸残基的相互作用来稳定。化合物6与PHE357形成π-π堆积相互作用,并与TYR662形成氢键,并且TYR666与化合物6之间形成了π-cation相互作用。
这些结果表明,化合物与DPP4蛋白的结合主要通过氢键、π-π堆积相互作用和盐桥等非共价作用力来稳定,尤其是GLU206和GLU205残基在多个化合物的结合过程中起到了关键作用。
3.3. 分子动力学分析
3.3.1. RMSD分析
MD模拟的结果有力地证实了蛋白质与小分子抑制剂之间形成了稳定的结合。在图2中,我们采用了均方根偏差(RMSD)作为评估标准,以监测模拟过程中蛋白质结构的稳定性。经过50纳秒(ns)的模拟,所有复合物的RMSD值均稳定地保持在1.0 Å以下的范围内。这一结果清晰地表明,系统已经达到了热平衡状态,并趋于稳定,从而有力地证明了动力学模拟的可靠性和有效性。
(A) (B)
(C) (D)
(E) (F)
Figure 2. PL-RMSD of compounds 1-6 (A-F)
图2. 化合物1-6 (A-F)蛋白质–配体根均方偏差
3.3.2. RMSF分析
进一步的均方根波动(RMSF)分析,如图3所示,深入探究了蛋白质–配体复合物在50纳秒(ns)模拟期间各氨基酸残基的波动性。结果显示,所有化合物与蛋白质结合后,其RMSF值大部分维持在3 Å以下的较低水平,这明确指示出化合物结合显著地提升了蛋白质结构的稳定性,展现出较低的结构波动性。
(A) (B)
(C) (D)
(E) (F)
Figure 3. P-RMSF of compounds 1-6 (A-F)
图3. 化合物1-6 (A-F)蛋白质均方根波动
3.3.3. 蛋白配体相互作用分析
在分子动力学(MD)模拟的结果中,通过图4我们观察到小分子1至6与DPP4抑制剂的结合机制呈现出多样化的特点。具体来说,小分子1主要通过与GLU_206和TYR662形成氢键与水桥,同时与TYR666产生疏水作用,来实现对DPP4的抑制结合。小分子2则通过与GLU205、GLU206和TYR662形成氢键或水桥,并与PHE357、TYR659、TYR666、ARG669和VAL711产生疏水作用,来抑制DPP4的活性。小分子3的抑制机制涉及与GLU206形成氢键,与GLU205产生离子作用与水桥,以及与PHE357、TYR662和TYR666的疏水作用。小分子4较为简单,它通过与GLU206形成氢键与水桥,并与PHE357产生疏水作用,来抑制DPP4。小分子5的抑制机制则包括与GLU205和TYR662形成氢键与离子作用,以及与TYR631、TYR666、VAL656和TRP659 (尽管TRP659在标准DPP4结构中可能不是关键残基,但在此模拟中显示出相互作用)的疏水作用。最后,小分子6通过与GLU205、GLU206和ARG669形成氢键,与PHE357和TYR666产生疏水作用,并与TYR670 (尽管TYR670通常不是DPP4的关键残基之一,但在此模拟中显示出额外的氢键作用)形成氢键,来抑制DPP4的活性。
Figure 4. Protein-ligand interactions of compounds 1-6 (A-F)
图4. 化合物1-6 (A-F)蛋白–配体相互作用
Figure 5. Protein-ligand interactions of compounds 1-6 (A-F) within 50 ns
图5. 50 ns内化合物1-6 (A-F)蛋白–配体相互作用
通过分析图5数据,我们观察到这六组化合物尽管都与多个氨基酸产生了相互作用,但在整个模拟过程中,配体与这些关键氨基酸的结合并非始终如一地稳定。结合之前的RMSD (均方根偏差)分析及蛋白–配体相互作用研究,我们发现化合物1、3和4在整体表现上相对更为稳定,这与我们的预期要求相吻合。因此,我们决定将化合物1、3和4作为命中化合物,进行更为深入的后续分析。这些化合物在模拟过程中展现出的稳定性,为它们成为潜在的有效抑制剂提供了有力的支持。
4. 结果
本研究通过综合运用计算机辅助药物设计(CADD)技术中的基于结构的药物设计(SBDD)策略,成功从庞大的内部化合物数据库中筛选并鉴定出了三个具有显著潜力的DPP4 (二肽基肽酶4)抑制剂分子。为了实现这一目标,我们首先采用了高通量虚拟筛选(HTVS)技术,它能够迅速缩小候选分子的范围,显著提高了筛选效率。在高通量筛选的基础上,我们通过精确的分子对接技术进一步评估了这些候选分子与DPP4蛋白活性位点的结合能力和亲和力。通过对分子对接结果的深入分析,我们确认了这三个分子在与目标蛋白结合时表现出高度的契合性和较强的结合亲和力。进一步地,我们应用分子动力学模拟技术,模拟了这些分子与DPP4蛋白在动态环境中的相互作用。模拟结果为我们提供了关于这些分子与目标蛋白结合稳定性和持久性的关键见解,验证了它们在实际生物环境中可能的稳定性和药理活性。
经过这一系列严谨且系统的筛选流程,我们最终确认了这三个DPP4抑制剂分子。它们在理论计算中展现出优异的结合特性,并且与目标蛋白具有高度契合性,表明它们具有潜在的生物活性和药物开发前景。研究结果为后续的实验验证、结构优化和药物开发研究奠定了坚实的基础,并为糖尿病及相关代谢性疾病的治疗提供了新的解决方案。
NOTES
*通讯作者。