抗乳腺癌候选药物的优化建模
Optimal Modeling of Anti-breast Cancer Drug Candidate
摘要: 雌激素受体α亚型(ERα)是临床重要的药物靶点,治疗乳腺癌候选药物的化合物需能拮抗ERα活性。采用建立化合物活性预测模型的方法来筛选乳腺癌候选药物可降低药物研发的时间和成本。本文先利用随机森林对分子描述符对生物活性的贡献度排序,然后按变量相关性进行系统聚类,采用斯皮尔曼相关系数确定与生物活性相关性最显著的20个变量。接着利用神经网络建立化合物对ERα生物活性的定量预测模型,对比预测与实际结果。然后利用二次SVM构建化合物ADMET性质分类预测模型。最后,利用粒子群算法进行目标寻优,确定分子描述符及其取值使得生物活性和ADMET性质最优。本文模型能很好预测具有更好生物活性的新化合物分子,能实现可作为临床治疗乳腺癌候选药物的化合物的筛选。
Abstract: Estrogen receptors alpha (ERα) is an important clinical drug target, and the candidate drug com-pounds for breast cancer should be able to antagonize ERα activity. The method of establishing a compound activity prediction model to screen candidate drugs for breast cancer can reduce the time and cost of drug development. In this paper, the contribution degree of molecular descriptors to biological activity is ranked by random forest, and then systematic clustering is carried out ac-cording to the correlation of variables. Spearman correlation coefficient is used to determine the 20 variables with the most significant correlation with biological activity. Then, establishing a quantitative prediction model for the biological activity of ERα by neural network, and comparing the prediction with the actual results. Then the ADMET property classification prediction models are constructed by quadratic SVM. Finally, particle swarm optimization (PSO) algorithm is used to optimize the target, and the molecular descriptors and their values are determined to optimize the biological activity and ADMET properties. The proposed model can well predict novel compound molecules with better biological activity and realize the screening of compounds that can be used as candidate drugs for clinical treatment of breast cancer.
文章引用:胥阳, 孟威, 姚稀杰. 抗乳腺癌候选药物的优化建模[J]. 建模与仿真, 2022, 11(1): 28-39. https://doi.org/10.12677/MOS.2022.111003

参考文献

[1] 耿冲. 姜黄素促进ER alpha阴性乳腺癌他莫昔芬敏感的机制研究[D]: [博士学位论文]. 济南: 山东大学, 2016.
[2] 许兆伟. CHES1通过调节ERα活性影响乳腺癌增殖的分子机制[D]: [博士学位论文]. 大连: 大连理工大学, 2018.
[3] 王正国, 饶含兵, 李泽荣. 机器学习方法用于选择性环氧化酶-2抑制剂活性预测模型的建立[J]. 化学研究与应用, 2006, 18(11): 5.
[4] 胡姗姗. 药物互作数据的挖掘与预测研究[D]: [博士学位论文]. 合肥: 安徽大学, 2019.
[5] 李伟, 杨金才, 黄牛. 深度学习在药物设计与发现中的应用[J]. 药学学报, 2019, 54(5): 761-767.
[6] 邓志罗. 基于生物相关谱的化合物活性预测及其网络服务实现[D]: [硕士学位论文]. 武汉: 华中农业大学, 2013.
[7] 张向东, 毕韶丹, 关宏宇. 拮抗药化合物活性的支持向量机研究[J]. 辽宁大学学报(自然科学版), 2005, 32(3): 229-233.
[8] 胡小英. 化合物的生物活性和毒性的计算预测研究[D]: [博士学位论文]. 北京: 北京化工大学, 2012.
[9] 刘俊良. 基于主客观情感测量的用户产品偏好分析及预测研究[D]: [硕士学位论文]. 沈阳: 东北大学, 2017.
[10] 夏世远, 苏建徽, 杜燕, 汪海宁, 施永. 基于贝叶斯正则化BP神经网络的PEMFC电堆建模[J]. 合肥工业大学学报(自然科学版), 2021, 44(7): 895-899.
[11] 于沛轩. 基于机器学习技术的有害藻华关键预测问题研究[D]: [硕士学位论文]. 沈阳: 山东大学, 2020.
[12] 刘斌. 非线性系统建模及预测控制若干问题研究[D]: [博士学位论文]. 杭州: 浙江大学, 2004.
[13] 殷豪, 陈云龙, 孟安波, 林艺城. 基于二次自适应支持向量机的光伏输出功率预测[J]. 太阳能学报, 2019, 40(7): 1866-1873.
[14] 陈云龙, 殷豪, 黄强, 周亚武. 光伏出力的模糊区间预测[J]. 宁夏电力, 2017(5): 39-44.
[15] 卓金武, 李必文, 魏永生, 等. MATLAB在数学建模中的应用[M]. 北京: 北京航空航天大学出版社, 2014.
[16] 张争辉. 电动汽车充电站规划方法研究[D]: [硕士学位论文]. 长沙: 湖南大学, 2015.
[17] 仲毅. 基于粒子群算法的企业项目群优化研究[D]: [硕士学位论文]. 西安: 西安电子科技大学, 2014.