数据挖掘技术在医学领域的应用综述
A Review of the Application of Data Mining Technology in Medical Field
DOI: 10.12677/ACM.2023.13122817, PDF,   
作者: 阿依波塔·沙尔木哈买提:新疆医科大学,中医学院,新疆 乌鲁木齐 ;安冬青*:新疆医科大学,新疆名医名方与特色方剂学实验室,新疆 乌鲁木齐
关键词: 数据挖掘医疗领域的应用综述Data Mining Applications in the Medical Field Review
摘要: 医疗大数据的复杂性源于疾病及其合并症的多样性;治疗和疗效的异质性;医疗数据获取、处理、解读以及研究设计和分析方法的复杂性。由于DM具有处理海量、非线性复杂信息以及发现庞大的数据背后隐藏的巨大潜在价值的优势,应用于医疗数据挖掘有望提高医疗质量、优化医疗流程和管理策略。本文概述数据挖掘各个算法的同时从现代医和学祖国传统医学等方面入手综述数据挖掘技术在医疗领域的应用。
Abstract: The complexity of medical big data stems from the diversity of diseases and their comorbidities; heterogeneity of treatment and efficacy; complexity of medical data acquisition, processing, inter-pretation, research design and analysis methods. Since DM has the advantages of processing mas-sive, non-linear and complex information and discovering huge potential value behind huge data, the application of medical data mining is expected to improve medical quality, optimize medical process and management strategy. This paper summarizes the application of data mining technol-ogy in the medical field from the aspects of modern medicine and traditional medicine of the moth-erland.
文章引用:阿依波塔·沙尔木哈买提, 安冬青. 数据挖掘技术在医学领域的应用综述[J]. 临床医学进展, 2023, 13(12): 20001-20007. https://doi.org/10.12677/ACM.2023.13122817

参考文献

[1] 吉根林, 孙志挥. 数据挖掘技术[J]. 中国图象图形学报, 2001(8): 2-8.
[2] 肖铮. 常用的三种分类算法及其比较分析[J]. 重庆科技学院学报(自然科学版), 2020, 22(5): 101-106.
[3] 李燕. 海量数据与数据挖掘技术[J]. 医学信息学杂志, 2008, 29(12): 23-25.
[4] Wu, X., Kumar, V., Ross Quinlan, J., et al. (2008) Top 10 Algorithms in Data Mining. Knowledge and Information Systems, 14, 1-37. [Google Scholar] [CrossRef
[5] 范铁兵, 宁秋萍, 杨志旭, 顾东黎, 朱晓博, 燕嫱. 基于数据挖掘技术的中医学隐性知识显性化分析[J]. 中国实验方剂学杂志, 2017, 23(10): 221-226.
[6] 唐敏. 关联规则挖掘算法在超市销售分析中的应用[J]. 计算机科学, 2006, 33(2): 149-150.
[7] 李洪燕, 万新. 基于关联规则分析的产品销售推荐的应用[J]. 四川理工学院学报: 自然科学版, 2013, 26(2): 36-38.
[8] 李昀洲, 陈璐. 考虑需求关联性的多供应商电商库存分配研究[J]. 上海理工大学学报, 2023, 45(2): 180-188.
[9] 赵韩, 刘生强. 基于多维关联规则驱动的新产品配置研究[J]. 合肥工业大学学报: 自然科学版, 2016, 39(12): 1585-1591.
[10] 许海柱, 张婷, 孙建立. 关联规则数据挖掘方法在中医药研究中应用进展[J]. 辽宁中医药大学学报, 2013, 15(12): 131-134. [Google Scholar] [CrossRef
[11] 王磊, 刘东苏. 关联规则挖掘在图书馆信息服务中的应用[J]. 情报杂志, 2008, 27(2): 154-155+158.
[12] 郭鹏, 蔡骋. 基于聚类和关联算法的学生成绩挖掘与分析[J]. 计算机工程与应用, 2019, 55(17): 169-179.
[13] Wu, W.-T., Li, Y.-J., Feng, A.-Z., et al. (2021) Data Mining in Clinical Big Data: The Frequently Used Databases, Steps, and Methodological Models. Military Medical Research, 8, Article No. 44. [Google Scholar] [CrossRef] [PubMed]
[14] 倪鹏飞, 刘高军, 宋璇涛. 中国城市竞争力聚类分析[J]. 中国工业经济, 2003(7): 34-39. [Google Scholar] [CrossRef
[15] 常晶茹, 姚萱航, 张雪薇, 周仪, 刘翠晶, 刘霞. 黄芪属植物DNA条形码与聚类分析的研究[J]. 中草药, 2022, 53(22): 7201-7206.
[16] 唐华松, 姚耀文. 数据挖掘中决策树算法的探讨[J]. 计算机应用研究, 2001, 18(8): 18-19+22.
[17] 张海燕, 刘岩, 马丽萌, 苑津莎, 巨汉基, 魏彤珈. 决策树算法的比较与应用研究[J]. 华北电力技术, 2017(6): 42-47. [Google Scholar] [CrossRef
[18] 林文怡, 宛小燕, 刘元元. 常见新近决策树算法及其在卫生领域中的应用[J]. 现代预防医学, 2019, 46(23): 4233-4237+4242.
[19] Song, Y.-Y., Lu, Y. 用于分类与预测的决策树分析(英文) [J]. 上海精神医学, 2015, 27(2): 130-135.
[20] 何珊, 刘振东, 马小林. 信用评分模型比较综述——基于传统方法与数据挖掘的对比[J]. 征信, 2019, 37(2): 57-61.
[21] Angermueller, C., Pärna-maa, T., Parts, L., et al. (2016) Deep Learning for Computational Biology. Molecular Systems Biology, 12, 878. [Google Scholar] [CrossRef] [PubMed]
[22] 李炳臻, 刘克, 顾佼佼, 姜文志. 卷积神经网络研究综述[J]. 计算机时代, 2021(4): 8-12+17.
[23] 张驰, 郭媛, 黎明. 人工神经网络模型发展及应用综述[J]. 计算机工程与应用, 2021, 57(11): 57-69.
[24] 周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251.
[25] 孙肇阳, 吕桂娇, 郭义, 陈波, 陈勇, 马铭泽. 中医诊疗复杂巨系统的人工神经网络建模原理[J]. 中华中医药杂志, 2022, 37(10): 5841-5844.
[26] Akkus, Z., Galimzianova, A., Hoogi, A., et al. (2017) Deep Learning for Brain MRI Segmentation: State of the Art and Future Directions. Journal of Digital Imaging, 30, 449-459. [Google Scholar] [CrossRef] [PubMed]
[27] 张文修, 梁怡. 遗传算法的数学基础[J]. 西安交通大学学报, 2000, 34(12): 5.
[28] 骆志高, 田海泉, 仇学青. 遗传算法在故障诊断中的应用研究综述[J]. 煤矿机械, 2006(1): 169-172. [Google Scholar] [CrossRef
[29] 李嘉旗, 杨铭, 焦丽静, 黄默菲, 许玲. 基于遗传算法的中医药治疗肺癌核心有效处方的发现及实验研究[J]. 中华中医药杂志, 2018, 33(9): 4143-4146.
[30] Wu, W.-T., Li, Y.-J., Feng, A.-Z., et al. (2021) Data Mining in Clinical Big Data: The Frequently Used Databases, Steps, and Methodo-logical Models. Military Medical Research, 8, Article No. 44. [Google Scholar] [CrossRef] [PubMed]
[31] Lee, C.H. and Yoon, H.J. (2017) Medical Big Data: Promise and Challenges. Kidney Research and Clinical Practice, 36, 3-11. [Google Scholar] [CrossRef] [PubMed]
[32] 梁书彤, 郭茂祖, 赵玲玲. 基于机器学习的医疗决策支持系统综述[J]. 计算机工程与应用, 2019, 55(19): 1-11.
[33] Yu, W., Liu, T., Valdez, R., et al. (2010) Application of Support Vector Machine Modeling for Prediction of Common Diseases: The Case of Diabetes and Pre-Diabetes. BMC Medical Informatics and Decision Making, 10, Article No. 16. [Google Scholar] [CrossRef] [PubMed]
[34] Haldar, P., Pavord, I.D., Shaw, D.E., et al. (2008) Cluster Analysis and Clinical Asthma Phenotypes. American Journal of Respiratory and Critical Care Medicine, 178, 218-224. [Google Scholar] [CrossRef
[35] Mashraqi, A., Halawani, H., Alelyani, T., et al. (2022) Predic-tion Model of Adverse Effects on Liver Functions of COVID-19 ICU Patients. Journal of Healthcare Engineering, 2022, Article ID: 4584965. [Google Scholar] [CrossRef] [PubMed]
[36] Hu, Z., Tang, J., Wang, Z., et al. (2018) Deep Learning for Im-age-Based Cancer Detection and Diagnosis—A Survey. Pattern Recognition, 83, 134-149. [Google Scholar] [CrossRef
[37] 王霄, 朱恩照, 艾自胜. 卷积神经网络的原理及其在医学影像诊断中的应用[J]. 中国医学物理学杂志, 2022, 39(12): 1485-1489.
[38] Acharya, U.R., Fujita, H., Oh, S.L., et al. (2017) Application of Deep Convolutional Neural Network for Automated Detection of Myocardial Infarction Using ECG Signals. Information Sciences, 415-416, 190-198. [Google Scholar] [CrossRef
[39] Nour, M., Cömert, Z. and Polat, K. (2020) A Novel Medical Diag-nosis Model for COVID-19 Infection Detection Based on Deep Features and Bayesian Optimization. Applied Soft Com-puting, 97, Article 106580. [Google Scholar] [CrossRef] [PubMed]
[40] Arunachalam, S. and Sethumathavan, G. (2022) An Effective Tu-mor Detection in MR Brain Images Based on Deep CNN Approach: i-YOLOV5. Applied Artificial Intelligence, 36, Arti-cle 2151180. [Google Scholar] [CrossRef
[41] Karaolis, M., Moutiris, J.A., Hadjipanayi, D., et al. (2010) Assessment of the Risk Factors of Coronary Heart Events Based on Data Mining with Decision Trees. IEEE Transac-tions on Information Technology in Biomedicine, 14, 559-566. [Google Scholar] [CrossRef
[42] 郁小红, 钱棪梅, 周晨洁, 马越, 唐艳超, 邹玲莉. 应用TreeNet算法建立原发性高血压早期预测模型[J]. 预防医学, 2022, 34(9): 923-927. [Google Scholar] [CrossRef
[43] Arenja, N., Breidthardt, T., Socrates, T., et al. (2011) Risk Stratification for 1-Year Mortality in Acute Heart Failure: Classification and Regres-sion Tree Analysis. Swiss Medical Weekly, 141, w13259. [Google Scholar] [CrossRef] [PubMed]
[44] Acharya, U.R., Fujita, H., Oh, S.L., et al. (2017) Application of Deep Convolutional Neural Network for Automated Detection of Myocardial Infarction Using ECG Signals. Information Sciences, 415-416, 190-198. [Google Scholar] [CrossRef
[45] 黄嘉韵, 郭宏, 邝艳萍. 基于决策树算法的鼻鼽辨证规律初步研究[J]. 中华中医药杂志, 2016, 31(11): 4770-4773.
[46] 王星, 刘晓燕. 医疗大数据环境下的疾病预测模型研究[J]. 制造业自动化, 2022, 44(7): 24-27.
[47] 金楠楠, 马堃. 基于聚类及因子分析的功能失调性子宫出血中医证候要素研究[J]. 中国中药杂志, 2008, 33(13): 1622-1625.
[48] 王爱民, 沈兰荪, 赵忠旭. 监督FCM聚类算法及其在中医舌像自动分类中的应用[J]. 模式识别与人工智能, 1999, 12(4): 480-485.
[49] 袁楠, 金晖, 田玲, 蒋永光, 于中华. 基于聚类和模糊关联规则的中医药对量效分析[J]. 计算机应用研究, 2009, 26(1): 59-61.
[50] 段展辉, 刘桂荣. 基于数据挖掘探讨温补学派治疗郁证处方及用药规律[J]. 中药药理与临床, 2022, 38(4): 174-179.
[51] 蔡铃英, 傅丽芳. 以数据挖掘为基础的中医治疗冠心病处方用药规律研究[J]. 中国全科医学, 2021, 24(S1): 160-162.
[52] 冯梅, 王颖, 柏冬, 王俊宏. 基于数据挖掘的中医处方分析方法研究进展[J]. 世界中医药, 2022, 17(23): 3411-3416.
[53] 赵雪茹, 马利, 李淑琪, 李慧, 苏晓川, 赵移畛. 基于关联规则的骨质疏松性骨折中药熏洗处方用药规律研究[J]. 中国骨质疏松杂志, 2022, 28(1): 84-88.
[54] 芦锰, 周雨慧, 李晓宁, 孙昦丹, 郭金栋, 武博文, 武密山. 基于数据挖掘中医药治疗阿尔茨海默病用药规律研究[J]. 中国中药杂志, 2021, 46(6): 1558-1563.
[55] 但文超, 赵国桢, 何庆勇, 张辉, 李博, 张广中. 中医药处方数据挖掘的常见问题辨析与展望[J]. 中国中药杂志, 2023, 48(17): 4812-4818.