基于深度学习的中医诊断方法知识图谱分析
Knowledge Atlas Analysis of TCM Diagnosis Methods Based on Deep Learning
DOI: 10.12677/acm.2025.153714, PDF, HTML, XML,    科研立项经费支持
作者: 程世慧, 石 文*, 武 妍, 杨金花, 周艺涵, 梁新豪, 李月月, 寇子涵:天津商业大学信息工程学院,天津;张静宇:天津市南开医院名中医馆,天津
关键词: 深度学习中医诊断人工智能CiteSpace神经网络Deep Learning TCM Diagnosis Artificial Intelligence CiteSpace Neural Network
摘要: 目的:利用CiteSpace 6.1.R6软件对基于深度学习的中医诊断方法知识图谱进行可视化分析,探索该领域的研究现状、热点及趋势。方法:以中国知网数据库为资料来源,检索2009年1月1日至2022年12月31日的相关文献,采用Excel统计分析发文量,通过CiteSpace软件进行可视化分析。结果:共获得283篇有效文献,研究经历了萌芽、发展、爆发、平台四个阶段,总体呈上升趋势,近几年关注度达高峰。共有181位作者,高发文量作者包括温川飙等五人。研究机构主要为中医药大学、医学研究所和科技理工类大学,但联系较少。关键词共现图形成8个聚类块,深度学习与传统中医诊断技术结合逐渐实现智能化,研究热点聚焦在舌诊方面。结论:深度学习算法正逐渐深入中医诊断方法中,但我国对该领域的研究和智能诊疗应用有待发展,希望未来加强团队合作,深入研究。
Abstract: Objective: Using CiteSpace 6.1.R6 software for visual analysis of the knowledge map of deep learning-based Chinese medicine diagnosis methods to explore the research status, hotspots, and trends in this field. Methods: Drawing on data from the China National Knowledge Internet (CNKI) database, relevant literature published between January 1, 2009, and December 31, 2022, was retrieved. Excel was used for statistical analysis of publication volumes, and CiteSpace software was employed for visual analysis. Results: A total of 283 valid articles were obtained, showing a general upward trend with research progressing through four stages: emergence, development, explosion, and plateau. The field has garnered significant attention in recent years, reaching a peak. There were 181 authors, with the top five authors, including Wen Chuanbiao, contributing the highest number of publications. The main research institutions included universities of traditional Chinese medicine, medical research institutes, and science and technology-oriented universities, though with limited collaboration among them. The keyword co-occurrence map formed eight clusters, indicating the gradual integration of deep learning with traditional Chinese medicine diagnosis techniques toward intelligence, with research hotspots centering on tongue diagnosis. Conclusion: Deep learning algorithms are increasingly being incorporated into Chinese medicine diagnosis methods. However, research and the application of intelligent diagnosis and treatment in this field in China still require further development. It is hoped that future efforts will enhance teamwork and deepen research.
文章引用:程世慧, 石文, 张静宇, 武妍, 杨金花, 周艺涵, 梁新豪, 李月月, 寇子涵. 基于深度学习的中医诊断方法知识图谱分析[J]. 临床医学进展, 2025, 15(3): 1075-1083. https://doi.org/10.12677/acm.2025.153714

1. 引言

传统中医诊断主要通过“望闻问切”四种方法获取病人的病情信息,并以此进行辨证[1]。中医诊断学自西周时期的萌芽到明清时期的完善,经过无数医者的探索,最终形成一套完整理论,其中凝结着无数医者的智慧[2]。现在,传统的中医诊断方法经常会应用在病人急诊诊治时,医生根据“四诊”的变化,探测人体脏腑的气血、阴阳、生理与病理状况,对病人的病情进行快速、准确的判断,并进行及时的医治[3]

深度学习是机器学习最重要的一个分支,同时也是人工智能的一个分支,其概念来源于人工神经网络的研究,它的学习能力强、覆盖范围广、适应性好、数据驱动精准、上限高、可移植性好。深度学习的核心就是自动将简单的特征组合成更复杂的特征,并用这些特征解决问题。目前,深度学习在计算机视觉和自然语言处理领域的应用成果显著,而中医诊断往往还是依赖于临床医生的个人经验与具体案例结合诊断,导致诊治的疗效难以保证[4],所以将深度学习方法应用到中医诊断领域,可以有效提高中医临床诊断的准确性。深度学习在中医诊断中的应用主要包括卷积神经网络(CNN)用于舌象图像的自动分类和分割、循环神经网络(RNN)分析脉象数据和历史病历、图像处理技术提高图像质量、多模态学习整合各种生理数据进行全面分析、特征提取与融合挖掘深层次病症特征、自然语言处理(NLP)提取中医文献信息,以及构建智能诊断系统提供决策支持。这些技术的结合极大提升了中医诊断的智能化水平和准确性,为中医现代化发展提供了强有力的支持。本课题将深度学习算法与中医诊断方法的研究结合,分析基于深度学习的中医诊断方法的研究现状,并对其未来发展做出展望。

2. 资料与方法

2.1. 数据来源及检索方法

数据来源于中国知网数据库;检索方法:使用高级检索,设置检索时间为2009年1月1日至2022年12月31日,设定检索式SU = (“中医诊断” + “四诊” + “望诊” + “闻诊” + “问诊” + “舌诊” + “脉诊”) AND SU = (“深度学习” + “卷积神经网络” + “循环神经网络” + “CNN” + “RNN”)及检索年限为建库至2022年12月31日。

纳入标准:研究深度学习算法与中医诊断方法相关的期刊及论文。

排除标准:1) 排除指南、期刊采访、会议论文、科技成果类文献及重复的文献;2) 排除与中医诊断方法无关的文献;3) 排除深度学习算法无关的文献。

2.2. 研究方法

利用Excel对2009年至2022年的发文量进行统计分析;将中国知网中检索到的文献以Refworks格式导出,再将文献导入到CiteSpace软件中进行数据格式转换,并在CiteSpace软件中对作者、机构和关键词进行可视化分析,绘制图谱。参数设置为:Time Slicing中将时间跨度设为2009年~2022年,时间切片为1年;分别选择“Author”(作者)、“Institution”(机构)、“Keyword”(关键词)进行可视化分析;Pruning中选择Pruning Sliced Networks和Minimum Spanning Tree;其余选项为默认值。运行后获得作者共现图、机构共现图、关键词共现图、关键词聚类图、关键词突现图及关键词时间线图。

3. 结果

本研究在中国知网检索到文章283篇,其中期刊文献126篇、硕士学位论文136篇、博士学位论文21篇,分别占文章总数的44.52%、48.06%、7.42%。

3.1. 发文量的计量学分析

图1,可将2009年~2022年发文量变化的趋势分为4个阶段[5]:第一阶段是萌芽阶段:2009年~2017年9年期间,检索到的相关文献仅15篇,每年发文量均为个位数,说明在当时对于基于深度学习的中医诊断方法的研究较浅;第二阶段是发展阶段:从2018年开始到2021年4年期间,检索到的相关文献共214篇,且发文量呈快速上升趋势。在这段时期深度学习算法不断发展,与传统中医诊断方法相结合的研究逐渐获得关注;第三阶段是爆发阶段,在2021年关于本研究的发文量爆发,此时对基于深度学习的中医诊断方法的研究达到了高峰;最后是平台阶段,在2022年关于深度学习算法与中医诊断方法结合的文献发表数量有所减少,但仍处于一个比较高的水平,符合科学研究的一般规律,说明基于深度学习的中医诊断方法研究将以一个平缓的速度继续发展。

3.2. 作者共现可视化分析

图2,图谱中的节点代表作者,作者姓名的字体越大,代表发文量越多;节点间的连线代表作者间的合作,连线作者代表在该领域中这些作者合作比较密切。图谱结果显示:节点数N = 181、连线数E = 84,说明检索到的文献中相关作者共有181位,作者间连线数共84条。如图2所示,累计发文量前6的作者分别是温川飙(6篇)、燕海霞(5篇)、周作建(5篇)、王忆勤(4篇)、颜建军(4篇)、郭睿(4篇),可以看出这些核心的作者之间基本形成了较稳定的合作团队。其中燕海霞、周作建、王忆勤、颜建军等人组成的团队合作较为密切,是基于深度学习的中医诊断方法研究的主力团队。

Figure 1. Trend chart of the number of publications on traditional Chinese medicine diagnosis and deep learning algorithms from 2009 to 2022

1. 中医诊断与深度学习算法2009年~2022年发文量趋势图

Figure 2. Co-authorship network diagram

2. 作者共现图

3.3. 机构共现可视化分析

图3,本研究检索到的292篇中文文献中,包含138家研究机构,其中发文量第一的机构是华南理工大学(9篇),其次为北京中医药大学(8篇)、南京中医药大学人工智能与信息技术学院(8篇)、华北理工大学(8篇)、北京交通大学(8篇)。分析机构共现图谱可获得以下特点:1)对于本课题研究较多的有三类机构:中医药大学、医学研究所、科技理工类大学;2)对于基于深度学习的中医诊断方法研究主题相关的发文量相对分散,各机构间合作关系较少。

3.4. 关键词共现可视化分析

图4,关键词是对文章主要内容的概括,能够反映文章的核心成果。同时,关键词的变化在一定程度上可以表现出学科研究热点的变化,关键词出现频率的高低反映了该主题在其相关领域的热度[6]。从关键词共现图谱中可以得到:节点数N = 200,连线数E = 266,说明关键词总数共有200个,关键词之间的连线有266条,说明不同关键词之间联系密切。如图4所示,本研究以“深度学习”为核心,由中间向外扩展,深度学习与机器学习、中医诊断、中医辨证、神经网络、人工智能、舌诊等关键词有紧密的联系,说明深度学习是机器学习的一个分支,属于人工智能的一个部分,深度学习算法逐渐渗透到中医领域,使中医诊断方法向智能化发展,为未来中医诊断提供便捷,为医生减负。

Figure 3. Institution co-occurrence map

3. 机构共现图

Figure 4. Keyword co-occurrence map

4. 关键词共现图

3.5. 关键词聚类可视化分析

图5,在关键词共现图的基础上,对关键词进行聚类共得到29个聚类块,保留前8个聚类块得到结果图。如图5所示,聚类模块值(Q) = 0.6631 > 0.3,聚类平均轮廓值(S) = 0.7652,说明聚类结果结构清晰,聚类合理,可信度高[7]。图中各聚类块相互交叉、渗透,特别是#0深度学习、#2人工智能、#3神经网络、#5机器学习之间紧密相关,显示出机器学习是人工智能的进阶,机器学习深入后是深度学习,深度学习是从神经网络研究中发掘的。还涉及中医诊断的技术,如#1关系抽取、#6图像分割、#7辅助诊断,这些技术可以辅助实现中医诊断智能化,中医智能诊断过程中的数据采集将更加规范化、标准化。#4舌象聚类块表明了目前中医深度学习诊断研究的核心聚焦在舌诊方面,例如:以语义分割、目标检测等深度学习神经网络搭建计算机诊断模型,探索自动化舌诊在慢病管理等方面的临床应用[8];以及段梦遥应用深度学习对舌象特征进行挖掘,将舌象深度特征与医学量化特征进行融合,建立基于融合特征的冠心病无创诊断及辅助辨证模型[9]。因此,机器学习及其进阶技术深度学习、神经网络在人工智能领域展现出强大的潜力,特别是在中医诊断智能化方面,这些技术的应用不仅促进了中医诊断技术的革新,还为中医临床诊断和慢病管理提供了更为精准、高效的工具和方法。未来,随着技术的不断进步和研究的深入,中医智能化诊断的前景将更加广阔。

Figure 5. Keyword clustering diagram

5. 关键词聚类图

3.6. 关键词时间线图可视化分析

图6,在关键词聚类图的基础上进一步做出关键词时间线图,其可以展示出不同时间段的研究关注热点及各热点的发展变化。结合图1发文量趋势图,我们可以看出:2009年~2017年是中医诊断方法与深度学习研究的萌芽阶段,这一阶段的主要热点关键词有“神经网络”、“深度学习”、“中医脉诊”、“中医”,说明最初对中医深度学习诊断方法研究的是脉诊,将脉诊与神经网络、深度学习算法相结合,并且可以看出对中医深度学习脉诊的研究持续了较长时间;2018年~2020年中医诊断方法与深度学习研究开始向更深层次发展,这一阶段出现了更多热点关键词,如“人工智能”、“机器学习”、“中医舌诊”、“中医诊断”、“舌体分割”等,说明在这段时间,基于深度学习的中医诊断方法研究的主要方向转向了舌诊,并且出现了更多先进的技术方法,促进了中医舌诊更加智能化;到了2021年,出现了“舌象分类”、“图像处理”、“智能化”等关键词,此时深度学习方法的热点仍聚焦在舌诊上,发文量也达到了高峰;2021年之后进入平台期,虽然热点关键词出现的频率不再发生大幅度变化,但是中医深度学习诊断方法研究仍在不断发展。随着科技的不断进步,中医深度学习诊断方法研究会不断深入,未来必然会有更卓越的成果。

Figure 6. Keyword timeline diagram

6. 关键词时间线图

3.7. 关键词突现图可视化分析

图7,“突现性”指在一段时间内该关键词出现的强度,强度越大说明该关键词在该时间内的影响越大[10]。关键词突现分析是通过考察关键词的时间分布,从中探测出频次变化率高、增长速度快的突现词,进而分析学科的前沿领域和发展趋势。图7是我们得到的前12个关键词突现的结果。由图7可知:“神经网络”是最早出现,同时也是历时最长的一个关键词,深度学习属于神经网络中的一种,说明在最初时神经网络受到大量关注,之后深度学习也逐渐引起研究人员的关注;随着时间的推移,中医诊断方法与深度学习的结合日益紧密,特别是在2013年至2017年间,出现了多个与中医诊断相关的突现关键词,如“慢性胃炎”、“中医”、“数据挖掘”、“痰热腑实”和“舌苔”。近年来,深度学习方法开始接触更多元化的领域,中医深度学习诊断方法研究有了进一步发展,特别是在2018年至2020年间,出现了“舌象”、“强化学习”和“迁移学习”等关键词。而自2021年以来,“舌象分类”和“语义分割”等更深层次的研究方向逐渐成为主流,这表明中医深度学习诊断方法在不断完善中趋于成熟。因此,可以说深度学习在中医诊断领域的应用正经历着从初步探索到深入发展的过程,未来有望为中医诊断提供更多精准、高效的工具和方法。

Figure 7. Keyword emergence diagram

7. 关键词突现图

4. 讨论与展望

本研究通过对中国知网建库至2022年12月31日的关于中医深度学习诊断方法的文献导出,并利用CiteSpace 6.1.R6软件对检索到的283篇文献进行可视化分析。从发文量趋势图可以看出关于本研究的相关文献最早出现在2009年,直到2017年之前,关于中医深度学习诊断方法研究方面的发文量仍然处于低水平。2018年后,相关文献明显增加,由时间线图发现,这个变化与“人工智能”、“机器学习”逐渐成为热点有关。直到2021年,发文量达到一个高峰,结合时间线图分析发现,近几年对于中医舌诊智能化的研究关注度较高,不少学者以舌诊客观化收集病例中舌象特征,寻找客观信息,形成用数字描述和表达的舌诊信息,构建了智能舌诊交互平台[11]。例如广东工业大学的刘进辉,提出使用一种基于卷积专家神经网络的舌体分割新框架,该模型可以对灵活、柔性的舌头进行准确、高效的三维分割,即使在舌象采集过程中,舌体姿态发生变化,仍可以精确记录其三维舌体信息[12]。到了2022年,发文量相较2021年虽有所下降,但仍比较高,结合时间线图发现,在2022年中医深度学习诊断方法的研究热点仍集中在舌诊方面,发文量有所下降说明目前仍在延续对舌诊智能化的研究,在未来有待更多研究人员将深度学习方法应用到各种中医诊断方法中,推动中医诊断方法智能化。

结合作者共现图与机构共现图发现华东理工大学的颜建军与上海中医药大学的燕海霞、王忆勤、郭睿曾多次合作,他们的主要研究方向为深度学习与舌诊结合[13]-[15],促进了舌诊客观化和现代化的进一步发展。虽然不同作者、不同机构之间有所合作,但总体偏少,虽然有多个作者间形成团队合作的情况,但总体发文量偏少,对本课题研究不够深入,缺乏影响力。

在关键词聚类图谱中我们得到8个热点关键词,它们相互交叉、渗透,形成紧密联系。结合关键词共现图可以把关键词主要分为两类:#0深度学习、#2人工智能、#3神经网络、#5机器学习、#1关系抽取、#6图像分割这些聚类块属于技术类,从而引申发展了一些先进技术方法,如“数据挖掘”、“迁移学习”、“分类算法”等;#4舌象、#7辅助诊断属于中医类关键词,引申出“中医舌诊”、“中医诊断”、“中医四诊”等关键词。由图4关键词共现图、图5关键词聚类图可以得到:两方面关键词相互交叉联系,深度学习算法逐渐渗透到中医诊断领域,例如:脉诊、舌诊,不仅提高了中医诊断的效率,也提高了中医诊断的准确率;从图6关键词时间线图中得到的不同时间段的关键词和图7关键词突现图中得到的频次变化率高、增长速度快的突现词,可以发现人工智能技术正在逐渐深入,从以前的神经网络到现在的强化学习、迁移学习;中医诊断方面的研究也逐渐具体化,从以前的中医到现在的舌象,两个领域不断进步发展,同时也不断结合,促进中医深度学习诊断方法不断发展。

本文基于CiteSpace软件对中医深度学习诊断方法的现状进行了可视化分析,对于该领域的现状、热点及未来发展趋势进行一定的阐述,对于中医深度学习诊断方法研究领域有一定参考价值。目前,由于脉象、舌象富含定量化原始信息数据,深度学习在中医诊断中更多聚焦在脉诊与舌诊上。未来伴随深度学习的进一步发展,深度学习将逐渐渗透到更多中医诊断方法中,面诊、问诊、闻诊,深度学习在医疗领域将会有更广泛的应用,为医生减负,为患者提出有效的就医建议和日常护理指导[1]

基金项目

大学生创新创业训练计划项目“面向证型的多囊卵巢综合征舌象客观化及诊断指标相关性研究”(202310069063)。

大学生创新创业训练计划项目“融合可解释人工智能的中医多模态舌诊报告自动生成机制研究”(202410069094)。

大学生创新创业训练计划项目“基于微整列数据的癌症分类算法研究”(202410069188)。

NOTES

*通讯作者。

参考文献

[1] 罗思言, 王心舟, 饶向荣. 人工智能在中医诊断中的应用进展[J]. 中国医学物理学杂志, 2022, 39(5): 647-654.
[2] 张岚. 中医诊断学史论[D]: [博士学位论文]. 哈尔滨: 黑龙江中医药大学, 2007.
[3] 王郁金, 苏衍进. 中医诊断方法在急诊中的应用探讨[J]. 健康必读(下旬刊), 2011(6): 349-353.
[4] 郑婉婷, 李敬华, 田少磊, 等. 中医临床辅助决策系统功能与算法的发展评述[J]. 中国数字医学, 2022, 17(2): 86-94.
[5] 夏淑洁, 王义军, 朱龙, 等. 知识图谱视角下微观辨证的研究主题及演化趋势[J]. 中国中西医结合杂志, 2022, 42(9): 1063-1071.
[6] 孙璇, 王东军, 田春颖, 等. 中医舌诊客观化可视化分析[J]. 天津中医药, 2021, 38(12): 1537-1543.
[7] 王莲玉, 钟文婷, 颜莹, 等. 基于文献计量和知识图谱的儿童中医体质学说可视化分析[J]. 世界科学技术-中医药现代化, 2022, 24(9): 3303-3314.
[8] 封丽. 基于深度学习的舌象特征识别算法研究与应用[D]: [硕士学位论文]. 成都: 成都中医药大学, 2023.
[9] 段梦遥. 基于舌象特征的机器学习辅助冠心病中西医诊断研究[D]: [博士学位论文]. 北京: 北京中医药大学, 2023.
[10] 匡文轩, 周婉珠, 晏峻峰. 神经网络在中医领域应用的文献计量与图谱分析[J]. 中医药导报, 2021, 27(4): 168-173.
[11] 关媛媛, 郝阳, 田春颖, 等. 基于CiteSpace的舌诊诊断标准研究的可视化分析[J]. 世界科学技术-中医药现代化, 2021, 23(1): 263-270.
[12] 刘进辉. 基于卷积专家神经网络的中医舌诊应用研究[D]: [硕士学位论文]. 广州: 广东工业大学, 2021.
[13] 颜建军, 李东旭, 郭睿, 等. 基于二级分类器的齿痕舌分类模型研究[J]. 中华中医药杂志, 2022, 37(4): 2181-2185.
[14] 颜建军, 李东旭, 郭睿, 等. 基于深度学习和随机森林的齿痕舌分类研究[J]. 中华中医药学刊, 2022, 40(2): 19-22+259-261.
[15] 颜建军, 徐姿, 郭睿, 等. 基于Mask R-CNN的舌图像分割研究[J]. 世界科学技术-中医药现代化, 2020, 22(5): 1532-1538.