1. 引言
在科技飞速发展的时代,大数据已成为许多领域变革的重要驱动力。医疗作为与人类健康息息相关的重要领域,也积极引入大数据技术,以谋求更好的发展方向和解决方案。医疗数据包括患者基本信息、病历、诊断结果、治疗方案、各种医疗监测数据等,具有巨大的潜在价值。然而,如何收集、整理、分析和有效利用这些海量数据已成为医疗行业面临的一大挑战。与此同时,医疗行业对提高医疗质量、提高疾病诊断准确率、优化医疗资源配置、加强疾病预防控制的需求也日益迫切。大数据技术的出现为满足这些需求提供了契机。它可以通过收集和分析大量医疗数据,为医疗决策提供科学依据,让医生更好地了解患者病情,提供个性化建议。在此背景下,本研究旨在深入探讨大数据技术在医疗领域的应用情况。通过对中国知网(CNKI)数据库中2014年~2024年间相关文献的研究,我们将梳理大数据在医疗领域应用的发展脉络,分析不同阶段的应用特点和研究热点,并尝试预测未来的应用趋势。后续章节将详细介绍研究方法、数据分析过程以及研究结果,以期为医疗领域大数据技术的进一步应用和发展提供有益的参考。
2. 数据来源和研究方法
2.1. 数据来源
所用文献选取的是学术期刊。数据检索时选择的主题词设置为“大数据与医疗”,文献来源为期刊,剔除了报纸、会议与学位论文。通过以上限定条件进行检索,共获取原始相关文献5333篇,经过进一步人工筛选,最终得到500篇有效文献样本。
2.2. 研究方法
本研究主要利用CiteSpace6.2.R4软件,对医疗领域大数据的应用自2014年以来的相关研究成果进行文献计量可视化分析。该方法通过分析某领域大量相关文献,绘制出直观的关系图谱,从而帮助研究者了解该领域研究的发展情况,准确把握领域研究热点和未来发展趋势。
本文主要利用了关键词共现网络图谱分析来说明该领域的研究现状,以关键词聚类时间线图谱来说明其发展趋势。关键词共现网络是通过聚类视角分析关键词特征,这从一定程度上说明了该领域的研究热点。
3. 医疗领域大数据应用的相关研究文献情况分析
3.1. 总体趋势分析
经过进一步筛选,选取相关度最高的498篇文献进行分析。根据2014年~2024年发文量的情况(图1),将其分成三个阶段进行分析。
Figure 1. The number of research papers related to the application of big data technology in the medical field in China from 2014 to 2024
图1. 2014年~2024年我国医疗领域大数据技术应用的相关研究文献数量
第一阶段(2014~2015年)。2013年也被称为大数据元年,因为大数据技术已经开始在商业、科技、医疗、政府和教育等社会不同领域普及。但2013年大数据在医疗领域的应用尚未展现,所以在筛选文章时是从2014年开始。此时的文献共53篇,速度较慢,数量较少。这说明,由于前期缺乏相关经验指导研究者,对大数据在医疗卫生领域的应用缺乏重视,现阶段国内该领域的相关研究虽然已经开始出现,但增长缓慢,数量较少。
第二阶段(2016~2019年)。此阶段是医疗领域大数据技术应用的快速发展时期,速度比上一阶段更快,文献也是成倍的增加。国务院在2016年发布的《关于促进和规范健康医疗大数据应用发展的指导意见》中强调,健康大数据是国家重要的战略资产。扩大健康大数据应用,将为深化医药卫生改革、提高健康服务效率和质量、不断满足各层次人群多样化健康需求、培育新业态新模式和经济增长点提供动力和活力。该意见还强调,要深化大数据在医疗卫生领域的应用,包括在医疗卫生治理中使用大数据、在临床和科研中使用大数据、开发和推广数字化智能医疗工具等。
第三阶段(2020年~至今)。此阶段医疗领域大数据应用发生了一些变化,文献数量相比上一个阶段更多,文献内容也更丰富。2019年发生的重大公共卫生事件,改变了人们的生活,也给医疗领域大数据的应用带来了新的机遇。大数据正越来越多地用于疾病监测、预防和控制,以实时监测和分析疾病的传播情况,并创建反应更灵敏的监测和预警系统。同时大数据助力临床治疗,依据大数据对患者进行分类和分层,实现个性化医疗。根据患者的基因特征、临床数据和生活方式等信息,制定有针对性的治疗方案,以提高治疗效果,减少副作用[1]。总的来说,随着国家政策的不断深化,以及对大数据和医疗领域的重视,我国大数据在医疗领域的应用经历了从成长、快速发展再到稳步发展的过程,虽有波动,但发展稳定。大数据在医疗领域的应用越来越全面和创新,注重提高医疗服务效率和质量,更加重视个人保健和预防治疗。
3.2. 关键词共现知识图谱分析
关键词代表了文献对主题的高度概括。通过对关键词的共现分析(图2),可以反映该领域在不同时期的研究热点和研究方法的变化,进而分析该领域的内在联系。分析包括关键词共现图谱分析、关键词频次分析和中心性分析,以更全面、直观的视角描述现阶段医学领域大数据应用的研究热点,揭示该领域的研究前沿。将作为样本的500篇相关文献导入CiteSpace软件,切片时间设置为1年,得到大数据关键词共现知识图谱。
Figure 2. Keyword contribution knowledge graph of big data technology application in China’s medical field from 2014 to 2024
图2. 2014年~2024年我国医疗领域大数据技术应用的关键词贡献知识图谱
本图谱共包括结点(N) 300个,连线(E) 695条,网络密度(Density)为0.0155。图中的圆节点表示关键字,圆节点的长度表示关键字的出现频次,关键字出现频次越多,节点就越大,结点中间的线段表示关键字间的共现情况,而线段的粗细则表示关键字间共现的强度。
为了保证关键词统计能真实反映当前医学领域大数据研究的趋势,只选取频次在30次以上且主要排名前6位的高频关键词,这些高频关键词与其他关键词的关系非常密切,代表了所研究领域的主要内容。统计结果如表1所示。
Table 1. Statistics on keyword frequency and centrality of big data technology application in China’s medical field
表1. 我国医疗领域大数据技术应用的关键词频次和中心度统计
排序 |
频次 |
中心度 |
年份 |
关键词 |
1 |
266 |
1.3 |
2014 |
大数据 |
2 |
28 |
0.26 |
2016 |
医疗大数据 |
3 |
43 |
0.14 |
2014 |
大数据技术 |
4 |
71 |
0.13 |
2014 |
医院 |
5 |
33 |
0.08 |
2015 |
大数据时代 |
6 |
31 |
0.08 |
2015 |
公立医院 |
关键词中心度体现了某一关键词在整个图谱网络中的媒介能力,中心度越高则代表了该关键词成为与其他关键词连接节点的次数越多。通过中心度统计,具有最高中心度的关键词是“大数据”,其中心度为1.3,其他关键词诸如“医疗大数据”、“大数据技术”等中心度排名也比较靠前,且出现时间集中在2014~2016年。深入分析发现,我国医疗行业大数据应用的研究热点较为集中,高中心性关键词之间的关系非常密切。大数据应用的计算能力使医生能够在几分钟内对患者数据进行深入分析,并利用生物标志物检测、基因测序等工具探索个体疾病风险和最佳治疗方案,有效提高诊断准确率和治疗效果。因此,“大数据”这个出现频率最高、中心性最强的热门词汇,作为大数据在医疗行业应用的研究框架而存在;大数据的发展不仅为医院提供了丰富的信息资源,也为医院提高运行效率、优化资源配置、提升防控风险的支撑能力提供了强大的技术手段。
3.3. 关键词聚类图谱分析
Figure 3. Keyword clustering map of big data technology application in the medical field
图3. 医疗领域大数据技术应用的关键词聚类图谱
通过关键词进行聚类分析,可以得知大数据在医疗领域应用不同时期的研究特征。因此,利用CiteSpace软件根据关键词中心度(见表1)来制作关键词聚类图谱(见图3)。在图3中,不同色块代表不同的聚类区域,通过分析该聚类图谱可知该研究具有科学性(Q = 0.5398 > 0.3)和可信性(S = 0.8794 > 0.5)的特点,综合Q值和S值来看,该聚类图谱具有合理性。该聚类图谱中共有300个节点和695条连线,网络密度为0.0155,共展现出6个聚类区域。分别是大数据、医疗大数据、大数据技术、医院、大数据时代、公立医院。
3.4. 关键词时间线图谱分析
在关键词共现分析的基础之上,结合时间线的发展,利用CiteSpace软件绘制出带有时间线的关键词聚类时间图谱(图4),从而具体分析我国医疗领域大数据技术应用的研究热点发展的不同阶段以及未来的发展趋势。
Figure 4. Timeline of keywords for the application of big data technology in China’s medical field from 2014 to 2024
图4. 2014~2024年我国医疗领域大数据技术应用的关键词时间线图谱
如图4所示,节点和文本在图表中的位置表示关键词首次出现的时间。值得注意的是,当显示一个关键词时,它会固定在该关键词首次出现的年份,如果有其他关键词与之同时出现,则会在它们之间画一条连线来表示它们之间的关系。此外,节点的大小还代表了关键词出现的频率,即在关键词节点返回后首次出现的年份之后,关键词节点首次出现的年份位置会增加,以此类推。将图4的关键词进行聚类分析,进而筛选出体量最大的6个聚类类别,分别为大数据、医院档案管理、医疗大数据、医院、公立医院、大数据背景。据此,可以依据时间线发展顺序,结合聚类标签和关键词,可以得出医疗领域未来应用大数据主要是“医疗大数据”、“医院档案管理”等选题进行深入研究。
3.4.1. 医疗大数据
在《关于促进和规范健康医疗大数据应用发展的指导意见》中,健康医疗大数据是指在公共卫生、医疗服务、药品管理等传统业务领域,利用互联网、物联网、人工智能等信息技术产生的与健康相关的数据[2]。根据医院信息系统的不同,医疗大数据可分为医院信息数据、电子病历数据、医学影像数据和检验数据。根据主要数据源的不同,医疗大数据主要包括:一是医院临床数据。即患者就诊时产生的各类医疗数据;二是公共卫生数据。包括患者基本信息、就诊记录等;三是移动健康数据。将患者体征数据、康复健康数据等物联网数据与移动健康数据进行整合;四是生物标本数据;五是基因数据[3];六是医学知识库。知识图谱、医疗指南、文献等。与广义大数据相同,健康医疗大数据也同样具备5V的共性[4],即Volume (大量)、Velocity (高速)、Variety (多样)、Value (低价值密度)、Veracity (真实性) [5]。同时,它还具有:(1) 海量性。医疗机构除了在诊疗和医学分析过程中产生数据外,还包括近年来物联网技术的飞速发展,使信息获取和分析的速度由原来的“天”计算变成了“秒”计算,远大于传统的数据量。(2) 准确性。医疗大数据集与患者的生命息息相关,要求绝对准确。(3) 保密性。医疗数据具有保密性,因此需要严格处理。(4) 封闭性。每个医疗机构都有自己的结构化系统,独立运行,因此数据不能共享[6]。
3.4.2. 医院档案管理
医疗行业作为社会发展的重要支柱,在信息化发展的浪潮中也面临着新的机遇。医院档案管理作为医疗体系中的一项基础性工作,关乎医疗服务的质量、医疗决策的科学性以及医疗资源的合理配置,其重要性不言而喻[7]。首先,它提高了病案管理的效率。电子化、数字化工具在医院病历管理中的应用,实现了快速检索、存储和共享,大大提高了病历管理的效率[8]。一方面,信息化管理可以让医生和护士通过信息系统快速查阅病人的病历、检查结果和治疗方案。节省医生和护士时间的同时,也减少了病人在等待诊断和治疗时的焦虑和不适。另一方面,信息记录管理实现了记录的批量处理和自动提交,大大减少了记录提交的工作量。第二,确保记录安全。纸质档案管理下,档案丢失、损坏和被盗的风险较大。档案信息化管理可以实施最佳实践管理措施,有效保护档案信息安全[9]。第三,有助于临床决策。病历作为医务人员诊断、治疗和科研的重要依据,其准确性和完整性直接影响医疗质量和科研水平。通过信息管理,医务人员可以快速查阅病历、检查结果和治疗方案,从而减少医疗差错。第四,促进医疗信息交流。医疗信息交流有利于提高医疗服务质量、优化医疗资源配置、促进医疗合作。医疗信息交流消除了不同机构之间的信息壁垒,促进了医疗机构之间的合作与发展。
4. 结论与展望
大数据在医疗领域的应用已经展现出巨大的价值和潜力。通过对海量医疗数据的收集、分析和挖掘,医疗行业在多个方面取得了显著进步。在临床诊断方面,大数据有助于医生更准确地判断疾病,提高诊断的准确性和及时性。在疾病预测和预防方面,大数据分析能够识别疾病的风险因素,提前预测疾病的发生概率,为公共卫生部门制定预防策略提供依据。在医疗管理方面,大数据可以优化医院的资源分配,提高医疗效率。然而,大数据在医疗领域的应用也面临一些挑战。现有的医疗大数据在实际应用中存在使用难、不合适等问题。其次,信息化评估工具的指标和标准主要基于真实数据,前期往往忽视理论框架的制定。最后,以往信息化评估工具的开发主要基于卫生部门大量相对标准化的数据,这些数据已经具备一定的基本数据质量要求,无法应对地方数据质量不高的问题。未来,大数据在医疗领域的应用将更加广泛和深入。随着人工智能、物联网、5G等技术的不断发展,医疗大数据的收集和分析将更加高效和精准。在临床治疗方面,基于大数据的个性化医疗将成为主流。通过分析患者的基因数据、临床症状和治疗反应等信息,医生可以为患者制定个性化的治疗方案,提高治疗效果和减少副作用。在医疗科研方面,大数据将加速医学研究的进程。研究人员可以利用大规模的医疗数据进行疾病机制的研究、药物研发和临床试验,缩短研发周期,提高研发成功率。在公共卫生领域,大数据将在传染病防控、慢性病管理等方面发挥更大的作用。通过实时监测和分析人群健康数据,公共卫生部门可以及时发现疫情并采取有效的应对措施,同时为慢性病患者提供个性化的健康管理服务。为了充分发挥大数据在医疗领域的作用,需要政府、医疗机构、企业和科研机构等各方共同努力。加强数据安全和隐私保护,建立统一的数据标准和共享平台,培养专业的数据分析人才,推动大数据技术与医疗行业的深度融合,为提高人类健康水平做出更大的贡献。