1. 引言
地质灾害是自然地质作用与人类活动共同作用的结果,具有突发性强、分布广、危害大的特征。近年来,全球气候变化与人类工程活动的加剧使滑坡、泥石流、崩塌、地面沉降等地质灾害的发生频率显著上升,对人民生命财产安全与生态环境造成了严重威胁[1]。如何准确识别、有效评估并及时预测地质灾害风险,已成为地学及工程领域的重要研究课题。
传统的地质灾害风险评价主要依赖专家经验与统计分析方法,如层次分析法(AHP)、模糊综合评判法以及基于GIS的空间叠加分析等[2]。这些方法在一定程度上推动了风险评价体系的建立,但由于其主观性强、数据依赖性高,难以全面反映复杂的地质环境特征。随着大数据与人工智能(Artificial Intelligence, AI)技术的快速发展,机器学习(Machine Learning, ML)、深度学习(Deep Learning, DL)等算法在地质灾害易发性分析、危险性分区与预测预警中展现出强大优势[3]。研究者开始将支持向量机(SVM)、随机森林(RF)、人工神经网络(ANN)等智能模型引入地质灾害风险评估,实现了从经验驱动向数据驱动的转变[4]。
近年来,国内外学者围绕“地质灾害 × 人工智能”方向展开了大量研究。Liu [5]等系统梳理了滑坡易发性与机器学习算法的耦合模型;Xiao [6]等利用深度神经网络对泥石流与崩塌风险进行了空间预测;国内方面,仉文岚[7]、方然可[8]、孙德亮[9]等学者则基于遥感数据与地质参数构建了智能化地灾预测体系。然而,这些研究多集中于算法验证与单案例分析,缺乏对整体研究格局与热点演进的系统梳理。
CiteSpace作为一种科学知识图谱分析工具,可对文献数据进行共现分析与聚类可视化,揭示学科的发展脉络、研究热点及前沿方向[10]。已有研究表明,该方法能有效反映领域内部的研究结构与动态趋势。
因此,本文以2002年10月至2025年10月间CNKI与WOS数据库中与“地质灾害”及“人工智能/机器学习”相关的文献为数据源,利用CiteSpace软件进行可视化计量分析。通过发文趋势、作者与机构网络、关键词聚类及突现分析,系统总结地质灾害人工智能研究的演进路径与发展趋势,旨在:梳理该领域的研究现状与热点主题;探讨国际与国内研究差异与合作格局;预测未来研究方向,为地质灾害风险智能评估体系的完善提供参考。
2. 数据库和研究方法
2.1. 数据来源
文献数据主要来源于中国知网(CNKI)数据库与Web of Science (WOS)核心合集数据库。在CNKI数据库中,以主题 = (地质灾害) AND (人工智能OR机器学习)为检索条件;在WOS数据库中,以主题 = (geological hazard) AND (artificial intelligence OR machine learning)为条件,检索2002.10~2025.10的文献。经去重筛选,共获得CNKI数据库文献679篇,WOS数据库文献384篇。
2.2. 研究方法
本研究采用CiteSpace作为核心分析工具,基于国内外两个权威文献数据库(CNKI和WOS)的数据,系统梳理了地质灾害防治中人工智能与机器学习相关的研究文献。研究方法包括以1年为时间切片,对近23年来的文献进行格式化处理与量化分析。
在正式进行可视化分析之前,首先对提取的文献数据进行了数据清洗与标准化处理,以确保分析结果的准确性和可重复性。具体过程包括两个主要环节:首先,针对同义或近义的关键词(如“machine learning”、“ML”、“机器学习”等),通过人工校对与词频统计相结合的方式进行统一命名处理。具体操作中,首先导出CiteSpace识别的关键词列表,并对出现频率较高的关键词进行人工筛查与归并,然后利用CiteSpace的“词表编辑(Term Source Edit)”功能进行修正与统一,以确保关键词共现网络的准确性与连贯性。其次,由于同一机构在不同数据库或文献中可能存在多种命名方式(如“中科院”、“中国科学院”、“Chinese Academy of Sciences”等),本研究在数据导出后,通过Excel进行初步比对、合并与去重,并结合CiteSpace内置的机构合并功能及人工核对,确保机构命名的一致性,从而减少机构节点的重复,提高作者与机构合作网络的可靠性。
完成数据清洗与标准化处理后,使用CiteSpace绘制了作者合作网络、机构合作网络、关键词共现网络、聚类图谱、时间线图谱及突现图谱,旨在从多个维度可视化展示人工智能在地质灾害预测与防治中的应用格局。通过对发文量时序变化、核心作者与机构分布、关键词共现与聚类特征的系统分析,本研究揭示了该领域的研究热点、发展脉络与前沿趋势,为后续学者深入探索提供了可靠的文献计量依据与参考方向。
此外,CiteSpace自动生成的多个参数(如g-index、LRF、LBY、Q值)在可视化分析中得到了应用。具体而言,g-index用于衡量文献的学术影响力,帮助识别领域内的高影响力文献,尤其适用于文献数量较多的情形;LRF (Local Reference Framework)用于分析文献的局部引用结构,揭示文献间的引用关系与知识流动,有助于识别核心研究及其相互联系;LBY (Local Bibliographic Yield)则评估文献集群的创新性,支持识别潜在的创新性研究及领域内的新兴研究热点;Q值则用于衡量聚类结果的质量,反映聚类分组的清晰度与准确性。较高的Q值(Q值高于0.3时,聚类效果合理)表示聚类结果中的簇结构更加清晰,便于研究者识别学术领域中的关键主题和核心研究方向。通过这些参数的综合分析,本研究能够更精确地呈现该领域的知识结构与发展趋势。
3. 结果分析
3.1. 发文趋势
基于CNKI数据库与WOS核心合集数据库去重结果,绘制了近23年(截至2025年10月)国内外AI在地质灾害预测与防治研究领域的发文数量趋势图。从图1可见,2002~2015年间地质灾害与AI、机器学习相关研究的发文量总体较低,处于缓慢增长阶段;2016年以后,随着遥感技术、GIS及深度学习算法的引入,相关研究数量显著上升。
2020年至2023年期间发文量迅速攀升,中文文献年发文量从不足20篇增长至140余篇,英文文献也从个位数上升至100篇左右,表明该领域研究热度持续增强。2024年略有回落,主要原因可能与数据统计滞后及部分研究尚在发表流程中有关。总体趋势显示,“AI驱动的地质灾害研究”已成为新的跨学科热点方向。
Figure 1. Statistics on the number of papers published by AI in geological disaster prediction and prevention from 2002 to 2025
图1. 2002~2025年AI在地质灾害预测与防治研究发文量统计
3.2. 作者合作网络分析
利用CiteSpace生成的发文作者网络图谱(图2、图3),每一个节点代表以为作者,节点颜色越暖代表发文文献越新;节点之间的连线代表对应的两位作者合作发表过文献,若连线颜色越暖表示合作发表的文献越新,反之亦然[11]。
图2展示了CNKI数据库中作者合作网络,共包含263个节点和80条连线。以仉文岗、方然可为核心节点的学术群体最为活跃,连接度高,形成了明显的合作中心。这一群体主要集中于地质灾害智能识别、滑坡监测与风险评估研究方向。孙德亮[9]、何鹏[12]、刘艳辉[8]等也保持了较高的学术产出与合作频率。整体网络Q值为0.7005,聚类结构显著,说明国内学者在该领域内已形成若干稳定的研究团队,但整体网络密度较低(0.0023),表明跨机构合作仍有提升空间。
Figure 2. CNKI database author cooperation network
图2. CNKI数据库作者合作网络
图3为WOS数据库的作者合作网络(270节点、164连线)。国外学者中,Arabameri Alirez [13]与Pradhan Biswajeet [14]是核心节点,合作网络范围广,中心性高,研究主题集中在机器学习模型(RF, SVM, ANN)在滑坡易发性预测中的应用。其中,Arabameri Alirez [13]等利用逻辑回归模型,结合GIS与遥感数据对马来西亚金马伦高原进行滑坡灾害危险性分析,结果表明模型准确率达85.73%,生成的灾害图可为区域风险评估与基础设施规划提供可靠依据;Pradhan Biswajeet [14]等通过集成频率比与随机森林模型,并对比PALSAR、ASTER与SRTM三种DEM数据,发现FR-RF集成模型与高分辨率PALSAR数据结合可实现最佳预测性能(AUC = 0.917),其成果为当地滑坡灾害防控提供了精准决策依据。与之形成紧密合作的还有Yu Bofan [15]、Xing Huaixue、Xu Chong [16]等。总体Q值0.5823表明聚类合理,说明国际研究呈现跨国、多机构协作的特征。
Figure 3. WOS database author cooperation network
图3. WOS数据库作者合作网络
3.3. 机构合作网络分析
对纳入的中、英文文献进行机构可视化分析,并对同一机构及其二级单位进行合并处理(如成都理工大学和成都理工大学地质灾害防治与地质环境保护国家重点实验室合并为成都理工大学)。
图4显示CNKI数据库中243个节点的机构合作结构。成都理工大学、中国地质大学、长安大学为主要发文单位,节点较大且颜色偏绿,表明在2018~2024年间保持了持续活跃。其余如西南交通大学、中南大学、吉林大学等也在该领域具有较高研究贡献。总体Q值0.7005说明聚类结构清晰,但网络密度0.0027偏低,显示国内高校间仍需加强纵横向协作。
Figure 4. CNKI database organization cooperation network
图4. CNKI数据库机构合作网络
Figure 5. CNKI database organization cooperation network
图5. WOS数据库机构合作网络
图5展示WOS数据库中221个节点、215条连线的国际机构合作网络。Chinese Academy of Sciences与China University of Geosciences是核心节点,具有最高中介中心性(>0.1),与Chengdu University of Technology及Chang’an University形成稳定的合作群体。国外机构中,Beijing Normal University及China Earthquake Administration的节点也较大,显示其在国际合作中的重要地位。整体Q值0.5823表明合作网络结构较为合理。
4. 研究主题构成与演化分析
4.1. 研究主题的核心构成
关键词是能够反映论文主体概念的一组主题词,出现频率高的关键词一般代表了该领域的研究热点[17],使用Citespace对论文关键词进行分析。关键词共现分析是一种通过分析文献中出现频率较高且相互关联的关键词,揭示研究领域内主要概念及其相互关系的方法。
通过对CNKI与WOS数据库文献关键词共现网络(图6、图7)的分析可知,人工智能在地质灾害研究中的应用主题主要集中在“滑坡易发性评价”“机器学习模型优化”“遥感数据融合”等方向。其中,“人工智能”“机器学习”“地质灾害”构成知识图谱的核心节点,显示AI技术已成为推动地质灾害风险研究的重要驱动力。
在CNKI数据库中,机器学习与地质灾害的共现频率最高,反映出AI技术正逐渐替代传统的经验型分析框架。例如,仉文岗等[7]利用随机森林模型结合水系分区方法优化滑坡易发性评价,模型准确率显著提高;方然可[18]等则通过逻辑回归与贝叶斯优化方法构建区域滑坡预警模型,验证了机器学习模型在灾害预测中的可解释性与稳定性。WOS数据库中,Arabameri Alirez [13]与Pradhan Biswajeet [14]等学者则聚焦随机森林与深度学习的国际化应用研究,其成果进一步推动了AI模型在灾害风险图构建中的全球化应用。
Figure 6. CNKI database keyword co-occurrence network
图6. CNKI数据库关键词共现网络
Figure 7. WOS database keyword co-occurrence network
图7. WOS数据库关键词共现网络
这些高频共现主题揭示出地质灾害研究正在从“地质机制分析”向“智能预测建模”演化,研究范式发生了从理论经验到数据驱动的重大转型。
4.2. 研究主题的阶段演化
结合关键词聚类网络图(图8、图9)与时间线图谱(图10、图11)分析,CNKI与WOS数据库的研究演化路径可划分为三个阶段:
Figure 8. CNKI database keyword clustering network
图8. CNKI数据库关键词聚类网络
Figure 9. WOS database keyword clustering network
图9. WOS数据库关键词聚类网络
Figure 10. CNKI database keyword clustering timeline map
图10. CNKI数据库关键词聚类时间线图谱
(1) 起步阶段(2002~2012):以“滑坡”“地质灾害”“GIS分析”等为关键词,研究多采用层次分析法、逻辑回归等传统方法。例如,叶润青[19]等基于图像分类法提升滑坡识别精度,奠定了灾害监测数据化的基础。
(2) 融合阶段(2013~2019):人工智能技术逐步引入风险预测研究。典型文献如胡安龙[4]等利用智能算法优化支持向量机模型,提高了滑坡稳定性预测的精度;Liu [5]等则将浅层滑坡预测与机器学习模型结合,实现了由经验模型向数据模型的跨越。
Figure 11. WOS database keyword clustering timeline map
图11. WOS数据库关键词聚类时间线图谱
(3) 深化阶段(2020~2025):研究重心转向“深度学习”“随机森林”“多源数据融合”。龙玉洁[20]等利用随机森林模型提取汶川震后10年滑坡信息,实现了灾害活动的量化分期;朱彪彪[21]等通过知识图谱方法识别出人工智能与地质大数据交叉领域的研究前沿。
从整体趋势看,中外研究在发展节奏上趋于一致,但国内学者更注重灾害情境化分析与应用落地,而国外研究则侧重算法优化与模型可解释性。
这种阶段性演化反映了AI技术在地质灾害领域从“工具引入”到“方法融合”,再到“智能化体系构建”的系统进化过程。
4.3. 研究热点与前沿趋势分析
Figure 12. CNKI database keyword burst map
图12. CNKI数据库关键词突现图谱
Figure 13. WOS database keyword burst map
图13. WOS数据库中关键词突现图谱
关键词突现分析结果(图12、图13)显示,近五年研究热点明显向“深度学习”“耦合模型”“可解释性AI”等方向聚焦[22]。尤其是“降雨阈值”“信息量法”“多源融合”等新兴突现词,表明研究正从模型构建迈向灾害机理解释与精度优化阶段。
当前国际前沿呈现出以下三大趋势:
(1) 算法集成与轻量化:通过贝叶斯优化、特征递归消除等方法提升模型的可泛化性与计算效率;
(2) 多源数据融合:遥感、气象与地形数据的综合分析成为提升预测精度的关键;
(3) 可解释性研究深化:XAI理念的引入,使模型结果与地质机理的对应关系更加清晰。
未来研究将进一步聚焦“深度学习 + 多尺度灾害预测”的框架构建,以实现风险评估的高精度化与可追溯性。
5. 讨论
本研究通过对2002年至2025年间地质灾害与人工智能技术相关文献的分析,揭示了人工智能(AI)在地质灾害风险预测领域的应用演变。结果表明,地质灾害研究的研究模式已经发生了显著变化,AI和机器学习(ML)技术逐步取代了传统的统计分析方法,成为推动领域发展的核心动力。
5.1. 研究范式的转变
通过分析,明显看到地质灾害风险预测的研究范式发生了转变,从依赖于传统统计模型的经验分析方法,逐步转向使用机器学习与深度学习等AI技术进行数据驱动的精确预测。这一转变不仅仅是技术层面的进步,也是方法论的突破。AI的引入推动了地质灾害风险评估从定性分析到定量预测的转型,尤其是在滑坡易发性评价、风险评估及多源数据融合等方向的应用。
然而,尽管AI技术在预测精度和效率上取得了显著进展,但“黑箱”问题仍然是目前AI技术面临的主要挑战之一。AI模型虽然在预测能力上表现出色,但其复杂的决策过程往往缺乏透明度,这在灾害预测应用中可能导致信任问题。因此,未来的研究应致力于提升AI模型的可解释性,尤其是结合可解释性人工智能(XAI)技术,揭示算法参数与地质灾害机理之间的内在联系。
5.2. 新兴前沿:跨学科的融合
分析结果还显示,地质灾害预测领域正逐渐向跨学科融合的方向发展。特别是遥感数据与多源异构数据的融合,以及AI技术的结合,成为提升地质灾害预测精度和科学性的关键因素。AI技术与遥感数据的结合,不仅能够提高灾害风险评估的自动化水平,还能提供更深入的灾害机理分析,进一步优化预测的准确性。
未来的研究将更多地聚焦于AI与不同类型地质数据的融合。结合遥感、气象与地形数据的综合分析,能够进一步提升风险评估模型的精度,并为实时灾害监测提供更多的技术支持。
5.3. 加强国际合作
尽管国内在地质灾害智能化预测方面取得了显著进展,但从作者合作网络分析来看,国际合作仍显薄弱。国际合作的不足限制了跨国研究和技术的共享,影响了成果的全球应用。因此,未来的研究应加强国际间的合作,推动数据共享和跨学科的协作,以促进地质灾害智能评估方法的标准化,并推动成果的国际化应用。
在地质灾害领域,全球性灾害频发,国际合作对于建立跨国、跨机构的灾害预警和风险管理平台至关重要。通过加强国际合作与资源共享,能够为不同地区提供适应性强的智能预测与风险管理方案。
5.4. 研究局限性与未来方向
本研究虽然揭示了人工智能在地质灾害风险预测中的演变路径,但仍存在一定局限性。首先,文献数据主要来自CNKI与Web of Science数据库,可能忽略了其他数据库或语言中的相关研究;其次,本文对关键词的筛选与合并集中在高频与高中心性的词汇上,可能未能充分展示一些新兴前沿领域的研究动态。
未来的研究可以进一步拓宽数据来源,探索实时监测数据在灾害预测中的应用,尤其是与AI算法相结合,提升预测的实时性与精准度。此外,研究者应加强AI算法的进一步优化,结合环境、经济和社会数据,开发更加综合的风险评估模型,以推动地质灾害智能预测体系的完善。
6. 结论
本研究通过对2002~2025年间地质灾害与人工智能交叉领域文献的分析表明,该领域研究呈现持续增长态势,特别是在2018年后发文量显著上升,研究主题从传统GIS与数值模拟逐步转向以机器学习、深度学习为核心的数据驱动范式,标志着智能化已成为地质灾害研究的重要技术支撑。当前研究热点集中于滑坡、泥石流易发性评价,以及随机森林、神经网络等算法在风险评估中的应用,遥感与气象数据的融合进一步提升了预测的自动化水平与精度。
近年来,研究前沿呈现出向智能融合与可解释性深化的趋势。2020年以来,“深度学习”“耦合模型”“降雨阈值”等突现词频出,表明研究重点正逐渐从单一模型构建转向多模型协同与机制解释。未来需致力于提升模型透明度,加强特征重要性分析与预测不确定性的量化,以推动风险评估向科学化、可追溯的方向发展。
展望未来,应在数据层面构建多源异构的地质灾害统一数据库,促进遥感、气象、地形与地下结构数据的高精度融合;在算法层面开发轻量化、可解释、多方法融合的预测模型,增强其实时计算与自适应能力;在应用层面推动建设国际合作的智能监测与风险管理平台,促进科研成果在灾害预警、国土规划与生态保护等领域的工程化落地。总体而言,人工智能正引领地质灾害风险评价进入一个更精准、自动化与可解释的新阶段,其与多源数据及先进算法的深度融合,将在灾害预测、防治决策与应急响应中发挥日益关键的作用。