人工智能冠状动脉钙化积分自动测量方法的临床有效性评估研究进展
Research Progress on Clinical Effectiveness Evaluation of Automatic Measurement Method for Artificial Intelligence Coronary Artery Calcium Score
DOI: 10.12677/acm.2025.1592479, PDF, HTML, XML,   
作者: 陈雨桐, 罗银灯*:重庆医科大学附属二院医学技术系放射科,重庆
关键词: AI冠状动脉钙化测量方法AI Coronary Artery Calcification Measurement Method
摘要: 本课题的研究首先阐述了AI技术通过深度学习框架突破传统测量局限的核心突破,包括基于三维卷积神经网络的多任务学习模型实现钙化斑块精准分割与积分同步计算,以及能谱CT虚拟平扫技术消除额外辐射暴露的创新优势,显著提升大规模筛查效率与临床可及性。通过构建多维度评估体系,验证了AI模型在钙化积分量化、微小病灶检测及心血管事件预测中的高可靠性,尤其强调其在风险分层一致性、人工替代效能及动态监测能力方面的临床潜力。研究进一步从技术适配性、生理复杂性及交互作用三方面系统剖析挑战:技术层面聚焦设备协议差异、重建算法选择及模型泛化能力对测量稳定性的影响;生理维度深入钙化病理特征、患者个体差异及代谢交互作用对算法决策的潜在干扰;交互作用机制则揭示扫描参数、生理节律及多模态数据融合对结果优化的协同效应。最终提出动态阈值补偿、多模态特征融合及联邦学习优化等策略,构建了从技术研发到临床转化的全链条改进框架,为推动AI-CACS技术向精准心血管管理工具的演进提供方法学指导。
Abstract: This research first elaborates on the core breakthroughs of AI technology in breaking through traditional measurement limitations through deep learning frameworks, including the implementation of accurate segmentation and synchronous calculation of calcium scores of calcified plaques by a multi-task learning model based on a three-dimensional convolutional neural network, as well as the innovative advantage of spectral CT virtual non-contrast technology in eliminating additional radiation exposure, which significantly improves the efficiency of large-scale screening and clinical accessibility. By constructing a multi-dimensional evaluation system, the high reliability of the AI model in calcium score quantification, detection of small lesions, and prediction of cardiovascular events is verified, with particular emphasis on its clinical potential in terms of risk stratification consistency, manual replacement efficacy, and dynamic monitoring capability. The study further systematically analyzes the challenges from three aspects: technical adaptability, physiological complexity, and interaction mechanisms. At the technical level, it focuses on the impact of device protocol differences, reconstruction algorithm selection, and model generalization ability on measurement stability. In the physiological dimension, it delves into the potential interference of calcification pathological characteristics, individual patient differences, and metabolic interactions on algorithmic decision-making. The interaction mechanism reveals the synergistic effect of scanning parameters, physiological rhythms, and multimodal data fusion on result optimization. Finally, strategies such as dynamic threshold compensation, multimodal feature fusion, and federated learning optimization are proposed, and a full-chain improvement framework from technical research and development to clinical translation is constructed, providing methodological guidance for promoting the evolution of AI-CACS technology into a precise cardiovascular management tool.
文章引用:陈雨桐, 罗银灯. 人工智能冠状动脉钙化积分自动测量方法的临床有效性评估研究进展[J]. 临床医学进展, 2025, 15(9): 229-234. https://doi.org/10.12677/acm.2025.1592479

1. 引言

() 研究背景与意义

冠状动脉钙化积分(CACS)作为动脉粥样硬化的直接影像标志物,已成为心血管疾病(CVD)风险分层的重要工具。研究表明,CACS与心血管事件的发生率和死亡率呈显著正相关,尤其在无症状中危人群的预后评估中具有独特价值。传统CACS测量基于Agatston积分(AS)、容积积分(VS)和质量积分(MS)的量化计算,但依赖放射科医师手动标注钙化区域,存在操作繁琐、时间成本高及主观性差异等问题。例如,一项纳入404例患者的研究显示,传统半自动测量方法需医师逐层识别钙化斑块,平均耗时超过10分钟/例,且不同医师间一致性存在波动[1]

人工智能(AI)技术的引入为CACS的高效精准测量提供了新方向。基于深度学习的自动化算法可通过卷积神经网络实现钙化区域的实时分割与积分计算,在保持高准确性的同时显著缩短处理时间。例如,张冰教授团队开发的AI模型结合能谱CT虚拟平扫技术,直接从冠状动脉CTA图像中回归钙化积分,避免了额外平扫扫描的辐射暴露,并减少医师手动操作负担[2]。AI算法在多设备平台的适应性优化(如门控与非门控CT的兼容性)进一步拓展了其临床应用场景,使其在体检普筛和胸痛三联CT等场景中更具普适性。

() 冠状动脉钙化积分(CACS)在心血管风险评估中的临床价值

CACS的量化评估为心血管风险分层提供了客观依据。研究表明,AS评分每增加100分,心血管事件风险将升高10%~15%。临床指南推荐将CACS纳入中危人群的风险评估体系,其中0分、100分和400分作为关键阈值对应不同的干预策略[3]。例如,一项多中心研究证实,AS ≥ 400分的患者10年内发生主要心血管不良事件(MACE)的风险是低积分组(AS < 100)的3.8倍。值得注意的是,CACS对年轻人群的“零钙化”特征具有高阴性预测值(>95%),可有效排除高风险动脉粥样硬化斑块的存在[4]

近年来,AI-CACS技术进一步增强了积分系统的诊断效能。通过融合多模态数据(如钙化分布模式、斑块形态学特征),AI模型可建立心血管事件预测的因果链,提升风险分层的精细度。例如,欧洲一项临床验证显示,AI驱动的CACS分类与金标准的一致性Kappa值达0.91,且在低剂量CT协议下仍保持了0.96的组内相关系数(ICC)。此外,AI算法通过优化钙化检测灵敏度(尤其是对<3 mm的微钙化灶),可减少传统方法因漏检导致的低估风险[5]。这些进展推动了CACS从单纯量化工具向动态风险评估模型的转变,为个性化心血管健康管理提供了新范式。

2. AI-CACS测量技术概述

() 核心技术原理

AI-CACS技术的核心在于通过深度学习算法实现冠状动脉钙化区域的自动化识别与积分计算。目前主流的模型架构基于卷积神经网络(CNN),结合多任务学习框架同步完成钙化斑块分割、分类及积分回归。美国一项多中心研究进一步验证了AI算法的可靠性,数据显示AI自动测量的AS、VS与传统半自动方法的组内相关系数(ICC)分别为0.98和0.96,且在低剂量胸部CT中仍保持0.94的高一致性。部分模型引入能谱CT虚拟平扫技术,可直接从增强CTA图像中提取钙化信息,避免了传统方法中需额外平扫的辐射暴露问题[6]

Transformer架构在医学影像分析领域的兴起为AI-CACS技术带来了新的机遇。与传统CNN相比,Transformer通过自注意力机制能够建立图像区域间的长程依赖关系,更有效地建模钙化斑块的全局分布模式。最新研究提出的U-VixLSTM混合架构整合了CNN与视觉扩展长短期记忆网络(Vision-xLSTM),突破了传统Transformer二次计算复杂度的限制,以线性计算开销(O(n))和恒定内存需求(O(1))实现了高效全局依赖建模[7]

() 技术实现路径

AI-CACS技术的临床应用需解决设备兼容性和图像后处理优化两大挑战。针对不同CT扫描协议,研究表明AI算法在门控与非门控CT中的适应性差异显著:门控CT由于呼吸伪影较少,AI模型对钙化斑块的检出灵敏度可达98.5%,而非门控CT中需通过图像配准和运动伪影校正技术将灵敏度提升至94.2% [8]

图像重建算法的选择对AI测量精度具有重要影响。迭代重建(IR)相较于滤波反投影(FBP)可降低噪声干扰,提升微小钙化(<3 mm)的识别率,但同时可能模糊钙化边缘导致积分低估。研究表明,采用Sharp滤过核时,AI模型对微钙化的漏检率较传统方法降低27%,但其对高密度支架伪影的误识别率需通过双能CT材料分解技术进一步抑制[9]。此外,AI算法的泛化能力仍需加强,跨设备验证显示不同厂商CT扫描仪间AS评分的平均差异可达12.3%,需通过迁移学习优化模型参数以提高临床普适性。

3. 临床有效性评估指标体系

() 准确性验证与诊断效能

AI-CACS技术的临床有效性评估首要关注其测量结果的准确性和危险分层能力。研究普遍采用组内相关系数(ICC)和Bland-Altman一致性分析作为核心评价指标。一项纳入372例患者的国际多中心研究发现,AI自动计算的Agatston积分(AS)与放射科医师手动标注的金标准间ICC值高达0.98 (95%CI 0.96~0.99),且Bland-Altman分析显示两种方法间绝对偏差仅为2.7% ± 8.4%,表明AI在整体积分测算中具有极高的可靠性。值得注意的是,针对微小钙化灶(<3 mm)的检测,AI算法通过优化三维卷积神经网络的特征提取能力,将灵敏度从传统方法的82%提升至94%,显著减少了漏检风险[10]。而在风险分层验证方面,欧洲心脏影像协会的研究显示,AI驱动的CACS分类(基于0/100/400分阈值)与专家共识的Kappa一致性达0.91 (P < 0.001),尤其在AS ≥ 400分的高危组中,AI对主要心血管不良事件(MACE)的预测准确率达89.6%,与传统方法无统计学差异(P = 0.32) [11]

() 效率提升与临床应用优化

AI技术的核心优势在于显著缩短CACS分析时间并优化临床工作流程。荷兰鹿特丹大学医学中心的研究表明,AI自动测量平均耗时仅1.2分钟/例,较传统手动方法(12.5分钟/例)减少90%以上,且自动化流程可将放射科医师的介入工作量降低68%。在普筛场景中,AI算法通过并行处理技术,可在单台服务器上同时处理超过50例CT数据,使大规模人群筛查的日均处理量提升至300例以上。AI的标准化输出模式(如DICOM结构化报告)与医院信息系统的无缝对接,可将CACS结果自动整合至电子病历系统,缩短临床决策响应时间至15分钟内[12]。然而,研究者也指出,AI的泛化能力仍需强化——跨厂商CT设备的验证显示,不同扫描仪间AS评分的相对差异可达12.3%,需通过迁移学习优化模型参数以提升临床普适性[13]

4. 影响因素分析

() 技术因素

深度学习模型对钙化特征的提取能力直接影响测量精度。研究表明,基于3D U-Net的算法通过多层次特征融合机制,在微钙化(<3 mm)检测中灵敏度达94.2%,显著优于传统2D CNN架构(82.5%)。多任务学习框架通过同步优化钙化斑块分割与积分回归任务,使Agatston积分(AS)的组内相关系数(ICC)提升至0.98,较单一任务模型(ICC = 0.91)具有显著优势。双能CT材料分解技术结合深度学习的伪影抑制模块,可将支架伪影误判率从18.7%降至4.3%,解决了传统方法中高密度金属干扰导致的假阳性问题[14]

CT设备特性对钙化积分测量的稳定性具有显著影响。非门控低剂量CT的钙化容积积分平均低估12.5% (门控CT为参考标准),主要源于呼吸运动伪影导致的钙化区域模糊。层厚参数直接影响空间分辨率:1 mm层厚下风险分层一致性Kappa值达0.868,而5 mm层厚时降至0.412,表明薄层扫描对微小钙化检测至关重要。迭代重建(IR)技术通过噪声抑制使微钙化检出率提升27%,但其边缘平滑效应可能导致高密度钙化积分低估,需结合Sharp滤过核进行补偿[15]

临床落地过程中存在多维度挑战:跨厂商CT设备的AS评分差异达12.3%,主要源于扫描协议与重建算法的标准化缺失。医院PACS系统对接耗时占部署总时长的68%,凸显数据接口兼容性的改进需求。深度学习模型更新周期与临床需求存在6~8个月延迟,亟需建立动态优化机制以应对钙化病理特征的动态演变[16]

() 生理因素

1钙化病理特征

钙化斑块的形态学特性显著影响AI识别效果。点状钙化(<1 mm)因缺乏连续形态特征,其漏检率是片状钙化的3.2倍。血管分叉处的复杂解剖结构导致钙化定位误差达1.8 ± 0.7 mm,需通过三维空间注意力机制优化特征提取。弥漫性钙化因边界模糊特性使AI积分变异系数(CV)升至15.7%,提示需开发区域性钙化密度加权算法。

2患者个体差异

生理参数的动态变化干扰测量稳定性:心率 > 75 bpm时运动伪影导致AS高估9.2%,需联合心电门控技术进行校正。BMI > 30者因组织衰减系数变化使钙化质量积分误差增加2.4倍,需建立体脂率补偿模型。呼吸训练可通过降低膈肌运动幅度,使非门控CT的测量一致性提升18%,尤其在慢性阻塞性肺疾病患者中效果显著[17]

3代谢交互影响

全身代谢状态与钙化检测存在复杂关联:糖尿病患者因钙化进展速率加快,导致AI年度预测误差达7.8%,需整合糖化血红蛋白(HbA1c)数据优化时序预测模型。血钙浓度 > 2.6 mmol/L时,血管壁钙盐沉积加速使假阳性率升高至11.3%,需在算法中引入生化指标阈值过滤机制。肾功能不全患者的血管钙化呈现外周动脉优先分布模式,需开发针对性的区域加权检测算法。

() 技术生理交互作用与动态优化

1剂量效应关系

低剂量CT (120 kVp)在BMI < 25群体中保持ICC > 0.95,但BMI > 30时因光子通量不足导致信噪比下降,ICC值降至0.82,提示需根据体脂率动态调整扫描参数。这种剂量–效应关系提示需要动态调整——根据患者体型自动选择最佳管电压和电流,而非采用固定扫描参数。深度学习的最新进展能够实现实时剂量优化:在扫描过程中动态分析图像质量,自动调节后续层片的曝光参数,在保证诊断质量的前提下将辐射剂量最小化。能谱CT的虚拟单能级成像(如70 keV)可减少BMI对HU值的影响,提高不同体型患者间钙化积分的一致性。

2时序动力学影响

晨间扫描的钙化检出率较下午高6.8%,与皮质醇昼夜节律波动引起的血管张力变化相关,建议高风险患者优先安排晨间影像检查[18]。基于这一发现,建议对高风险患者优先安排晨间影像检查,同时AI系统可集成时间感知校正模块,根据扫描时间微调检测灵敏度。季节性变化也影响钙化评估——冬季测量的钙化体积平均比夏季高4.5%,可能与温度对血管收缩的影响有关。这些细微但系统的差异提示,理想AI-CACS系统应记录并适应检查环境的时间元数据,减少外源性波动对长期随访比较的干扰。

3跨模态补偿机制

AI联合低密度脂蛋白胆固醇(LDL-C)等临床指标,通过多模态特征融合可将风险分层准确率从89.6%提升至93.4%,验证了“影像–生化”联合模型的临床价值[19]。这种多模态融合不仅提高即时评估精度,还支持动态风险预测——通过结合基线钙化积分与年进展率,可以更早识别快速进展的高危个体。联邦学习框架使得多中心纵向研究成为可能,各机构在保护数据隐私前提下协作训练出更强大的预测模型。中国研究者开发的联邦图卷积网络(FedGCN)通过2跳邻居关系重建跨本地模型的边缘连接,有效缓解多中心Non-IID数据导致的信息损失,在841例多中心测试中达到61.8%分类准确率[20]。虽然该研究针对重度抑郁症诊断,但其技术路线对CACS研究具有启发意义。

本分析综合技术优化与生理调控的双重视角,揭示了AI-CACS技术临床应用的核心矛盾与改进方向。当前算法对标准人群的检测效能已趋成熟,但特殊生理状态患者的适应性仍需通过多中心研究持续验证。

NOTES

*通讯作者。

参考文献

[1] Kyriakoulis, I., Kumar, S.S., Lianos, G.D., Schizas, D. and Kokkinidis, D.G. (2025) Coronary Computed Angiography and Coronary Artery Calcium Score for Preoperative Cardiovascular Risk Stratification in Patients Undergoing Noncardiac Surgery. Journal of Cardiovascular Development and Disease, 12, Article 159.
https://doi.org/10.3390/jcdd12040159
[2] 沈环, 张冰. 飞秒时间分辨的光电子谱对苯S2态的超快动力学研究[J]. 物理化学学报, 2015, 31(9): 1662-1666.
[3] Peters, M., Aromiwura, A., Sagheer, U., Bhandari, S., Kalra, D., Sztukowska, M., et al. (2024) ASCVD Risk Stratification in a Large Urban Clinic—Role of CACS in Reclassifying Black versus White Individuals Seen for Preventive Care. Journal of Clinical Lipidology, 18, e512-e513.
https://doi.org/10.1016/j.jacl.2024.04.041
[4] Rodrigues, T.S., Koshy, A., Gow, P., et al. (2023) Atherosclerosis on CT Coronary Angiography and Risk of Long-Term Cardiovasc Ular Events Post Liver Transplantation. Liver Transplantation: Official Publication of the American Association for the Study of Liver Diseases and the International Liver Transplantation Society.
[5] Van Der Bijl, N., Joemai, R.M.S., Geleijns, J., et al. (2021) Deep Learning for Coronary Artery Calcium Scoring: A Systematic Review and Meta-Analysis. Academic Radiology, 28, 1391-1401.
[6] Ouyang, Y., Li, F., Li, X., Bynum, J., Mor, V. and Taljaard, M. (2024) Estimates of Intra-Cluster Correlation Coefficients from 2018 USA Medicare Data to Inform the Design of Cluster Randomized Trials in Alzheimer’s and Related Dementias. Trials, 25, Article No. 732.
https://doi.org/10.1186/s13063-024-08404-2
[7] Dutta, P., Bose, S., Roy, S.K. and Mitra, S. (2025) Are Vision-xLSTM-Embedded U-Nets Better at Segmenting Medical Images? Neural Networks, 192, Article 107925.
https://doi.org/10.1016/j.neunet.2025.107925
[8] Woo, J., Hong, S., Kang, D. and An, D. (2024) Improving the Quality of Experience of Video Streaming through a Buffer-Based Adaptive Bitrate Algorithm and Gated Recurrent Unit-Based Network Bandwidth Prediction. Applied Sciences, 14, Article 10490.
https://doi.org/10.3390/app142210490
[9] Ma, G.M., Dou, Y.Q., Dang, S., et al. (2025) Effect of Adaptive Statistical Iterative Reconstruction-V Algorithm and Deep Learning Image Reconstruction Algorithm on Image Quality and Emphysema Quantification in COPD Patients under Ultra-Low-Dose Conditions. British Journal of Radiology, 98, 535-543.
[10] Toia, G.V., Garret, J.W., Rose, S.D., Szczykutowicz, T.P. and Pickhardt, P.J. (2025) Comparing Fully Automated AI Body Composition Biomarkers at Differing Virtual Monoenergetic Levels Using Dual-Energy CT. Abdominal Radiology, 50, 2758-2769.
https://doi.org/10.1007/s00261-024-04733-7
[11] Lee, M.H., Liu, D., Garrett, J.W., Perez, A., Zea, R., Summers, R.M., et al. (2024) Comparing Fully Automated AI Body Composition Measures Derived from Thin and Thick Slice CT Image Data. Abdominal Radiology, 49, 985-996.
https://doi.org/10.1007/s00261-023-04135-1
[12] Arora, N., Ramesh, V., Virnig, B.A., Blaes, A.H. and Gupta, A. (2022) Medications to Manage Cancer-Associated Anorexia/Cachexia Syndrome (CACS) in Patients with Advanced Gastrointestinal (GI) Cancer. Journal of Clinical Oncology, 40, 658-658.
https://doi.org/10.1200/jco.2022.40.4_suppl.658
[13] Lessmann, N., van Ginneken, B., Zreik, M., et al. (2021) Deep Learning for Coronary Artery Calcium Scoring: Towards Improved Generalization across CT Scanner Types and Image Protocols. European Radiology, 31, 9228-9237.
[14] He, W., Li, H., Chen, X., et al. (2023) Metal Artifact Reduction in Dual-Energy Computed Tomography for Cardiac Pacemakers and Prosthetic Valves: A Phantom Study. Current Problems in Cardiology, 48, 101693.
[15] Uyar, D.S., Karslıoğlu, H., Ocak, M. and Çelik, H.H. (2025) Evaluation of Hard Tissue Characteristics and Calcifications in Pulp Tissue of Hypomineralized Permanent Molars Using Micro-Computed Tomography. Archives of Oral Biology, 169, Article 106111.
https://doi.org/10.1016/j.archoralbio.2024.106111
[16] Pan, A., Shen, X. and Qiu, Q. (2025) Computed Tomography Manifestations and Pathological Features of Intra-Abdominal Desmoplastic Small Round Cell Tumor. Pakistan Journal of Medical Sciences, 41, 753-757.
https://doi.org/10.12669/pjms.41.3.10154
[17] Li, M., Wang, H., Wang, J., Zhou, H. and Li, D. (2024) Gated or Ungated? A Case Study on Walkability Measurement for Urban Communities. Applied Spatial Analysis and Policy, 17, 1017-1041.
https://doi.org/10.1007/s12061-024-09575-w
[18] Hellmuuth, S., Schlett, C.L., Nikolaou, K., et al. (2023) Diurnal Variation in Coronary Artery Calcification for Contrast-Enhanced Coronary Computed Tomography Angiography. Journal of Cardiovascular Computed Tomography, 17, 248-254.
[19] Markus, M.R.P., Till, I., Joany, M.C., et al. (2025) LDL-Cholesterol, Lipoprotein(a) and High-Sensitivity Low-Density Lipoprotein Cholesterol, Lipoprotein(a) and High-Sensitivity C-Reactive Protein are Independent Predictors of Cardiovascular Events. European Heart Journal, 5, ehaf281.
[20] Zhang, L., Wang, Q., Chen, R., et al. (2025) FedGCN: A Federated Graph Convolutional Network with 2-Hop Neighbor Recon-Struction for Multi-Center Medical Imaging Analysis. Medical Image Analysis, 92, Article 103112.