骨质疏松性骨折风险预测模型的系统评述: 算法比较、临床适用性与发展路径
Systematic Review of Osteoporotic Fracture Risk Prediction Models: Algorithm Comparison, Clinical Applicability, and Development Pathways
DOI: 10.12677/acm.2026.1631163, PDF, HTML, XML,    科研立项经费支持
作者: 王 钟, 杜昭春:绍兴文理学院医学院,浙江 绍兴;马肖枫, 冯建钜*:绍兴文理学院附属诸暨医院(诸暨市人民医院)放射科,浙江 绍兴
关键词: 骨质疏松性骨折风险预测模型传统统计模型机器学习多算法融合Osteoporotic Fracture Risk Prediction Model Traditional Statistical Model Machine Learning Multi-Algorithm Fusion
摘要: 骨质疏松性骨折是骨质疏松症的严重后果,早期识别高危人群并实施个性化干预是降低其发生风险的关键,因此开发高效、精准的风险预测模型具有重要临床意义。本文系统回顾了近10年国内外骨质疏松性骨折风险预测模型的研究进展。当前模型构建主要围绕年龄、骨密度、跌倒史等核心风险因素展开,并在特定人群中纳入共病、用药等复杂变量。在方法学上,研究从传统的Logistic回归、COX比例风险模型,发展到集成学习、深度学习等多种机器学习算法,后者在捕捉复杂非线性关系和高维数据方面展现出优势。然而,该领域仍面临模型可解释性不足、外部验证缺乏、数据标准化程度低等关键挑战,制约其临床实用化。未来,通过深度融合多模态数据、发展动态预测能力,并加强模型的验证与评估,是实现精准预防和临床转化的关键方向。
Abstract: Osteoporotic fractures represent a severe consequence of osteoporosis, making the early identification of high-risk individuals and implementation of personalized interventions crucial for reducing their incidence. This underscores the clinical significance of developing efficient and accurate risk prediction models. This review synthesizes recent advances over the past decade in risk prediction models for osteoporotic fractures. Current models primarily incorporate core risk factors such as age, bone mineral density, and fall history, while also integrating more complex variables like comorbidities and medication use in specific populations. Methodologically, research has evolved from traditional logistic regression and COX proportional hazards models to various machine learning approaches, including ensemble learning and deep learning, which demonstrate advantages in capturing complex nonlinear relationships and high-dimensional data. Nevertheless, the field still faces key challenges—such as limited model interpretability, insufficient external validation, and low data standardization—that hinder clinical translation. Moving forward, key directions for achieving precise prevention and clinical application include deeper integration of multimodal data, development of dynamic prediction capabilities, and enhanced model validation and evaluation.
文章引用:王钟, 杜昭春, 马肖枫, 冯建钜. 骨质疏松性骨折风险预测模型的系统评述: 算法比较、临床适用性与发展路径[J]. 临床医学进展, 2026, 16(3): 3553-3564. https://doi.org/10.12677/acm.2026.1631163

1. 引言

在全球人口结构老龄化的宏观背景下,骨质疏松症及其严重后果:骨质疏松性骨折(osteoporotic fracture, OPF)的发病率急剧攀升,已成为亟待解决的全球性健康问题。骨质疏松症(osteoporosis, OP)核心病理特征在于骨密度(bone mineral density, BMD)的显著降低及骨组织微观结构受损,致使骨骼的生物力学强度下降,脆性急剧增加,导致髋部、脊柱、远端前臂(或腕部)及肱骨等关键部位骨折风险显著增高[1]-[3],OPF不仅给患者带来疼痛、功能障碍甚至永久性残疾,严重降低患者生活质量,更是老年人群死亡率攀升的重要原因之一,同时其导致的长期护理、生产力丧失及相关社会保障支出,对社会经济和医疗资源构成了巨大的双重负担[4]

对高危人群进行早期、精准的识别与干预,是预防OPF的关键环节,具有重要的公共卫生学意义[5]。风险预测模型作为OPF防控的重要循证工具,通过整合多种疾病相关危险因素,构建用于估计个体发病概率或未来骨折风险的数学模型[6] [7]。模型性能评价主要包括区分度(Discrimination)与校准度(Calibration)两个方面,前者反映模型区分不同风险人群的能力,常以AUC或C指数衡量,其值越高表示模型的区分能力越好;后者评估预测概率与实际发生率的一致性,通常采用H-L检验(Hosmer Lemeshow)进行评价,P值越大表示模型的校准度越好[8]。此外,模型的临床应用价值还依赖其在内部验证与外部验证中的稳定性与泛化能力[9]。尽管目前全球已开发出多种OPF风险预测模型,但由于预测因子选择、建模方法及源人群差异显著,其预测性能存在较大异质性,亟需在统一方法学框架下进行系统比较与优化,以提升临床适用性。

鉴于早期识别OPF危险因素及干预高危人群对预防骨折的重要意义,本文聚焦OPF预测模型的核心要素展开系统分析。通过梳理模型构建中的危险因素筛选逻辑、模型构建中的算法差异,以及预测性能的实证结果,旨在总结当前骨质疏松性骨折风险预测模型领域的研究进展,为临床医生、研究人员和政策制定者提供借鉴。

2. 骨质疏松性骨折的危险因素

OPF的预测模型构建高度依赖危险因素的准确识别与整合[10]。这些核心因素,包括年龄(不可逆转的生理性风险因子)、既往脆性骨折史(尤其是髋部或椎体骨折,是未来骨折最强的临床预测指标之一)、BMD (骨质疏松诊断的金标准,其下降直接关联骨强度减弱)及跌倒史(骨折发生的直接诱因),在多数经典预测模型中均被确立为基础变量,构成了风险评估的基石[11]

然而,在特定人群或临床情境中,骨折风险受到更多复杂因素的调节。例如,患有内分泌疾病(如甲状腺功能异常、糖尿病)或风湿免疫性疾病(如类风湿关节炎)的患者,其骨代谢稳态常被破坏,加速骨量流失。长期使用某些药物,如糖皮质激素和质子泵抑制剂,亦被证实会干扰骨代谢或矿物质的吸收,进而增加骨折风险。此外,神经肌肉功能障碍(如帕金森病)所致的平衡能力下降,进一步提升了跌倒及骨折的发生概率[12]。这些特殊因素提示,在构建和运用预测模型时,需充分考虑人群异质性与共病情况。

当前预测模型构建的挑战与争议,主要集中于部分生活方式因素(如饮酒、咖啡摄入)及种族、地域差异对风险权重的影响[13]。尽管在年龄、性别、BMD等核心指标上已形成广泛共识,但针对上述争议性因素,不同研究的结论尚不一致,因为不同种族、地域人群的生活方式、遗传背景以及医疗环境等差异,可能使得模型在开发人群之外的群体中表现出较低的预测准确性和泛化能力[9]。未来模型的优化方向,应是在稳固核心危险因素框架的基础上,通过大规模、多中心的前瞻性研究,进一步厘清危险因素的作用机制与权重,从而提升模型在不同人群中的精准性与普适性,实现从群体预测到个体化风险评估的跨越。

3. 骨质疏松性骨折风险预测模型构建方法

在OPF预测模型的构建过程中,算法选择对模型的预测能力、临床可用性及泛化性能具有决定性影响[14]。目前,主流的建模方法可归纳为传统统计学模型、机器学习模型以及融合模型三大类。本文围绕这三个核心维度,系统分析不同模型在预测因子的选择、算法的构建及性能评估方面的特性与适用条件,为相关研究提供参考。

3.1. 基于传统统计学算法构建的OPF风险预测模型

3.1.1. Logistic回归模型:原理、应用与局限

Logistic回归是一种适用于二分类结局事件的回归分析方法,通过描述预测变量与患者结局之间的潜在关系来构建预测模型[15]。该模型训练速度快、可解释性高且预测性能良好,然而许多研究采用回顾性设计,难以建立因果关系;且研究样本主要来自单一或少数中心,模型的普适性受到限制。此外,部分研究并未明确说明结果事件数量与变量筛选过程中所纳入的变量数量之间的关系,故而存在模型过拟合的风险,并影响其泛化能力。再者大多数模型的评估基于内部验证,缺乏在大规模独立群体中的外部验证,其在不同临床环境下的表现尚待证实。尽管如此,多项研究仍基于其构建了有效模型[16] [17]。例如,Xia [18]等人利用来自两家医院的2015名骨质疏松症患者数据,通过单变量和多变量Logistic回归识别出年龄、BMI、跌倒史、糖皮质激素使用、碱性磷酸酶(ALP)水平、血清钙及多个部位的骨密度值等独立风险因素,其中糖皮质激素使用率的比值比(Odds Ratio, OR)最高。该模型在建模组和验证组中均表现出良好的判别能力(AUC分别为0.8165和0.8646),校准效果和临床获益也得到证实。马季等[19]另一项针对绝经后女性的研究纳入了年龄、骨密度、跌倒史及多项骨代谢标志物等17项危险因素,构建的Nomogram图预测模型同样显示出优异的准确性(AUC = 0.867, C-index = 0.867)。此外,也有研究开始探索将中医证候因素纳入变量筛选[20],如章轶立等[21]构建的包含骨密度、年龄、食物类、月经情况、孕产次数和肝肾阴虚证候的模型,其AUC达到0.8775,展现了病证结合预测模型的潜力。王龙等[22]对病证结合相关研究文献进行了定量分析,指出“风险预测模型”和“模型”是最重要的关键词。他们还预测,此研究方向未来可能成为OPF预测模型研究的重要趋势。近年来的研究进展已证实并深化了这一预见。例如,魏戌[23]等最新研究指出,整合疾病与证候的风险预测方法更符合骨质疏松症的临床诊疗需求,并就从目标结果选择到重要信息收集、数据挖掘建模及模型效度评估等环节,形成了统一的方法论共识。当前,该领域的研究前沿聚焦于利用人工智能、多组学技术及多模态数据(如舌象、脉象、影像学)进行跨尺度关联分析,旨在开发兼具“病”“证”属性的生物标志物及更精准的多维度风险预测模型,从而推动骨质疏松症的早期预警与精准诊疗体系构建。

3.1.2. COX比例风险回归模型:生存分析与人群特异性

COX比例风险回归模型是一种生存分析方法,能够同时分析多个风险因素与事件结局发生时间的关系,克服了单因素分析的不足[24],在需要关注时间–事件关联的OPF风险预测中具有独特优势。该模型特别适用于前瞻性队列研究,以评估个体在特定时间段内的骨折风险。

Tebe [25]等基于西班牙加泰罗尼亚初级保健数据库(SIDIAP)开发了主要部位骨质疏松性骨折(major osteoporotic fractures, MOF)的1年及5年风险预测模型。该模型利用COX比例风险回归,纳入了19个危险因素,在176万50~85岁人群的队列中显示出良好的区分度(1年及5年C-index分别为0.717和0.724),并经过了外部验证,证明了其在动态风险评估中的价值。但是该模型的普适性受到其开发人群特征的限制。主要由于建模数据来源于白种人,这可能直接导致其在其他种族或地域(如亚洲)人群中的预测性能下降[26]。最新的研究进展进一步印证了基于特定人群开发的模型直接推广使用的风险。例如,一项2025年的研究专门为具有高危骨折风险的智力障碍人群开发了新的预测模型(IDFracture) [27],因为通用模型可能低估该特殊人群的风险。该研究采用与Tebe等人相似的方法学框架,利用英国初级保健数据库(CPRD GOLD)开发了基于COX比例风险回归的10年MOF和髋部骨折风险模型,并在另一个独立数据库(Aurum)中进行了外部验证。模型展示了良好的区分度(MOF的C统计量为0.775)和校准度。这项研究凸显了针对具有独特风险特征的人群开发专属模型的重要性,而非直接套用基于普通人群构建的模型。因此,在将此类模型应用于新人群前,必须进行严格的外部验证和校准,必要时需开发或采用更贴合目标人群流行病学特征的模型,以避免因模型普适性受限而导致的预测性能下降。

3.1.3. 传统统计模型的临床适用性与决策价值

传统的统计模型(如Logistic回归和COX回归)是预测OPF风险的坚实基础。其主要优势在于原理清晰且解释性强,能够明确展示各风险因素与结果之间的关联强度(如OR值、HR值),便于临床医生理解和应用。同时,这些模型在计算效率上优于机器学习模型,对样本量的要求也相对宽松,因此适用于中等规模的数据集。然而,它们的局限性同样显而易见:这些模型通常假设变量与结果之间存在线性关系,难以有效捕捉复杂的非线性交互作用;此外,模型性能在很大程度上取决于变量的选择和质量,并且容易受到共线性的影响。传统模型更适用于对风险因素进行初步筛查、解释作用机制以及评估特定人群(尤其是与开发队列相似的人群)的风险。在临床应用中,经过严格且广泛外部验证的模型(特别是在目标人群中)具有更高的参考价值,可直接使用或通过校准来支持临床决策。最重要的是,许多模型缺乏充分的外部验证,当应用于与开发群体不同的特定人群时,其预测准确性可能会大幅下降,因此未经过充分外部验证的模型,尤其是基于特定族裔人群群体开发的模型,在更广泛的群体中应谨慎使用。这些模型可作为研究工具或临床参考,但不应作为普遍诊断标准。

3.2. 基于机器学习算法构建的骨质疏松性骨折风险预测模型

随着医疗数据维度的增加和数据结构复杂性的提升,传统的风险评估工具(如FRAX)和统计模型(如Logistic回归和COX比例风险模型)在整合复杂多维数据、处理非线性关系和高维特征方面存在局限[28]。相比之下,机器学习算法凭借其强大的模式识别与特征学习能力,为骨质疏松性骨折风险预测提供了新的工具,通常在预测性能上超越传统方法[29] [30]。以下将依据算法类别,对近年来的代表性研究与应用进展进行梳理。

3.2.1. 决策树模型:可解释性与泛化挑战

决策树模型通过树状规则提供直观的预测路径,其核心优势在于良好的可解释性,能够有效避免变量间的共线性问题,并实现风险评估过程的可视化[31]。例如,章轶立[32]等构建了基于SMOTE算法和C4.5决策树的绝经后女性骨质疏松性骨折分类模型,该研究针对北京、上海40~65岁女性高危人群,收集了1823例样本的危险因素及中医症状信息。并进行了为期3年的随访,然后使用C4.5决策树算法筛选出BMD、目眩等6个关键变量,并构建了包含5层19个节点的分类树模型。模型在测试中受试者工作特征曲线下面积(AUC)达到0.871 (95% CI: 0.8226~0.9211),表明其具有良好的区分能力。然而,该研究的样本量及来源地有限,导致模型的外推性可能受限,这凸显了决策树模型在小样本或特定人群数据中容易出现过拟合,从而泛化能力不足的问题。因此,决策树模型更常作为基础学习器被集成到梯度提升等更复杂的集成模型中,以提升整体预测性能和泛化能力。

3.2.2. Deep Hit模型:深度生存分析与动态预测

Deep Hit模型是一种专为生存分析设计的深度学习模型,能够直接估计事件发生的概率分布,并有效处理竞争风险和删失数据[33]。其架构通过共享子网络和特定事件子网络,擅长捕捉协变量与风险之间的复杂非线性关系。无需满足传统生存分析的比例风险假设,特别适合处理具有时间依赖性的骨折风险数据。一篇2025年关于人工智能在骨质疏松中应用的综述[34],总结了一项利用Deep Hit深度学习生存分析模型的研究。该研究将Deep Hit模型与COX比例风险模型结合,构建了一个动态评分系统,用于预测髋部骨折风险。在发现队列中,该混合模型预测髋部骨折风险的Harrell’s C指数高达0.860,并能准确预测68.8%的10年内严重骨折发生率,显著提升了对关键骨折事件的早期预警能力。该研究展示了Deep Hit深度学习生存分析模型在精准、动态风险预测方面的优势。然而,其临床实用性仍面临数据选择偏倚(如仅纳入有BMD数据的患者)和关键预测变量(如肌少症相关的人体成分数据)缺失的挑战,有待更多前瞻性外部验证研究的证实。Deep Hit模型近期研究重点在于扩展其处理纵向数据和集成特征选择的能力。例如,Dynamic-Deep Hit通过整合循环神经网络来处理患者随访中的时间变化协变量,使预测能随新测量值动态更新[35]。同时,通过在其全连接层引入组合群组与排他性稀疏正则化(Combined Group and Exclusive Sparsity, CGES),模型能在训练中自动筛选关键特征,可以提升在高维医疗数据中的效率和解释性。该类模型更适用于长期随访、风险随时间动态变化的骨折预测场景。

3.2.3. 梯度提升机模型:集成学习与高精度预测

梯度提升机(gradient boosting machine, GBM))通过迭代组合多个弱学习器来提升预测精度,在处理包含基因组、临床变量等多源异构数据时表现卓越。多项近期研究证实了其在骨折风险预测中的优越性。例如,一项2024年的研究比较了多种算法,发现XGBoost模型在预测骨质疏松症风险的所有评估指标(AUC、准确度、F1分数等)上均表现最佳[36]。另一项基于8530名患者电子健康记录的研究进一步表明,结合支持向量机与XGBoost的混合机器学习模型,预测准确率与精确度均超过90% [37]。这些研究凸显了集成学习方法在整合复杂风险因素、提升预测精度方面的强大能力,但其模型同样会面临目标人群有限、训练的样本量较小、可解释性相对较弱的问题。

3.2.4. 神经网络模型:非线性建模与多模态数据融合

人工神经网络(ANN)包括传统的前馈神经网络和更复杂的卷积神经网络(CNN)及其变体(如多层感知器MLP),擅长建模变量间复杂的非线性交互,具备强大的自动特征提取能力。研究表明,ANN在预测骨质疏松及相关骨折风险方面具有良好的性能[38]。例如,一项2023年的研究利用CT纹理特征结合ANN预测骨质疏松性压缩骨折[39],验证集AUC为0.867。另一项2019年研究构建的BP神经网络模型[40],在训练集上对骨质疏松诊断的AUC达到了0.970。神经网络尤其擅长处理图像等非结构化数据。此外,神经网络也被用于融合多源信息(如临床特征与影像学数据)进行综合预测。例如,研究通过CNN自动学习腰椎CT图像中的骨质微结构特征[41],实现骨质疏松的辅助筛查。也有研究对比发现,在预测椎体再骨折时,神经网络模型的性能与逻辑回归模型相近,但优于决策树模型[42]。虽然神经网络在处理多模态、高维数据时具有理论优势,但其实际应用效能依赖于大规模、高质量的训练数据,并始终伴随着模型解释性差的挑战。

3.2.5. 机器学习模型:性能优势与临床转化瓶颈

机器学习模型,特别是深度学习和集成学习算法,在骨质疏松性骨折风险预测中展现出超越传统模型的判别性能,其核心优势在于能够处理高维非线性关系、自动筛选重要特征并融合多模态数据[43]。然而,当前研究与实践仍面临三大核心局限:首先,高性能模型对样本量和数据质量要求严苛,在临床常见的小样本或不平衡数据中易出现过拟合;其次,模型复杂的决策过程降低了临床可解释性,这会影响临床医生对模型的信任与采纳;最后,大多数模型也存在基于特定人群队列开发的特点,普遍存在外部验证不足和跨人群泛化能力有限的问题。因此,未来的研究应重点关注如何克服这些局限,例如通过在大型、多样化的人群队列中进行严格的模型训练与外部验证,以及积极发展可解释人工智能技术以增强模型透明度,从而推动机器学习模型从预测精度向临床实效的可靠转化。

3.3. 多算法融合的骨质疏松性骨折风险预测模型

随着影像组学[44]、代谢组学及多模态健康数据的涌现[45],骨折风险预测已进入多维度、高复杂性的新阶段。面对此类高维异构数据,融合多种机器学习算法或结合传统统计方法的集成策略,正成为提升模型预测性能与稳健性的关键途径。

3.3.1. 集成模型的构建策略与性能优化

当前主流的融合策略主要包括两类:一是多模型比较与择优,即在同一数据集上并行训练多种算法(如逻辑回归、随机森林、XGBoost、神经网络等),通过严格的交叉验证和性能指标(如AUC、校准度)选择最优模型;二是集成学习(Ensemble Learning),通过堆叠(Stacking)、超级学习器(Super Learner)或梯度提升等框架,将多个基础模型的预测结果进行加权或元学习,以降低单一模型的方差与偏差,从而获得更稳定、更优越的综合性能。例如,Wu与Jung [46]基于老年男性骨质疏松性骨折研究队列,开发了一种集成学习模型以预测主要部位骨质疏松性骨折。该研究纳入了5130名老年男性参与者,并随机划分为训练集(80%)和测试集(20%),研究采用超级学习器(Super Learner)整合了七种机器学习算法作为基础学习器,包括随机森林、梯度提升、支持向量分类、K近邻、深度神经网络、高斯朴素贝叶斯和装袋分类器。在独立测试集(n = 1026)上的评估显示,超级学习器模型的预测性能显著优于任何单一基础模型,其曲线下面积(AUC)达到0.76,并且在准确率(95.6%)、敏感性(94.5%)、特异性(96.1%)等各项诊断性能指标上均表现最佳。该模型通过整合基因组数据和表型临床数据,展现了相较于仅包含临床风险因素的基线模型更优的预测能力。然而,该模型目前仅应用于老年男性群体,这限制了其在不同人群中的普适性,因此仍需进一步研究以评估其泛化能力。

3.3.2. 多算法融合模型在不同场景下的应用

一项基于超过240万丹麦人口登记数据的研究[47],是基于大规模电子健康记录(EHR)的人群,采用DART boosting算法构建了骨折风险预测模型(FREMML),其性能(AUC 0.77)优于既往版本,并利用可解释性人工智能技术提供了临床决策支持。这说明在超大规模真实世界数据中,先进的集成算法能够有效捕捉复杂的风险模式。

再者,在针对特定人群的分层建模方面,越来越多的研究开始注重针对不同性别、种族或共病状态人群构建特异性模型。有研究专门为慢性肾病(CKD)患者开发了性别分层的随机森林模型[48],在女性患者中表现出优异的预测性能(AUC 0.859)。另一项研究[49]则为HIV感染者开发了基于XGBoost的骨折风险预测工具,实现了很高的判别精度(AUC 0.979)。这些研究共同表明,针对具有独特风险特征的人群进行分层建模,比通用模型更具临床价值。

此外,整合多源数据提升预测精度也是前沿趋势:不少研究致力于整合基因组风险评分与临床表型数据。Wu与Jung对老年男性的研究将基因组变异与常规风险因素结合,通过集成学习模型实现了比传统FRAX工具更精准的预测,并显示出良好的跨种族适用潜力。这也揭示了融合遗传与非遗传信息的模型在实现个性化精准预防方面的巨大前景。

3.3.3. 多算法融合模型的未来潜力

基于多种算法的融合模型通过集成不同算法的优势,显著提升了骨质疏松性骨折风险预测的准确性、稳健性及人群适应性。它的核心潜力是能够更有效地处理与整合日益复杂的多来源、高维数据(如基因组、影像组学、纵向电子病历等),更接近真实的疾病风险机制。未来,融合模型的发展方向将集中于开发更智能的自动化模型选择与集成框架,以及探索如何更好地利用可解释性人工智能技术,以提升模型的透明度和临床可接受度。

4. 关键模型梳理与子领域分析

为了更加清晰地呈现研究现状并指导临床应用,我们将上述提及的关键模型按核心维度进行了梳理(见表1),再根据预测目标的不同,对模型子领域进行了划分与讨论。

4.1. 关键模型性能与设计要素关联分析

基于对现有研究的梳理,我们发现了与较好模型性能相关的一些设计要素及当前证据最支持的做法。首先,严格的外部验证是可信度的基础,性能指标优秀且经过独立外部验证的模型(如Tebe等人的COX模型、针对智力障碍人群的IDFracture模型)其临床可信度与泛化潜力更高。多数仅进行内部验证的模型,其外推性能存在不确定性。其次,针对特定人群的分层建模的预测效果可能优于通用模型,例如针对绝经后女性、老年男性、智力障碍或患有特定共病(如CKD、HIV)人群构建的专属模型,其性能(AUC常>0.85)往往优于直接套用于该人群的通用模型。这说明在模型选择或开发时需充分考虑人群异质性。再者,集成学习与先进机器学习算法具有较大的性能优势,在相同或类似数据集上,梯度提升机(XGBoost)、集成学习(如超级学习器)及深度学习(如Deep Hit)等复杂算法,通常在区分度(AUC/C-index)上优于传统Logistic回归或COX回归。它们更擅长捕捉复杂非线性关系与高维特征。此外,融合多维度数据是提升预测精度的关键路径,那些性能优异的模型常整合了超越传统危险因素的数据,如基因组数据、影像组学特征或中医证候信息等,这表明未来模型开发的方向之一应致力于多模态数据融合。

4.2. 不同预测模型子领域的分类与讨论

根据预测目标的具体场景,不同预测模型也能再分为以下子领域,其模型构建重点与适用场景各不相同。第一是初发骨折的风险预测,这是最主流的领域,旨在预测未发生骨折个体未来的骨折概率。代表性工具如FRAX,以及研究中的Tebe模型、FREMML模型等。它们多基于大样本人群队列开发,适用于社区筛查和初级保健中的风险分层。第二是再骨折的预测,针对已发生一次骨质疏松性骨折的患者,预测其发生再次骨折的风险。这类患者属于极高危人群,模型需要特别关注首次骨折的部位、严重程度及治疗情况。研究指出,预测椎体再骨折是重要的方向。此类模型对指导二级预防和强化治疗至关重要。第三是手术后不愈合或预后预测,此类模型聚焦于接受骨科手术(如椎体强化术、骨折内固定术)的患者,预测其术后再骨折、内固定失败、骨不连等结局。该领域模型需要整合手术相关信息、影像学详细评估及患者骨质量特异性指标。例如,有研究提及预测椎体强化术后再骨折风险。这类模型服务于围手术期精准决策和术后管理。另外还有仅适用于诊断骨质疏松的模型,此类模型的预测目标是当前是否患有骨质疏松症(通常以BMD为金标准),而非未来的骨折事件。例如,利用CT纹理特征结合ANN辅助筛查骨质疏松,或构建BP神经网络诊断骨质疏松。它们主要用于疾病筛查和早期诊断,是骨折风险管理的上一个环节。

通过上述分类可见,不同子领域的模型在变量选择、结局定义和临床用途上存在显著差异。在研究和临床实践中明确模型的具体预测目标,能有效提升概念严谨性,并引导选择或开发最适合当前场景的工具。未来的研究应在此基础上,进一步深化各子领域内模型的验证、优化与临床整合。

Table 1. Overview of key risk prediction models for osteoporotic fractures

1. 骨质疏松性骨折关键风险预测模型梳理

模型/研究代表

主要算法类型

目标人群

预测结局

性能指标 (AUC/C-index)

验证情况

关键特征/备注

Xia等人(2025)

Logistic回归

骨质疏松症患者

骨折风险

0.8165 (建模),0.8646 (验证)

内部验证

纳入ALP、血清钙等生化指标

马季等人

Logistic回归

绝经后女性

骨折风险

AUC = 0.867

未明确

纳入骨代谢标志物

章铁立等人

Logistic回归

绝经后女性

骨折风险

AUC = 0.8775

未明确

病证结合模型,纳入中医证候

Tebe等人

COX比例风险回归

一般人群(50~85岁)

1年及5年MOF

C-index:0.717 (1年),0.724 (5年)

有外部验证

基于初级保健数据库的大队列模型

IDFracture模型(2025)

COX比例风险回归

智力障碍人群

10年MOF/髋部骨折

C-index:0.775 (MOF)

有外部验证

针对高危特殊人群的专属模型

章轶立等人

C4.5决策树

绝经后女性

骨折分类

AUC = 0.871

未明确

结合中医症状信息

Deep Hit混合模型(2025)

Deep Hit + COX

一般人群(有BMD数据)

髋部骨折风险

Harrell’s C = 0.860

内部验证

深度学习生存分析,动态预测

XGBoost模型(2024)

梯度提升机

未明确

骨质疏松症风险

各项指标最佳

未明确

比较研究中性能最优

Wu与Jung

超级学习器(集成学习)

老年男性

MOF

AUC = 0.76

内部验证

整合基因组与临床数据

FREMML模型

DART boosting

一般人群(丹麦)

骨折风险

AUC = 0.77

未明确

基于超大规模EHR数据

CKD患者模型

随机森林

慢性肾病(CKD)患者

骨折风险

AUC = 0.859 (女性)

未明确

性别分层建模

HIV感染者模型

XGBoost

HIV感染者

骨折风险

AUC = 0.979

未明确

针对特定共病人群的高精度模型

5. 总结与展望

5.1. 现有研究特点

目前OPF风险预测模型的研究呈现多层次、多方法并进的格局。传统统计学模型(如Logistic回归、COX回归)因其良好的可解释性在特定临床场景中仍有应用,但其在高维、非线性及多模态数据处理方面存在局限。机器学习算法(如决策树、GBM、神经网络)则凭借其强大的特征学习能力,在处理复杂数据时展现出更优的判别性能[50]。在此基础上,集成学习(如AdaBoost、超级学习器)和混合模型通过融合多种基础算法,进一步提升了模型的性能与稳定性。当前研究趋势也日益精细化,表现为针对特定人群(如绝经后女性、智力障碍者)开发分层模型或个性化模型,以及致力于整合基因组风险评分等新型生物标志物作为预测因子。

5.2. 核心挑战:临床转化瓶颈与模型局限

尽管研究进展迅速,但OPF风险预测模型领域仍面临若干挑战,制约模型的临床转化与应用。

多数预测模型基于单中心、回顾性数据构建,存在选择偏倚,导致其外推性能有限。大量新模型缺乏在独立、多中心前瞻性队列中的严格外部验证,使得其临床效用、成本效益以及对患者结局的实际改善尚未得到充分证实,从而制约了临床转化率。

高性能的复杂机器学习OPF预测模型常难以解释[51],其不透明的决策逻辑不易被临床医生理解,这严重阻碍了其在关键医疗决策中的应用。尽管SHAP、LIME等可解释性工具有所帮助[52],但如何将模型预测转化为直观、可信的临床依据,以增强临床医生对模型的信任与采纳,仍是核心难题。

除FRAX等少数工具外,大量新开发模型数据收集标准、骨折定义、预测变量常不一致,且常缺失重要的生活方式、生物力学或新兴生物标志物信息,样本代表性和数据完整性有限,限制了模型性能的进一步提升与比较。

5.3. 未来展望:精准、动态与临床实用化路径

为克服上述挑战,未来研究应聚焦于推动预测模型向更精准、更动态、更临床实用的方向演进。

未来的模型应超越传统临床变量的局限,深度整合多源异构数据,例如从影像组学中提取骨微结构特征、结合基因组学和代谢组学信息[53],以及纳入动态监测的传感器数据等。通过利用深度学习框架等先进技术整合这些数据,有望揭示更深层的疾病风险机制,从而实现更早期的超个体化风险预警和精准预防。

静态的10年骨折风险预测已不足以满足临床动态管理需求。未来研究应致力于整合患者纵向随访数据(如重复骨密度检测、新发共病、用药变化),构建能够随时间推移而更新风险分层的模型。这类模型能够随时间更新风险评分,例如预测椎体强化术后再骨折风险或保守治疗预后[54] [55],可以及时反映患者因治疗、生活方式改变或新发共病带来的风险变化,从而实现更及时的干预调整,为临床提供贯穿疾病全程的动态决策支持。

研究的终极目标是实现临床实效。未来工作重点应将已验证的预测模型转化为用户友好、与临床工作流无缝集成的决策支持系统。同时,必须通过前瞻性随机对照试验评估这些系统能否真正改善临床决策、提高患者依从性、并最终降低骨折发生率。在此过程中,持续优化模型的可解释性输出,确保临床医生能够理解并信任模型的建议,是成功转化的关键。

综上所述,OPF风险预测模型的研究正从算法创新转向以临床实效为导向的整合与验证新阶段。未来的发展关键在于构建高质量、多中心、标准化的前瞻性队列数据库,并在此基础上推动动态预测模型的开发与可解释性AI技术的深度融合。只有通过严谨的外部验证和真实的临床效用研究,才能确保这些模型真正服务于骨质疏松性骨折的精准防治,实现从预测精度到临床转化的目标。

基金项目

诸暨市医药卫生科技计划项目(项目编号:2023YW100)。

NOTES

*通讯作者。

参考文献

[1] Jain, R.K., Polley, E., Weiner, M., Iwamaye, A., Huang, E. and Vokes, T. (2024) An Electronic Health Record (EHR)-Based Risk Calculator Can Predict Fractures Comparably to FRAX: A Proof-of-Concept Study. Osteoporosis International, 35, 2117-2126. [Google Scholar] [CrossRef] [PubMed]
[2] Hansen, B.B., Haddock, B., Jørgensen, N.R., Vestergaard, P., Wiil, U.K., Folkestad, L., et al. (2026) The Danish Nationwide Osteoporosis Cohort Trials Environment (NOCTE)—A DXA Dataset for the 1900-1960 Birth Cohort. Journal of Clinical Densitometry, 29, 101653. [Google Scholar] [CrossRef
[3] Bielecka, L. (2025) Sports and Bone Health: The Impact of Physical Activity on Bone Mineral Density. Quality in Sport, 37, Article No. 57211. [Google Scholar] [CrossRef
[4] Almog, Y.A., Rai, A., Zhang, P., Moulaison, A., Powell, R., Mishra, A., et al. (2020) Deep Learning with Electronic Health Records for Short-Term Fracture Risk Identification: Crystal Bone Algorithm Development and Validation. Journal of Medical Internet Research, 22, e22550. [Google Scholar] [CrossRef] [PubMed]
[5] Bennett, M.J., Center, J.R. and Perry, L. (2025) Primary Care Follow-Up of Patients after Attending a Fracture Liaison Service: An Integrative Review. Archives of Osteoporosis, 20, Article No. 65. [Google Scholar] [CrossRef] [PubMed]
[6] Lo, J.C., Grimsrud, C.D., Ott, S.M., Chandra, M., Hui, R.L. and Ettinger, B. (2019) Atypical Femur Fracture Incidence in Women Increases with Duration of Bisphosphonate Exposure. Osteoporosis International, 30, 2515-2520. [Google Scholar] [CrossRef] [PubMed]
[7] 谷鸿秋, 周支瑞, 章仲恒, 等. 临床预测模型: 基本概念、应用场景及研究思路[J]. 中国循证心血管医学杂志, 2018, 10(12): 1454-1456.
[8] Li, H., Ding, C., Zeng, H., Zheng, R., Cao, M., Ren, J., et al. (2021) Improved Esophageal Squamous Cell Carcinoma Screening Effectiveness by Risk‐Stratified Endoscopic Screening: Evidence from High‐Risk Areas in China. Cancer Communications, 41, 715-725. [Google Scholar] [CrossRef] [PubMed]
[9] Hu, X., Hu, X., Yu, Y. and Wang, J. (2023) Prediction Model for Gestational Diabetes Mellitus Using the XG Boost Machine Learning Algorithm. Frontiers in Endocrinology, 14, Article ID: 1105062. [Google Scholar] [CrossRef] [PubMed]
[10] 沈强, 邓书成, 赵涵. 个体化预测骨质疏松性骨折手术治疗后骨折不愈合风险的列线图模型构建[J]. 脊柱外科杂志, 2025, 23(3): 158-163.
[11] 姜英玉, 谷鸿秋. 临床预测模型开发与验证的样本量估算[J]. 中国卒中杂志, 2024, 19(5): 489-495.
[12] Longhurst, J.K., Hooyman, A., Landers, M.R., Mancini, M., Franzén, E., Leavy, B., et al. (2024) Discordance between Balance Ability and Perception Is Associated with Falls in Parkinson’s Disease: A Coordinated Analysis. Neurorehabilitation and Neural Repair, 39, 114-125. [Google Scholar] [CrossRef] [PubMed]
[13] 吴芷若, 黄水金, 霍亚南, 等. 骨质疏松症患者脆性骨折危险因素分析及骨折风险评估模型的建立[J]. 中华骨质疏松和骨矿盐疾病杂志, 2024, 17(4): 308-317.
[14] 云思敏, 王雄毅, 谢伊代∙如则, 等. 基于三种机器学习方法研究骨质疏松性骨折危险因素及构建列线图预测模型[J]. 中华骨质疏松和骨矿盐疾病杂志, 2025, 18(1): 36-48.
[15] Cowling, T.E., Cromwell, D.A., Bellot, A., Sharples, L.D. and van der Meulen, J. (2021) Logistic Regression and Machine Learning Predicted Patient Mortality from Large Sets of Diagnosis Codes Comparably. Journal of Clinical Epidemiology, 133, 43-52. [Google Scholar] [CrossRef] [PubMed]
[16] Ma, J., Dhiman, P., Qi, C., Bullock, G., van Smeden, M., Riley, R.D., et al. (2023) Poor Handling of Continuous Predictors in Clinical Prediction Models Using Logistic Regression: A Systematic Review. Journal of Clinical Epidemiology, 161, 140-151. [Google Scholar] [CrossRef] [PubMed]
[17] Luo, N., Yang, G., Li, B., Zhang, P., Ma, J., Chen, Y., et al. (2024) Clinical Characteristics and Prognostic Analysis of Pediatric Hemophagocytic Lymphohistiocytosis Using Lasso-Logistic Regression. Annals of Hematology, 103, 5191-5200. [Google Scholar] [CrossRef] [PubMed]
[18] Xia, P., Jiang, Y., Cai, F., Peng, S. and Xu, Z. (2024) Construction and Verification of Risk Prediction Model of Osteoporotic Fractures in Patients with Osteoporosis in China. Frontiers in Public Health, 12, Article ID: 1380218. [Google Scholar] [CrossRef] [PubMed]
[19] 马季, 智晓东, 王浩, 等. 绝经后骨质疏松性椎体压缩骨折的预测模型和Nomogram图的建立[J]. 检验医学与临床, 2023, 20(8): 1057-1062.
[20] 江爱娟, 申国明, 尤良震, 等. 病证结合慢性疾病嵌套风险预测模型的构建与应用[J]. 中华中医药杂志, 2022, 37(8): 4546-4549.
[21] 章轶立, 魏戌, 聂佩芸, 等. 基于Group Lasso的Logistic回归模型构建绝经后骨质疏松性骨折初发风险评估工具[J]. 中国骨质疏松杂志, 2018, 24(8): 994-999.
[22] 王龙, 代彦林, 韩姗姗, 等. 基于CiteSpace的中医“病证结合”文献知识图谱可视化分析[J]. 时珍国医国药, 2021, 32(1): 242-244.
[23] 魏戌, 金子开, 章轶立, 等. 骨质疏松症病证结合风险预测模型研究进展及优化思路[J]. 世界科学技术-中医药现代化, 2024, 32(8): 1371-1378.
[24] 严若华, 李卫. Cox回归模型比例风险假定的检验方法研究[J]. 中国卫生统计, 2016, 33(2): 345-349.
[25] Tebé, C., Pallarès, N., Reyes, C., Carbonell-Abella, C., Montero-Corominas, D., Martín-Merino, E., et al. (2022) Development and External Validation of a 1-and 5-Year Fracture Prediction Tool Based on Electronic Medical Records Data: The EPIC Risk Algorithm. Bone, 162, Article ID: 116469. [Google Scholar] [CrossRef] [PubMed]
[26] Leslie, W.D., Morin, S.N., Lix, L.M., McCloskey, E.V., Johansson, H., Harvey, N.C., et al. (2020) Fracture Prediction from FRAX for Canadian Ethnic Groups: A Registry-Based Cohort Study. Osteoporosis International, 32, 113-122. [Google Scholar] [CrossRef] [PubMed]
[27] Smith, M., Roast, J., Collins, G.S., et al. (2025) Development and External Validation of Prediction Models for Major Osteoporotic Fracture and Hip Fracture in People with Intellectual Disability.
[28] Ngiam, K.Y. and Khor, I.W. (2019) Big Data and Machine Learning Algorithms for Health-Care Delivery. The Lancet Oncology, 20, e262-e273. [Google Scholar] [CrossRef] [PubMed]
[29] Kang, S.J., Kim, M.J., Hur, Y., Haam, J. and Kim, Y. (2024) Application of Machine Learning Algorithms to Predict Osteoporotic Fractures in Women. Korean Journal of Family Medicine, 45, 144-148. [Google Scholar] [CrossRef] [PubMed]
[30] Khanna, V.V., Chadaga, K., Sampathila, N., Chadaga, R., Prabhu, S., K S, S., et al. (2023) A Decision Support System for Osteoporosis Risk Prediction Using Machine Learning and Explainable Artificial Intelligence. Heliyon, 9, e22456. [Google Scholar] [CrossRef] [PubMed]
[31] Liu, M., Wei, X., Xing, X., Cheng, Y., Ma, Z., Ren, J., et al. (2024) Predicting Fracture Risk for Elderly Osteoporosis Patients by Hybrid Machine Learning Model. Digital Health, 10. [Google Scholar] [CrossRef] [PubMed]
[32] 章轶立, 魏戌, 聂佩芸, 等. 基于SMOTE算法和决策树的绝经后骨质疏松性骨折分类模型建构[J]. 中国骨质疏松杂志, 2019, 25(1): 1-5.
[33] Lee, C., Zame, W., Yoon, J. and Van der Schaar, M. (2018) DeepHit: A Deep Learning Approach to Survival Analysis with Competing Risks. Proceedings of the AAAI Conference on Artificial Intelligence, 32, 2314-2321. [Google Scholar] [CrossRef
[34] Fan, S., Lu, M., Dong, J., Li, Y., Hao, L., Dong, R., et al. (2025) Application of Artificial Intelligence in Osteoporosis: A Review. Frontiers in Medicine, 12, Article ID: 1718554. [Google Scholar] [CrossRef
[35] Asghar, N., Khalil, U., Ahmad, B., Alshanbari, H.M., Hamraz, M., Ahmad, B., et al. (2024) Improved Nonparametric Survival Prediction Using CoxPH, Random Survival Forest & Deephit Neural Network. BMC Medical Informatics and Decision Making, 24, Article No. 120. [Google Scholar] [CrossRef] [PubMed]
[36] 廉洪宇, 沈翔, 陈广新, 等. 骨质疏松风险预测机器学习模型构建与研究[J]. 新一代信息技术, 2024, 7(4): 1-5.
[37] Liu, M., Wei, X., Xing, X., et al. (2023) Predicting Fracture Risk for Elderly Osteoporosis Patients by Hybrid Machine Learning Model. Digital Health, 9, 1-12.
[38] Goller, S.S., Foreman, S.C., Rischewski, J.F., Weißinger, J., Dietrich, A., Schinz, D., et al. (2023) Differentiation of Benign and Malignant Vertebral Fractures Using a Convolutional Neural Network to Extract CT-Based Texture Features. European Spine Journal, 32, 4314-4320. [Google Scholar] [CrossRef] [PubMed]
[39] 朱心雨, 郭立, 黄鹏, 等. CT纹理特征联合机器学习对发生骨质疏松性压缩骨折的预测价值[J]. 中国临床医学影像杂志, 2023, 34(6): 428-432.
[40] 李浩月. 基于BP神经网络的骨质疏松预测模型构建及效果评价[D]: [硕士学位论文]. 武汉: 武汉科技大学, 2019.
[41] 侯亚. 基于深度学习的腰椎CT图像骨质疏松风险预测方法研究[D]: [硕士学位论文]. 保定: 河北大学, 2023.
[42] Jiang, Y., Cai, J., Zeng, Y., Ye, H., Yang, T., Liu, Z., et al. (2023) Development and Validation of a Machine Learning Model to Predict Imminent New Vertebral Fractures after Vertebral Augmentation. BMC Musculoskeletal Disorders, 24, Article No. 472. [Google Scholar] [CrossRef] [PubMed]
[43] Zhang, Y., Ma, M., Huang, X., Liu, J., Tian, C., Duan, Z., et al. (2025) Machine Learning Is Changing Osteoporosis Detection: An Integrative Review. Osteoporosis International, 36, 1313-1326. [Google Scholar] [CrossRef] [PubMed]
[44] Whittier, D.E., Samelson, E.J., Hannan, M.T., Burt, L.A., Hanley, D.A., Biver, E., et al. (2023) A Fracture Risk Assessment Tool for High Resolution Peripheral Quantitative Computed Tomography. Journal of Bone and Mineral Research, 38, 1234-1244. [Google Scholar] [CrossRef] [PubMed]
[45] Zhang, X., Xu, H., Li, G.H., Long, M.T., Cheung, C., Vasan, R.S., et al. (2020) Metabolomics Insights into Osteoporosis through Association with Bone Mineral Density. Journal of Bone and Mineral Research, 36, 729-738. [Google Scholar] [CrossRef] [PubMed]
[46] Wu, Q. and Jung, J. (2025) Ensemble-Learning Approach Improves Fracture Prediction Using Genomic and Phenotypic Data. Osteoporosis International, 36, 811-821. [Google Scholar] [CrossRef] [PubMed]
[47] Rietz, M., Brønd, J.C., Möller, S., Søndergaard, J., Abrahamsen, B. and Rubin, K.H. (2025) Introducing FREMML: A Decision-Support Approach for Automated Identification of Individuals at High Imminent Fracture Risk. Archives of Osteoporosis, 20, Article No. 140. [Google Scholar] [CrossRef
[48] Li, H., Zhang, Y. and Zhang, C. (2025) Development and Validation of Machine Learning Models for Osteoporosis Prediction in Chronic Kidney Disease Patients: Data from National Health and Nutrition Examination Survey. Digital Health, 11, 1-10. [Google Scholar] [CrossRef] [PubMed]
[49] Liu, B., Zhang, Q. and Li, X. (2025) An Explainable Web Application Based on Machine Learning for Predicting Fragility Fracture in People Living with HIV: Data from Beijing Ditan Hospital, China. Frontiers in Cellular and Infection Microbiology, 15, Article ID: 1461740. [Google Scholar] [CrossRef] [PubMed]
[50] Takahashi, S., Terai, H., Hoshino, M., Tsujio, T., Kato, M., Toyoda, H., et al. (2022) Machine-Learning-Based Approach for Nonunion Prediction Following Osteoporotic Vertebral Fractures. European Spine Journal, 32, 3788-3796. [Google Scholar] [CrossRef] [PubMed]
[51] 王远智, 王礼宁, 郭杨, 胡玥, 张亚峰, 尹恒, 张春雷, 马勇. 骨质疏松性骨折风险预测模型研究进展[J]. 中国骨质疏松杂志, 2024, 30(10): 1518-1523.
[52] Lundberg, S.M., Erion, G., Chen, H., DeGrave, A., Prutkin, J.M., Nair, B., et al. (2020) From Local Explanations to Global Understanding with Explainable AI for Trees. Nature Machine Intelligence, 2, 56-67. [Google Scholar] [CrossRef] [PubMed]
[53] 赖晓雯, 褚美玲, 赵滨, 等. 骨质疏松症多模态预测模型的循证重构: 影像组学与生物标志物的整合路径[J]. 实用临床医药杂志, 2025, 29(22): 129-135+140.
[54] 沈世彬, 崔莹, 江雪, 等. 骨质疏松性椎体压缩性骨折椎体强化术后非手术椎体新发骨折的危险因素分析及预测模型构建[J]. 脊柱外科杂志, 2025, 23(6): 397-403.
[55] Ao, J., Xu, Z., Gao, Z., Ge, T., Wu, J., Li, J., et al. (2025) What Factors Contribute to the Poor Prognosis of Conservative Treatment for Osteoporotic Vertebral Compression Fracture (OVCF): A Systematic Review. Clinical Interventions in Aging, 20, 2717-2736. [Google Scholar] [CrossRef