1. 引言
自2000年我国进入老龄化社会以来,老龄化进程不断加深。据统计2019年中国有2.54亿人年龄在60岁或以上,预计到2040年,这一数字将增至4.02亿,约占总人口的28% [1]。随着老龄化人口的增长,对医疗资源的需求也不断增加,促进健康老龄化已成为亟需解决的关键社会问题。慢性病的发生率亦随年龄增加而显著上升,中老年人因健康状况的恶化而出现功能性障碍,从而影响其无残疾健康寿命(disability-free life expectancy, DFLE) [2]。DFLE定义为个体在没有残疾或不受功能性限制的状态下所能期望度过的剩余寿命年数[3]。
Sullivan方法是目前估算DFLE最常用的方法,因其计算简单、相对准确且易于解释而广泛应用[4]。但该方法的计算依赖于患病率、残疾率以及生命表,并且仅能展示某一群体的DFLE变化趋势,无法反映个体之间的差异并且难以捕捉个体健康状态的长期变化趋势[5]。而长短期记忆网络(Long Short-Term Memory, LSTM)作为一种专门处理时间序列数据的神经网络模型,能够捕捉非线性和复杂的动态变化,并广泛用于轨迹预测模型[6]。因此,本研究将基于用中国健康与养老追踪调查(China health and retirement longitudinal survey, CHARLS)数据库中2011~2020年的数据,通过LSTM模型构建中老年人无残疾预期寿命轨迹预测模型。旨在通过预测中老年人残疾状态的变化轨迹,识别残疾的高风险人群,以便进行早期干预,减少残疾发生,延长中老年人的无残疾健康年限。
2. 资料与方法
2.1. 一般资料
本研究的数据来自具有全国代表性的纵向调查——CHARLS数据库。此调查代表性地收集了我国45岁或以上的个人及其配偶,包括对社区居民的社会、经济和健康状况的评估,其中全国基线调查于2011年开展,据每2~3年追踪1次[7] [8]。本研究以2011年的数据作为基线数据,与2013、2015、2018、2020年的随访数据共同建立观察队列。本研究选择2011年CHARLS数据库中≥45岁的具有完整随访资料的中老年人作为研究对象:① 纳入标准:在5个时间点上都参与调查;② 排除标准:在某个时间点失访,以及因严重疾病或死亡导致缺乏后续数据的个体。
2.2. 方法
2.2.1. 结局变量
研究中的主要结局变量为时间序列中的残疾状态变化,基于CHARLS数据库“健康状况和功能”中的六个条目来定义残疾状态,包括洗澡、穿衣、进食、起立、步行和如厕[3]。① 如果所有条目均选择“没有困难”则定义为无残疾状态;② 如果任意一个条目选择“有困难但仍能完成”或“有困难,需要帮助”或“无法完成”则定义为残疾状态。
2.2.2. 预测变量
本研究根据检索相关文献以及考虑到CHARLS数据库的数据连续性[9]-[11],最终将年龄、性别、户口类型、学历、婚姻状况、慢性病类型、慢性病数量、吸烟、饮酒、医疗支出、睡眠时间等作为预测变量。
2.2.3. LSTM模型
LSTM是一种特殊的循环神经网络(Recurrent Neural Network, RNN),它结合了适当的基于梯度的学习算法,改进了RNN的隐层,并扩展了网络的存储功能,从而使模型能获取更多持久信息并控制数据的传输量[12]。LSTM通过引入遗忘门、输入门和输出门的机制,能够有效地捕捉长期依赖关系,从而适应时间序列数据中的复杂动态变化。LSTM模型中用于捕捉长期和短期依赖关系的核心公式包括遗忘门、输入门和输出门,如公式1。
(1)
其中:
是当前时间步的单元状态;
是遗忘门,控制上一个状态的遗忘程度;
是输入门,控制当前信息的写入程度;
是候选单元状态,表示新的信息;
表示逐元素相乘。
2.2.4. 统计学方法
本研究使用Python3.12及其深度学习框架PyTorch2.50来实现数据分析和模型构建。利用Python对原始数据进行数据清洗和特征处理;对于缺失数据,采用多重插补法进行处理,以最大化样本的完整性。由于所有数据都为偏态分布,所以本研究的计量资料采用中位数及四分位数描述,计数资料采用频率和百分率描述。对于分类变量,进行独热编码处理,以便适应深度学习模型的输入要求;连续型变量,采用标准化处理,以保证模型收敛的效率和准确性。模型训练时,使用交叉熵损失函数衡量模型预测残疾状态的误差。优化器选择Adam优化器,学习率设为0.001。为防止过拟合,模型训练过程中引入Dropout正则化,比例为0.2。将数据按照7:3的比例分为构建集和验证集。其中构建集用于模型的构建和参数调整,验证集用于评估模型的泛化性能。在模型训练过程中,使用批量梯度下降法,批大小设置为64。为了防止训练过程中的过拟合采用早停法,当验证集损失在连续10次迭代中未显著降低时,提前终止训练。沙普利可加性特征解释方法(SHapley Additive exPlanations, SHAP)值用来解释每个变量对模型预测结果的贡献程度[13]。使用受试者工作特征(Receiver Operating Characteristic, ROC)曲线和曲线下面积(Area Under Curve, AUC)来评估模型的区分度。灵敏度和特异性用于进一步评估模型在某个时间点对无残疾状态和残疾状态的预测效果。
3. 结果
3.1. 患者一般资料
本研究共纳入了11180名患者,对其在2011年、2013年、2015年、2018年和2020年五个时间节点的人口学特征进行统计,结果可见患者的男女比例较为均衡,约54.3%的患者为女性,45.7%为男性;患者的中位年龄从2011年的57岁逐年增加至2020年的66岁,详见表1。按照7:3比例随机分为构建集(n = 7826)和验证集(n = 3354)。
Table 1. General information about patients (n = 11,180)
表1. 患者的一般资料(n = 11,180)
项目 |
类别 |
2011年 |
2013年 |
2015年 |
2018年 |
2020年 |
性别 [例(百分率,%)] |
女 |
6073 (54.32) |
6073 (54.32) |
6073 (54.32) |
6073 (54.32) |
6073 (54.32) |
男 |
5107 (45.68) |
5107 (45.68) |
5107 (45.68) |
5107 (45.68) |
5107 (45.68) |
年龄[岁,M(P25, P75)] |
|
57 (50, 63) |
59 (52, 65) |
61 (54, 67) |
64 (57, 70) |
66 (59, 72) |
户口 |
农村 |
1918 (17.16) |
2028 (18.19) |
1934 (18.28) |
2114 (18.94) |
2238 (20.70) |
城市 |
9256 (82.84) |
9122 (81.81) |
8645 (81.72) |
9048 (81.06) |
8574 (79.30) |
文化水平[例(百分率,%)] |
小学以下 |
5126 (45.89) |
5126 (45.89) |
5126 (45.89) |
5126 (45.89) |
5126 (45.89) |
小学 |
2440 (21.85) |
2440 (21.85) |
2440 (21.85) |
2440 (21.85) |
2440 (21.85) |
中学 |
2370 (21.22) |
2370 (21.22) |
2370 (21.22) |
2370 (21.22) |
2370 (21.22) |
高中及以上 |
1233 (11.04) |
1233 (11.04) |
1233 (11.04) |
1233 (11.04) |
1233 (11.04) |
婚姻状况[例(百分率,%)] |
其他 |
1091 (9.76) |
1238 (11.07) |
1427 (12.76) |
1820 (16.28) |
1998 (18.48) |
已婚 |
10089 (90.24) |
9942 (88.93) |
9753 (87.24) |
9360 (83.72) |
8816 (81.52) |
续表
慢性病数量[例(百分率,%)] |
0个 |
3704 (33.16) |
3183 (28.48) |
2088 (18.69) |
1708 (15.29) |
1641 (14.69) |
1个 |
3391 (30.33) |
3311 (29.65) |
2907 (26.02) |
2548 (22.83) |
2381 (21.31) |
2个 |
2174 (19.45) |
2327 (20.81) |
2522 (22.62) |
2368 (21.19) |
2268 (20.31) |
3个 |
1093 (9.78) |
1279 (11.45) |
1697 (15.18) |
1808 (16.19) |
1809 (16.21) |
4个 |
499 (4.46) |
626 (5.61) |
1012 (9.05) |
1139 (10.19) |
1289 (11.54) |
≥5个 |
202 (1.81) |
274 (2.45) |
515 (4.61) |
761 (6.82) |
774 (6.94) |
慢性病[例(百分率,%)] |
高血压 |
2672 (24.30) |
3023 (27.29) |
3691 (33.64) |
4745 (42.45) |
4878 (45.12) |
糖尿病 |
606 (5.46) |
762 (6.92) |
1048 (9.57) |
1547 (13.84) |
1731 (16.10) |
癌症 |
89 (0.80) |
103 (0.93) |
161 (1.45) |
249 (2.23) |
278 (2.57) |
肺病 |
940 (8.44) |
1067 (9.62) |
1524 (13.76) |
1959 (17.53) |
1764 (16.32) |
心脏病 |
1235 (11.11) |
1430 (12.9) |
1962 (17.82) |
2466 (227) |
2580 (23.87) |
中风 |
226 (2.30) |
278 (2.50) |
393 (3.54) |
915 (8.18) |
951 (8.80) |
精神疾病 |
147 (1.32) |
165 (1.49) |
255 (2.30) |
379 (3.39) |
357 (3.30) |
关节炎 |
3750 (33.61) |
3989 (35.82) |
5091 (467) |
5020 (44.92) |
4767 (44.10) |
血脂异常 |
1049 (9.56) |
1396 (12.95) |
2019 (18.77) |
2597 (23.24) |
3040 (28.12) |
肝脏疾病 |
373 (3.36) |
463 (4.19) |
717 (6.50) |
824 (7.37) |
824 (7.62) |
肾脏疾病 |
587 (5.28) |
714 (6.46) |
1088 (9.86) |
1196 (10.70) |
1230 (11.38) |
胃病 |
2512 (22.53) |
2780 (25.10) |
3673 (33.23) |
3683 (32.95) |
3651 (33.77) |
哮喘病 |
427 (3.84) |
456 (4.11) |
627 (5.65) |
758 (6.78) |
807 (7.47) |
记忆疾病 |
132 (1.18) |
174 (1.57) |
279 (2.52) |
454 (4.60) |
586 (5.42) |
吸烟[例(百分率,%)] |
否 |
4196 (37.54) |
4579 (41.01) |
4785 (42.81) |
4659 (41.71) |
4521 (41.82) |
是 |
6981 (62.46) |
6587 (58.99) |
6393 (57.19) |
6512 (58.29) |
6289 (58.18) |
饮酒[例(百分率,%)] |
否 |
7510 (67.22) |
7339 (65.81) |
7403 (66.28) |
7631 (68.32) |
7238 (66.97) |
是 |
3663 (32.78) |
3813 (34.19) |
3767 (33.72) |
3539 (31.68) |
3570 (33.03) |
医疗支出费用[元,M(P25, P75)] |
|
1000 (300, 3000) |
1000 (300, 4000) |
1000 (200, 3500) |
2000 (500, 5000) |
2000 (120, 5000) |
睡眠时间[h, M(P25, P75)] |
|
6.50 (5, 8) |
6 (5, 7) |
6 (5, 8) |
6 (5, 8) |
6 (5, 7) |
3.2. 残疾状态的变化趋势
整合了11,180名患者在5个时期的残疾状态分布情况可以看出,致残率总体呈逐渐上升的趋势。从2011年致残率约为16%,到2020年上升至约24%,显示出一个平稳的增长趋势,详见图1。
3.3. 轨迹预测模型的构建
以构建集的患者不同时间点上的残疾状态(2011年、2013年、2015年、2018年、2020年,每个时间节点是否处于残疾状态)作为结局变量,通过LSTM模型构建无残疾预期寿命轨迹预测模型。将24个变量作为特征纳入特征集中,结果显示年龄、慢性病数量、关节炎、睡眠时间等特征对模型预测的贡献程度最多,详见图2。
Figure 1. Trends in disability rates
图1. 致残率变化趋势
Figure 2. Characterization map based on SHAP values
图2. 基于SHAP值的特征图
3.4. 轨迹预测模型的内部验证
绘制构建集的ROC曲线,计算得出构建集模型的AUC = 0.788 (95% CI: 0.603~0.798),敏感度为81.3%,特异度为86.2%,表明该模型具有较好的区分能力和校准性,详见图3。校准曲线与理想曲线相近,Brier = 0.115,说明该模型的预测能力较好,详见图4。
Figure 3. Construction of ROC curves for centralized prediction of disability status
图3. 构建集中预测残疾状态的ROC曲线
Figure 4. Calibration curves for disability state trajectory prediction models
图4. 残疾状态轨迹预测模型的校准曲线
3.5. 轨迹预测模型的外部验证
根据构建的轨迹预测模型,使用验证集数据(n = 3354)进行外部验证并绘制ROC曲线,计算得出验证集的AUC = 0.745 (95% CI: 0.668~0.865),敏感度83.9%,特异度为85.5%,提示该模型可以识别残疾与非残疾状态,详见图5。在验证集中随机抽取100名患者,将前四次数据(2011年、2013年、2015年、2018年)输入轨迹预测模型中,得到2020年的预测残疾状态与2020年真实残疾状态进行对比,结果显示98%个体的预测的残疾状态与真实的残疾状态保持一致,详见图6。
Figure 5. Validation of ROC curves for centralized prediction of disability status
图5. 验证集中预测残疾状态的ROC曲线
Figure 6. Plot of predicted vs. true disability status
图6. 预测残疾状态与真实残疾状态的对比图
4. 讨论
4.1. 中老年人残疾趋势变化
本研究利用CHARLS数据库中的2011年至2020年的5波数据调查中国中老年人残疾状态的变化趋势,结果显示:与2011年的残疾率16%相比,2020年的残疾率显著提高至24%。说明随着年龄的增长以及身体功能的下降,会增加残疾发生的可能性,最终降低无残疾预期寿命。早期评估预测残疾的发生率有助于为医护人员为中老年人提供适当的护理以及健康教育,从而减少残疾的发生。
4.2. 中老年人无残疾预期寿命轨迹预测模型
本研究基于全国性面板数据构建了无残疾预期寿命轨迹预测模型以预测中老年人在未来是否会进入残疾状态。结果显示:模型在构建集上的AUC值为0.82,验证集的AUC为0.745,表明模型在新数据上的预测性能良好。同时,模型在灵敏度和特异度上的表现分别为83.9%和85.5%,显示了对残疾状态的有效预测能力。NeumannJT等收集了19,114名患者的横断面数据,通过机器学习的方法分别构建了男性与女性的无残疾寿命预测模型,其结果为:女性预测模型的AUC为0.76、男性预测模型的AUC为0.73,结果与本研究相似[14]。在未来,医护人员可通过该模型计算中老年人在未来某个时间节点的残疾状态,识别残疾高风险人群并对其开展预防措施,以延长中老年人无残疾预期寿命。
4.3. 中老年人残疾状态的主要影响因素
本研究的结果显示,年龄、慢性病数量、关节炎、睡眠时间以及性别是影响中老年人残疾状态排名前五的因素,在LSTM模型中对预测结果的贡献程度较高。其中年龄是对残疾状态的影响最大因素,这与Masahiro N等结果一致[11]。受生理因素影响,年龄越大,生理机能随之退化,老年人逐渐面临肌肉力量、骨骼密度和神经系统功能的下降,这些变化使他们更易出现日常功能受限的情况,这符合人类自然生理规律[15]。
此外,慢性病数量的叠加对残疾状态的预测能力较强,可能的原因中老年慢性病共病患者身体功能产生叠加或协同作用,使得疾病治疗周期延长、疾病预后不佳、并发症增多,甚至重要组织、器官损伤,造成自理能力下降[16]。而所有慢性病类型中,关节炎是一个重要的预测因素。关节炎引起的长期疼痛限制了老年人的活动能力,并导致肌肉的进一步萎缩和关节功能的恶化[17]。特别是下肢关节炎,严重影响日常活动如行走和上下楼梯,从而增加残疾的可能性。
Luo MJ等[18]研究结果显示至少7小时睡眠的时间与降低功能障碍的可能性有关,与本研究的结果一致。因为睡眠持续时间在影响健康的生理功能发育中起着至关重要的作用,与认知能力下降、抑郁、心血管疾病、骨质疏松症和中风的风险增加相关,从而增加残疾的发生率。因此应对健康的睡眠习惯进行科普,针对睡眠有问题的中老年人,提供专业的睡眠咨询和行为疗法。
“性别与健康悖论”是指女性死亡率较低而患病率较高,在生命历程中会有更长的时间处于患病/残疾的现象[5],这与本研究的结果保持一致。这可能的原因是女性受到绝经前后期间激素水平变化对功能减弱的影响,在老年阶段更容易出现骨折和关节问题[19]。因此针对女性的健康干预应包括骨密度监测、钙和维生素D的补充,以及关节健康的预防措施。
5. 总结
本研究基于LSTM模型构建了无残疾预期寿命轨迹预测模型,结果显示构建集模型ROC曲线下面积为0.788 (95% CI: 0.603~0.798),敏感度为81.3%,特异度为86.2%,校准曲线与理想曲线相近,Brier得分为0.115;验证集模型ROC曲线下面积为0.745 (95% CI: 0.668~0.865),敏感度83.9%,特异度为85.5%。这提示无残疾预期寿命轨迹预测模型具有良好的预测能力,能够稳健地预测患者在未来某个时间节点的残疾状态,可以为医护人员在未来识别残疾的高风险人群提供可靠的指导。此外SHAP值显示影响中老年人残疾状态的主要因素包括年龄、慢性病数量、关节炎、睡眠时间和性别等,这提示应加强识别残疾的高危因素人群并积极治疗和控制慢性病的发展,从而延长中老年人无残疾预期寿命。
但本研究仍存在一些局限性:(1) 研究的数据来源于CHARLS数据库,变量结果主要来源于患者主观感受进行填写,可能与真实情况存在偏倚。(2) 本研究仅对短时期的残疾状态进行验证,对于时间跨度过长的预测可能使得模型捕捉不到某些长期变化特征,预测结果可能存在精确度的降低。在未来需要将模型以接口的形式导入在小程序或系统中,以便在临床上进行多中心大样本的实验,以进一步完善模型的适用性和准确性。
致 谢
感谢宋明阳对本研究的研究目的、统计分析提出建议;感谢周璇对本研究的研究设计、模型构建、变量选择提出指导;感谢基金项目主持人周兰姝教授对本研究的监督和指导。
基金项目
国家社会科学基金重大项目:人口老龄化背景下的残疾预防策略与应用研究(21&ZD188);老年长期照护教育部重点实验室(海军军医大学)支持项目。
NOTES
*通讯作者。