摘要: 目的:对比分析六种常用的年龄预测最大心率公式(Fox, Tanaka, Gellish, Fairbarn, Arena, Nes)在运动员群体中的有效性和预测精度。方法:以Physionet上马拉加大学2008~2018年间992次跑步机最大分级运动测试数据为基础,对实测最大心率和基于Fox、Tanaka、Arena、Gellish、Nes、Fairbarn六个常用年龄预测公式的预测最大心率采用配对Wilcoxon秩和检验、Bland-Altman一致性分析、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)和均方根误差(Root Mean Square Error, RMSE)进行评估。结果:配对Wilcoxon秩和检验显示,Fox、Tanaka、Arena、Nes、Fairbarn公式预测的最大心率与实测值均存在显著差异,而Gellish公式则无。Gellish公式偏差最小(0.26 bpm),MAPE (3.49)和RMSE (8.22 bpm)最低,整体预测误差最小;Nes公式预测值正向偏差最大(6.01 bpm),Fox公式和Nes公式预测精度较差;所有公式预测值95%一致性界限宽泛(平均范围 ± 10~15 bpm)。结论:六个公式在运动员群体中预测准确性存在差异且均有局限性。Gellish公式整体表现最优,但个体误差仍显著;Fox、Nes因系统性偏差大,不推荐用于运动员。
Abstract: Objective: To comparatively analyze the validity and prediction accuracy of six commonly used age-predicted maximum heart rate equations (Fox, Tanaka, Gellish, Fairbarn, Arena, Nes) in the athlete population. Methods: Based on 992 treadmill maximal graded exercise test data from the University of Malaga on Physionet during 2008~2018, the measured maximum heart rate and the predicted maximum heart rate based on six commonly used age-predicted equations of Fox, Tanaka, Arena, Gellish, Nes, and Fairbarn were evaluated using paired Wilcoxon rank sum test, Bland-Altman consistency analysis, mean absolute percentage error, and root mean square error. Results: Paired Wilcoxon rank sum test showed that there were significant differences between the HRmax predicted by Fox, Tanaka, Arena, Nes, and Fairbarn equations and the measured values, while there was no such difference for the Gellish equation. The Gellish equation had the smallest deviation (0.26 bpm), the lowest MAPE (3.49) and RMSE (8.22 bpm), and the smallest overall prediction error; the Nes equation had the largest positive deviation in the predicted value (6.01 bpm), and the prediction accuracy of the Fox equation and the Nes equation was poor; the 95% consistency limits of the predicted values of all equations were wide (average range ± 10~15 bpm). Conclusion: The prediction accuracy of the six equations varies and all have limitations in the athlete population. The Gellish equation has the best overall performance, but the individual error is still significant; Fox and Nes are not recommended for athletes due to large systematic deviations.
1. 引言
最大心率(maximal heart rate, HRmax)是评估心肺功能、制定运动强度及优化训练计划的核心生理指标之一。在临床医学与运动科学领域,HRmax的准确测定对心血管疾病患者的康复指导、运动员训练负荷的个性化调控以及健康人群的运动处方设计均具有重要意义[1] [2]。目前,通过运动测试直接测量HRmax被视为金标准,但其对设备、环境及受试者耐受力的高要求限制了其广泛应用[3]。因此,基于年龄的最大心率预测公式(如经典的Fox公式:HRmax = 220 − 年龄)因其简便性,成为运动医学与康复实践中估算HRmax的主要工具[3] [4]。
然而,现有研究表明,年龄预测公式在特定人群中的准确性存在显著差异[5] [6]。例如,Tanaka公式(HRmax = 208 − 0.7 × 年龄)和Arena公式(HRmax = 209.3 − 0.72 × 年龄)在普通健康人群中表现较优[7] [8],而Gulati公式(HRmax = 206 − 0.88 × 年龄)则因在女性群体中系统性低估HRmax而受到争议[9]。值得注意的是,运动员群体因其独特的生理特征(如更高的心肺耐力、心肌适应性重塑及运动类型特异性)可能进一步影响预测模型的适用性[5] [10]。近期研究指出,耐力运动员的HRmax随年龄下降的速率较普通人群更缓慢,且不同运动模式(如跑步与骑行)的运动测试结果存在显著差异[5],这提示传统公式在运动员群体中的外推需谨慎验证。
尽管已有研究对各类人群的年龄预测公式进行了广泛评估[5] [6] [9] [11],但针对运动员(尤其是涵盖业余与专业群体的多样性样本)的系统性验证仍显不足。为此,本研究旨在通过运动员群体运动测试数据集,评估六个常用年龄预测公式(Fox, Tanaka, Arena, Gellish, Nes, Fairbarn)的有效性,结合Bland-Altman一致性分析、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)和均方根误差(Root Mean Square Error, RMSE),系统量化其预测偏差。研究结果将为运动员训练强度的科学调控、运动风险评估及个性化康复方案的制定提供实证依据。
2. 数据与方法
2.1. 数据来源
所使用数据集来自于Physionet上马拉加大学(University of Malaga)运动生理学和人类表现实验室在2008~2018年间进行的992次跑步机最大分级运动测试(Graded Exercise Tests, GET)期间采集的心肺测量数据[12]-[14]。该数据集包括测试期间逐次呼吸测量心率、耗氧量VO2、二氧化碳产生量VCO2、肺通气量VE及跑步机速度。参与者为10岁至63岁的业余和专业运动员,提供了年龄、身高、体重及测试时的温度和湿度,测试者在PowerJog J系列跑步机上以5 Km/h的速度步行热身,之后以0.5~1 Km/h的速度递增运动直至力竭,VO2趋于饱和,然后以5 Km/h的速度步行进行冷却活动。呼吸参数由CPX MedGraphics气体分析仪系统(美国明尼苏达州Medical Graphics公司)测量,同时Mortara 12导联心电图设备采集心率。运动测试均为自愿的,且在运动科学医生监督下进行。所有程序均遵循赫尔辛基宣言。研究方案获马拉加大学研究伦理委员会批准。
2.2. 数据处理和最大心率确定
首先,检查数据集中subject-info.csv和test_measure.csv的缺失值,按列进行线性插补后以ID_test为基准合并。然后,保留合并后文件中年龄18~60岁的行数据,采用四分位距(Interquartile Range, IQR)对计量资料进行异常值处理。最后,排除在同一ID_test下前后临近time时的心率(heart rate, HR)差值 ≥ 30者。
对于最大心率的确定,首先计算呼吸交换率(respiratory exchange ratio, RER),如果同一ID_test下,运动测试最大速度之前无RER > 1.10,则认为受试者未尽最大努力[15],去除该ID_test下所有行数据。然后,取同一ID_test下,速度高于起始速度时的最高HR为实测最大心率。
为缓解数据集中存在的性别类别不平衡问题(女性占比13.03%),研究采用合成少数类过采样技术(Synthetic Minority Oversampling Technique, SMOTE)对少数类样本进行数据增强[16]。具体而言,针对当前N:1的性别比例失衡现象,SMOTE算法通过在特征空间中对少数类样本的k近邻(本研究设置k = 5)进行线性插值,生成具有多样性的合成样本。该方法克服了传统随机过采样易导致的模型过拟合问题。
2.3. 统计分析
研究采用了Python 3.12.4作为主要编程工具,并利用了pandas 2.2.2,numpy 1.26.4,scipy 1.13.0,statsmodels 0.14.2,sklearn 1.5.1,matplotlib 3.8.4,seaborn 0.13.2,imbalanced-learn0.10.1等多个开源库来进行数据分析和作图。所有脚本均在Pycharm环境下编写执行。计量资料以M[P25, P75]表示,采用配对Wilcoxon秩和检验判断GET实测最大心率与各公式预测的最大心率之间是否存在显著差异;计数资料以率表示。为评估一致性,构建了Bland-Altman图,以此检测系统偏差[17] [18]。同时,计算偏差的置信区间和一致性界限,进而确定估计的一致性界限的精确度。此外,通过MAPE和RMSE对各公式的预测结果进行比较。MAPE用于衡量预测值与实际观测值之间相对差异的平均水平,反映了模型预测精度的损失程度[19]。RMSE则提供了预测误差的标准偏差量度,有效揭示了预测值偏离真实值的程度,其作为评估指标具有较高的稳定性和一致性[20]。两者结合使用,可以全面、直观地反映模型预测结果相对于实际观测值的不准确程度。本研究将统计显著性水平设定为0.05。
3. 研究结果
受试者的人口统计特征及GET结果和基于Fox、Tanaka等公式预测的HRmax在表1中呈现。
配对样本Wilcoxon秩和检验发现Fox (Z = −16.253, P < 0.000)、Tanaka (Z = −5.501, P < 0.000)、Arena (Z = −7.977, P < 0.000)、Nes (Z = −20.129, P < 0.000)、Fairbarn (Z = 10.489, P < 0.000)公式预测的HRmax与实际测量值之间存在显著差异。而基于Gellish (Z = −1.661, P = 0.097)公式预测的最大心率与实测值无显著差异。在男性运动员中,Fox (Z = −5.912, P < 0.000)、Gellish (Z = 4.526, P < 0.000)、Nes (Z = −10.672, P < 0.000)、Fairbarn (Z = 9.631, P < 0.000)公式预测的HRmax与实测值之间同样存在显著差异;而基于Tanaka (Z = 1.809, P = 0.070)和Arena (Z = −0.043, P = 0.966)公式预测的最大心率与实测值无显著差异。在女性运动员中,基于以上六中公式预测的HRmax与实测值之间均存在统计学差异。
Table 1. General information of the subjects
表1. 受试者一般信息
变量 |
全部(n = 1068) |
男性(n = 534) |
女性(n = 534) |
年龄(岁) |
28 [23, 35] |
31 [24, 38] |
26 [22, 31] |
身高(cm) |
170.88 [165.74, 177] |
176 [172, 181] |
166.13 [163.08, 169.29] |
体重(Kg) |
69 [61.70, 76.22] |
75 [70, 81.95] |
62.91 [58.11, 67.57] |
实测最大心率HR (bpm) |
186 [179, 192] |
187 [179, 192] |
186 [179.25, 191] |
VO2 (mL/min) |
2702.96 [2294.50, 3453.75] |
3426 [2948, 3813.75] |
2321.21 [2059.95, 2492.84] |
VCO2 (mL/min) |
3298.92 [2749.25, 4178.25] |
4167 [3592.25, 4647.75] |
2769.06 [2405.16, 2995.00] |
RER |
1.18 [1.13, 1.25] |
1.19 [1.14, 1.25] |
1.17 [1.13, 1.23] |
VE (L/min) |
101.68 [84.85, 123.90] |
122.8 [108.9, 138.08] |
85.55 [77.67, 95.10] |
Fox (bpm) |
192 [185, 197]*** |
189 [182, 196]*** |
194 [189, 198]*** |
Tanaka (bpm) |
188 [183, 191]*** |
186 [181, 191] |
189 [186, 192]*** |
Arena (bpm) |
189 [184, 192]*** |
186 [181, 192] |
190 [186, 193]*** |
Gellish (bpm) |
187 [182, 190] |
185 [180, 190]*** |
188 [185, 191]*** |
Nes (bpm) |
193 [188, 196]*** |
191 [186, 195]*** |
194 [191, 196]*** |
Fairbarn (bpm) |
184 [179, 187]*** |
183 [177, 188]*** |
184 [181, 187]*** |
注:VO2:摄氧量,VCO2:二氧化碳排出量,RER:呼吸交换率,VE:通气量;Fox = 220 − 年龄;Tanaka = 208 − 0.7 × 年龄;Arena = 209.3 − 0.72 × 年龄;Gellish = 207 − 0.7 × 年龄;Nes = 211 − 0.64 × 年龄;Fairbarn = 208 − 0.8 × 年龄(男性)或201 − 0.63 × 年龄(女性);与实测最大心率HR相比,***P < 0.001。
表2显示,Nes公式表现出最大的正向偏差(6.01 bpm, 95% CI: 5.52~6.50),Fairbarn公式表现出负向偏差(−2.84 bpm, 95% CI: −3.33, −2.35),Arena公式一致性界限范围最宽(LLOA: −17.37, ULOA: 18.12)。Gellish公式偏差最小(0.26 bpm, 95% CI: −0.23~0.75),一致性界限范围相对较窄(LLOA: −15.85, ULOA: 16.37)。通过MAPE和RMSE进一步评估预测精度。Gellish公式的MAPE (3.49%)和RMSE (8.22 bpm)均为最低,显示其整体预测误差最小。Tanaka公式和Arena公式的误差相近(MAPE: 3.56%~3.67%; RMSE: 8.31~8.48 bpm),表现中等。Fox公式和Nes公式的误差最大(MAPE: 4.56%~4.57%; RMSE: 10.13~10.14 bpm),表明其预测精度较差。如图1所示,所有公式均显示宽泛的95%一致性界限(平均范围 ± 10~15 bpm)。
Figure 1. Bland-Altman plot of the consistency between measured and predicted maximum heart rate
图1. 实测与预测的最大心率之间的一致性Bland-Altman图
Table 2. Mean bias and 95% confidence interval, lower limits of agreement (LLOA), upper limits of agreement (ULOA), mean absolute percentage error (MAPE), and root mean square error (RMSE)
表2. 偏差的均值和95%置信区间、一致性下限(Lower limits of agreement, LLOA)、一致性上限(Upper limits of agreement, ULOA)和MAPE、RMSE
Equations |
Bias |
LLOA |
ULOA |
MAPE (%) |
RMSE |
Fox |
4.85 (4.31, 5.38) |
−12.62 (−13.54, −11.71) |
22.31 (21.40, 23.23) |
4.57 |
10.14 |
Tanaka |
1.26 (0.77, 1.75) |
−14.85 (−15.70, −14.01) |
17.37 (16.53, 18.22) |
3.56 |
8.31 |
Arena |
1.93 (1.43, 2.43) |
−17.37 (−15.10, −13.41) |
18.12 (17.27, 18.96) |
3.67 |
8.48 |
Gellish |
0.26 (−0.23, 0.75) |
−15.85 (−16.70, −15.01) |
16.37 (15.53, 17.22) |
3.49 |
8.22 |
Nes |
6.01 (5.52, 6.50) |
−9.98 (−10.82, −9.15) |
22.00 (21.16, 22.84) |
4.56 |
10.13 |
Fairbarn |
−2.84 (−3.33, −2.35) |
−18.75 (−19.58, −17.91) |
13.07 (12.24, 13.90) |
3.57 |
8.59 |
注:LLOA (Lower limits of agreement):一致性下限,ULOA (Upper limits of agreement):一致性上限,MAPE:平均绝对百分比误差,RMSE:均方根误差;Fox = 220 − 年龄;Tanaka = 208 − 0.7 × 年龄;Arena = 209.3 − 0.72 × 年龄;Gellish = 207 − 0.7 × 年龄;Nes = 211 − 0.64 × 年龄;Fairbarn = 208 − 0.8 × 年龄(男性)或201 − 0.63 × 年龄(女性)。
4. 分析讨论
在运动科学领域,准确预测HRmax对评估运动员体能、制定科学训练计划至关重要。本研究将六个年龄预测最大心率公式应用于运动员运动测试数据集,评估其有效性。研究基于马拉加大学2008~2018年间收集的跑步机最大分级运动测试数据集。研究结果显示,六个公式在运动员人群中的预测准确性存在差异,且均存在一定局限性。相对而言,Gellish公式的整体表现最优,但其一致性界限仍较宽,个体误差显著。通用公式(如Fox、Nes)因系统性偏差较大,不推荐用于运动员。
Fox公式被广泛应用于运动科学和临床实践中。然而,该公式基于有限样本数据,标准偏差较大。我们的研究结果与之前的研究一致[21] [22],表明Fox公式倾向于高估实际的HRmax。例如,在Tanaka等人的元分析中,他们也发现Fox公式在多个年龄段中的准确性较差[7]。同样,Gellish等人通过纵向数据分析指出,Fox公式显著高估了成年人的最大心率[23]。此外,我们还观察到Fox公式的MAPE和RMSE相对较高,说明其预测精度较低。这些发现支持了过去几十年间多项研究所提出的观点,即Fox公式可能不适合用于所有年龄层的人群,特别是在需要更高准确度的应用场景中[22] [24] [25]。因此,尽管Fox公式因其简单性仍然具有一定的实用性,但在追求更精准预测的情况下,应考虑采用其他更为精确的方法或公式。
Tanaka公式是通过对大量研究进行元分析后得出的一个改进公式。相比于传统的Fox公式,Tanaka公式在多个年龄段中显示出更高的准确性[7] [22]。在研究中,从整体数据来看,该方程的预测结果与实测最大心率存在一定差异。在男性运动员中,Tanaka方程系统偏差较小(−0.81 bpm, 95% CI: −1.53, −0.09),但一致性界限范围最为宽泛(LLOA: −17.37, ULOA: 18.12)。与前人的研究结果类似,在本次研究中,Tanaka方程也未能精准预测运动员的最大心率[5] [26]。在Kasiak的研究中,对大量跑步者和骑自行车者进行测试后发现,Tanaka方程的预测值与实测值有显著差异,且在不同性别和运动项目中的表现各异[5]。与Tanaka公式相似,Arena公式在男性运动员群体中系统偏差最小(−0.16 bpm, 95% CI: −0.89, −0.56),但一致性界限范围宽泛(LLOA: −16.87, ULOA: 16.54)。两者在整体数据中的预测精度不足。
Gellish公式源自对同一人群长达25年的纵向追踪研究,共纳入908次最大强度运动测试数据[23]。本研究发现,Gellish公式的偏差为0.26 (−0.23, 0.75),置信区间接近零,表明其预测值与实测值的系统性偏差极小。一致性界限范围较窄,且置信区间更集中,表明其预测值与实测值的离散度较低。此外,相对最低的MAPE和RMSE表明其整体预测精度更高。这可能与其科学的研究设计和统计方法有关。首先,纵向研究设计能更准确地捕捉个体心率随年龄变化的轨迹,减少横截面研究中因人群异质性导致的偏差;其次,研究样本年龄跨度大(27~78岁,平均47.8岁),提高了公式的普适性;最后,研究采用线性混合模型(Linear Mixed Models),综合考虑了重复测量的时间相关性、个体随机效应及协变量(如BMI、静息心率)的影响。
Nes公式是在一项大型健康受试者研究中开发出来的,该研究涉及了挪威HUNT健身研究中的大量数据[27]。Nes公式试图提供一个更为普适的年龄预测最大心率模型。然而,在本研究中,Nes公式的整体表现欠佳,其预测值与实际测量值之间存在显著差异。这一点与之前的研究结果一致[5] [9]。我们的结果显示,Nes公式倾向于高估实际的最大心率。这种偏差可能与Nes公式基于的样本特征有关,因为HUNT研究主要涵盖了北欧人群的数据,而这些人群的心血管健康状况和生活方式可能与我们研究中的参与者有所不同[28]。此外,Nes公式在处理性别差异方面并未进行专门调整,这也可能是导致其预测精度不如其他性别特异性公式的原因之一。
Fairbarn等人开发了一系列基于年龄和性别的最大心率预测公式。这些公式是在一个包含231名健康成人的数据集基础上建立起来的,目的是提高特定性别群体中的预测精度[29]。在本研究中,我们发现Fairbarn公式在当前样本总体、男性和女性参与者中的预测效果均欠佳,同样表现出一定的偏差。这一点与Cleary等人的研究不同[6]。基于Fairbarn公式的预测倾向于低估实际的最大心率[5] [9]。Fairbarn公式是基于一个较小的数据集(231名健康成人)开发的,而本研究则使用了一个更大且更广泛的运动员数据集。样本特征的不同可能导致了预测性能的差异。
尽管本研究在比较不同年龄预测最大心率公式的性能方面提供了有价值的信息,但仍存在一些潜在的局限性,这些局限性可能影响结果的普遍性和解释。首先,由于HRmax受性别、体重、种族等因素的影响[30],因此,所有仅基于年龄预测最大心率的公式均存在一定的预测精度不稳定。其次是样本的代表性。本研究的数据集虽具有一定的多样性,但样本仍然可能无法完全代表全球范围内的所有人群,特别是在种族、文化背景和生活方式等方面的差异。此外,数据集中也未能对业余及专业运动员的比例、运动类型的细分进行充分描述,存在不足之处[5]。期望在今后的研究中能够扩大数据收集范围,细分运动属性,采用更先进、多元的方法进行统计分析,以提升研究结果的可靠性。
5. 研究结论
本研究评估了多个年龄预测最大心率公式在运动员群体中的有效性,仅Gellish公式预测的HRmax与实测值无统计学差异。综合分析,Gellish公式偏差最小、预测误差最低,在六个公式中表现相对最优,更适用于运动员群体HRmax的预测,但个体误差仍较显著。而Fox、Nes等公式因偏差大、精度差,应用于运动员群体需谨慎。
基金项目
安徽省高等学校省级质量工程项目《康复治疗学新建专业质量提升项目》(2022xjzlts018)。
NOTES
*通讯作者。