1. 引言
随着潜水探索、水下工程建设等高压环境作业活动的逐步增多,减压病(Decompression Sickness, DCS)因可能引发关节疼痛、神经损伤乃至危及生命而日益受到重视,自20世纪初以来,减压模型已成为预防DCS的核心工具[1] [2]。早期模型为确定性模型,假设减压病的发生取决于是否超过固定阈值,20世纪80年代,Weathersby等引入生存分析方法,将DCS视为随机概率事件,构建了概率模型来量化潜水后DCS发生的概率[3]。
风险函数将整个减压过程中的瞬时风险进行积分,模拟了潜水活动中风险的动态累积过程,其数学形式对概率模型有决定性影响。概率模型通过风险函数将组织气体张力与患病概率联系起来,计算暴露过程中的累积风险。最简单的风险函数定义是组织气体张力与环境压强的过饱和压差,假设过饱和程度直接决定风险[3]。该形式虽直观,但无法解释不同潜水深度下风险分布的差异。后续提出将风险定义为过饱和压差与环境压的比值,使其与环境压力直接关联。实验表明其在多个数据集上具有更好的预测性能,因此成为后续研究的主流选择。
尽管概率减压模型可作为评估潜水后减压病发生风险的工具,但其关键组成部分风险函数仍存在一定局限性:其一,这类基础风险函数假定一旦产生过饱和,风险就开始累计增加,未考虑机体缓冲效应对短暂过饱和状态的耐受性,可能导致低风险暴露对发病概率的高估;其二,线性的基础函数没有捕捉到气泡快速生长、融合所带来的风险非线性加速特征;其三,单纯的过饱和压差在不同深度下的风险贡献未能体现差异,这与高压环境下气泡生成受抑制的生理事实不符。上述局限性制约了概率模型在不同潜水场景下的预测精度与泛化能力,亟需对风险函数的数学形式进行系统性重构与优化。因此,本研究基于减压病风险累积规律,构建了多种风险函数,以猪饱和潜水为研究场景,建立参数优化与性能评估体系,对各类风险函数进行系统比较与筛选。最终确定预测精度更高的风险函数。研究过程中形成的风险函数优化、参数拟合与性能评估方法不局限于猪饱和潜水这一场景,可为后续其他物种及复杂场景概率减压模型的开发提供参考。
2. 数据来源及方法
2.1. 数据来源
实验数据来源于猪的空气饱和潜水,共包含179次实验,共发生91次减压病,每个计划都遵循相同的格式记录[4]-[6]。猪体重范围为17.0 kg~79.3 kg,压力范围为1.9 ATA~5.6 ATA,底部停留时间为1440分钟。实验遵循快速下潜→长时间底部停留→快速上升→症状观察。数据记录已完整给出整个潜水方案。
采用猪饱和潜水的原因是其大幅降低了模型拟合的计算成本与收敛难度,因饱和潜水需长时间暴露于稳定高压环境,此时猪体内各组织的惰性气体张力已接近最大值,仅需一类理论组织即可有效描述气体过饱和状态,无需通过多理论组织模型区分快、慢代谢组织的差异。
2.2. 方法
整体流程框架如图1所示:
Figure 1. Overall process framework
图1. 整体流程框架
1) 读取基础数据:批量读取记录了每个实验的时间–深度序列(如[(0, 0), (10, 20), (30, 0)]表示0分钟在0米,10分钟下潜至20米,30分钟返回水面)。记录每个实验的DCS发生与否(0/1)及体重等信息。
2) 数据标准化处理:假定匀速加压减压,使用线性插值,生成间隔为0.1分钟的时间–深度数据,方便后续通过解析解计算每个时间步长的组织氮分压。
3) 初始参数设置:生成100组随机参数值。计算各组对数似然值,筛选前10组高似然参数值,作为参数估计的初始点。
4) 多轮优化:从10组参数估计的初始点出发,进行计算:
① 组织氮张力:通过解析解计算各组织每间隔0.1分钟步长的组织氮张力。
② 累积风险R:按指定风险函数计算出瞬时风险,再用梯形积分法计算整个潜水过程的累积风险R,将各组织的累计风险进行累加就能计算出整个潜水过程中的总风险。
③ DCS概率:代入生存分析模型计算得出每个实验的患病率。
5) 参数优化:采用Nelder-Mead法,以“最小化负对数似然函数”为目标优化参数。快速定位局部最优,模拟退火(SA)从局部最优出发,跳出局部陷阱。
6) 模型保存:筛选出对数似然值最大的模型,使用已拟合的最优参数,计算每个潜水计划的DCS概率,将概率模型最优参数、预测DCS结果保存。
2.2.1. 指数–指数(EE)动力学模型
EE模型通过使用指数函数来描述每个平行理论组织中惰性气体的摄取和排出。
每个组织的惰性气体张力可用微分方程表示[1]:
其中
为第i类组织的半饱和时间的倒数,
为环境中惰性气体的分压,
为第i类组织的惰性气体张力[1]。
假设在时间段
内,匀速下潜或上浮,那么环境氮分压
随时间线性变化:
其中m是氮分压变化斜率:
令
,那么
微分方程变为:
整理为标准形式:
是一个一阶线性非齐次微分方程,其形式为:
,
分别求解出齐次解和非齐次解可求出通解,解得:
当环境压力恒定即当处于某一深度不动时,m = 0方程可简化为:
基于上式即可计算出任意时刻的张力,进一步得到对应的风险函数值,为确保进行高精确的数值积分,所有模型均使用0.1分钟的积分步长。
2.2.2. 风险函数
目前使用较为广泛的风险函数为过饱和比:
风险函数
定义为第i个组织在时间t时的瞬时风险,其中
是第i个组织在时间t时的惰性气体组织张力,
是在时间t时的环境压力,而
是血液中溶解的二氧化碳和水蒸气的气体张力,是一个定值,为0.1917 Atm。在计算上,风险函数会进行正向截断处理,即:
已知风险函数的形式对模型的风险累积特性有重要影响,因此Weathersby等人探讨了几种风险函数形式,并发现除以当前环境压通常可以改善模型性能。许多后续的概率模型使用了与上式类似的函数形式来描述瞬时DCS风险[7]。
风险函数的设计与减压病发病机制相关。最基本的过饱和压差函数认为组织气体张力与环境压强的差值决定了气泡形成的驱动力,但未能解释机体对轻度过饱和的耐受。为此,发展出了阈值模型,引入生理缓冲效应,使风险仅在超过阈值后累积。另一方面,为解决“不同环境压力下风险基准不一致”的问题,基于所处环境压强进行归一化处理,发展出了过饱和比模型。为研究风险是否随过饱和程度呈非线性增加,提出了带指数项的扩展模型,使风险累积能体现“过饱和程度越高,风险加速上升”的特性,因此,在风险函数的构建中,以差值、比值模型为基础,分别与阈值项、指数项进行多维度的组合。综上所述,形成了差值、阈值、比值、指数及复合类型的10种风险函数。
Table 1. Risk function formula
表1. 风险函数公式
风险函数 |
|
|
|
|
|
|
续表
|
|
|
|
:第i类组织
:二氧化碳和水蒸气产生的气体压力 |
:环境压力
:阈值仅最后一类组织含有
:指数项 |
如表1所示,这10种风险函数的核心差别在于:
1) 有无阈值
,超过阈值才开始累计风险。
2) 是否存在指数项,使风险累计不再是线性关系。
3) 是否与环境压有关,除以当前环境压进行放缩。
2.2.3. 生存分析
基于生存分析,通过对瞬时风险函数进行积分量化整个潜水过程的风险。
生存分析的一般形式为:
其中
是瞬时风险函数,
是一个增益项,用于缩放和无量纲化第i个组织中的风险函数,
是所有组织的瞬时风险总和,
是未发生DCS的概率,t是观察结束的最终时间,在指定的时间间隔内对风险函数进行积分计算出该时间间隔的累积风险值。为确保进行高精确的数值积分,所有模型均使用0.1分钟的积分步长。通过指数函数确定潜水后的生存概率,该概率即为从开始潜水到观察时间t时未发生减压病的概率:
上式p为从开始潜水到观察时间t结束时发生减压病的概率。
2.2.4. 最大似然法
最大似然法的核心特征是通过调整模型参数来实现模型与实验数据的最佳拟合[3]。
假设已获取一组潜水员的压力暴露详细记录及减压后的结果,以个体潜水后是否出现症状为判断标准,那么单次潜水要么发生减压病,要么不发生,两种情况的概率之和为1,即:P (无DCS) = 1.0 − P (DCS)。
用变量
表示第i次潜水的结果:出现减压病时
,未出现时
。第i次潜水的实际结果概率为:
若已知n次减压试验的全部结果,且各次试验结果相互独立,则试验结果的似然函数定义为各次观测概率的乘积:
。似然函数用于理论预测整体试验结果,由于L是多个小于1的数的乘积,其乘积通常很小,无法直观判断,实际计算中通常使用其自然对数LL。通过调整理论模型中的参数使LL最大化,可实现理论与试验结果的最佳拟合——拟合效果更好的模型对应更大的似然值,反之则更小。
3. 模型性能评估
3.1. 模型检验
为判断观测数据的分布是否与预期分布存在显著差异。通过比较观测频数与期望频数之间的差异来评估模型的拟合效果。如图2所示,所有风险函数的Pearson拟合优度检验的p值均大于0.05,模型概率预测与实际发生率之间不存在显著偏差。
Figure 2. Pearson’s p-values for different risk functions under saturated diving in pigs
图2. 猪饱和潜水下不同风险函数的Pearson p值
3.2. 模型筛选
采用适合于小样本的修正的赤池信息准则AICc对模型进行评估,结果如表2所示,最终筛选出兼顾了拟合精度与模型简洁性的模型[1] [2]。
其中:
:模型的参数个数。
:模型的最大对数似然值。
n:样本量。
Table 2. Likelihood values, AICc values, and parameter values of different risk functions
表2. 不同的风险函数、似然值、AICc值、参数值
风险函数 |
对数似然值 |
AICc值 |
模型参数值 |
|
−108.27 |
220.60 |
t1: 461.77 g1: 0.0076 |
|
−102.98 |
212.09 |
t1: 698.16 g1: 0.0420 Thr: 0.8281 |
|
−104.28 |
214.70 |
t1: 407.11 g1: 0.0039 n: 5.6202 |
|
−102.18 |
212.59 |
t1: 419.20 g1: 0.0427 Thr: 0.5504 n: 3.0246 |
|
−108.27 |
220.61 |
t1: 481.79 g1: 0.0077 |
|
−102.97 |
212.08 |
t1: 562.49 g1: 0.0412 Thr: 0.8666 |
|
−104.27 |
214.68 |
t1: 430.09 g1: 0.0040 n: 5.5975 |
|
−102.19 |
212.60 |
t1: 580.12 g1: 0.0474 Thr: 0.8345 n: 1.2101 |
|
−104.28 |
214.69 |
t1: 429.65 g1: 0.0040 n: 5.5997 |
|
−102.19 |
212.61 |
t1: 566.80 g1: 0.0472 Thr: 0.8427 n: 1.1924 |
通过AICc权衡模型的复杂度与模型拟合数据的优良性筛选出与最小AICc值之差在2以内的风险函数作为候选最优模型集,见表3,最优模型集的ROC曲线下面积(AUC)为0.74。综上所述,该模型不仅具备一定的区分能力,而且在概率预测方面也表现出较好的校准性,可作为一种合格且可初步具备应用价值的猪饱和潜水风险预测工具。风险函数的构建和筛选评估方法在猪饱和潜水的数据拟合上表现较好,具备拓展应用到构建其他潜水减压概率模型的潜力。
Table 3. Accuracy, precision, recall, and F1 score of the optimal model set
表3. 最优模型集的准确率、精确率、召回率、F1分数
风险函数 |
准确率 |
精确率 |
召回率 |
F1分数 |
|
0.7039 |
0.6508 |
0.9011 |
0.7558 |
|
0.7039 |
0.6508 |
0.9011 |
0.7558 |
|
0.7039 |
0.6508 |
0.9011 |
0.7558 |
|
0.676 |
0.6542 |
0.7692 |
0.7071 |
|
0.676 |
0.6542 |
0.7692 |
0.7071 |
需要指出的是,表3中几类风险函数的预测效果较为接近。这一方面是由于它们在数学形式上均引入了阈值或指数等非线性项,核心特征相似,从而导致拟合结果趋同;另一方面,受限于猪饱和潜水实验数据样本量有限,评价指标的分辨率不足以显著拉开模型间的差距。因此,多种模型表现接近也从侧面说明了风险函数构建方法的稳健性。未来在更大规模或不同条件的数据集上,有望进一步区分模型间的优劣。
4. 结论与展望
基于减压病病理机制,构建了差值、阈值、比值、指数及复合类型的10种风险函数。经过“数据处理、组织张力计算、风险积分、参数优化”流程,分别拟合出每种风险函数的最优参数,拟合结果经Pearson检验均无显著偏差(p > 0.05)。最优模型集中引入非线性指数项与生理阈值项的风险函数在区分能力与校准性方面均表现出较为理想的结果:其准确率为70.39%,精确率为65.08%,召回率为90.11%,AUC值达0.74。这一结果印证了引入非线性指数项与生理阈值可有效提升模型对风险累积的识别能力。
本研究为特定场景下的风险函数筛选提供了一套行之有效的量化流程,能够系统地比较不同风险函数在特定数据集上的表现。这一方法学框架不仅适用于饱和潜水场景,也为其他类型潜水的风险函数评估提供了参考。
但本研究仍存在以下几方面的局限性:首先,实验数据来源于猪的饱和潜水,猪与人类在生理结构、代谢率等方面存在显著差异,这些因素可能影响惰性气体的摄取与排出,从而限制本研究得出的最优风险函数直接外推至人类潜水的适用性[8] [9]。其次,本研究聚焦于饱和潜水场景,其气体动力学过程与常规潜水有本质区别。饱和潜水涉及长时间高压暴露后组织的完全饱和,而常规潜水气体摄取与排出涉及更为复杂。因此,本研究筛选出的风险函数在常规潜水中的表现仍需进一步验证。未来可构建多物种多类型的潜水数据库,验证函数泛化能力及应用价值。目前采用单组织模型,未来可引入多平行理论组织模型结合灌注扩散模型模拟气体在不同组织间的转运过程,更贴近生理实际。