1. 引言
飞行训练是飞行学员提高飞行能力的一项重要训练内容,而飞行训练成绩评定又是飞行训练工作中的一个重要组成部分,客观合理的对飞行学员飞行训练的质量进行评估,对于衡量飞行学员操作水平、打好飞行基础、提升飞行能力、改善飞行技巧、保障飞行安全、提高飞行训练质量等具有重要的作用。飞行训练成绩评定的目的是让飞行学员充分利用每架次飞行,保证每个架次都能进行高质量的飞行训练,并且通过后续分析飞行训练成绩的变化,对成绩不稳定的学员有针对性地进行训练课目的调配和强化训练,可以显著提升训练质效。
目前,飞行训练评估方法主要是以带飞教官的人工评分为主,这种方式需要花费庞大的人力和物力资源,且效率低下,还会因为不同带飞教官等人为因素造成评估偏差[1]。为了有效提高飞行学员飞行训练评估的准确性,减少带飞教官的工作量,节省在飞行训练评估上的精力和物力等资源,同时降低人为等主观因素所产生的评估误差,近年来,许多专家学者基于各类模型对飞行训练质量的评估进行了大量研究。比如,尹大伟[1]研究了基于飞参数据的飞行学员飞行训练质量评估方法,深入分析了飞行训练质量评估的特点,建立了飞参数据辅助评估流程和基本框架;王昌海等[2]基于多元线性回归分析的方法,通过从飞行训练成绩单数据中提取出了15个变量,建立了多元回归模型,进行了飞行训练成绩评定问题研究;罗渝川等[3]通过分析文献和访谈专家收集了训练绩效指标,并通过层次分析法和因子分析法构建了飞行学员训练绩效指标模型。但是上述研究大都停留在理论阶段或定性分析[4]-[6],缺乏定量的研究,而定量研究对于提升飞行学员飞行能力、提高飞行学员的训练效率具有重要的指导作用,因此研究基于部分线性变系数模型的飞行训练成绩综合评定具有重要的应用价值和现实意义。
2. 部分线性变系数模型
部分线性变系数模型[7] (Partial Linear Variable Coefficient Models, PLVCM),是近年来发展起来的一种高级数据分析模型,其既含有线性模型部分,又含有变系数模型部分,是线性模型与变系数模型的结合,因此其具有线性模型便于解释和非参数模型稳健的特征。
(一) 模型形式
部分线性变系数模型的基本形式如下:
(1)
其中
是响应变量,
,
和
为协变量,
是
维的未知参数向量,
是
维未知的系数函数向量,
为模型误差并且满足
,
。为了避免“维数祸根”,一般假设
为单变量。
(二) 参数估计
对
的估计通常采用profile最小二乘法[4],估计结果为:
(2)
(3)
其中
,
为核函数,
为带宽,
为单位阵,
,
,
,
,
,
,
。
(三) 模型检验
由样本计算得到的回归系数
及回归系数函数
是总体回归系数和
回归系数函数
的估计值,如果这些总体回归系数或总体回归系数函数等于0,那么部分线性变系数模型将没有任何意义。因此在建立回归方程后还需要对这些回归系数进行检验,来验证回归方程是否统计显著。
对参数分量检验,要进行的假设检验问题为:
(4)
构造广义似然比PLR统计量为:
(5)
当原假设
成立时,上述PLR统计量渐进服从自由度为
的卡方分布,即在原假设下:
。因此可以使用卡方分布对回归模型参数分量的显著性进行假设检验。
对非参数分量检验时,在得到
的非参数分量估计之后,需要检验非参数分量是否可以用参数模型进行拟合,为此可构造的假设检验问题为:
为常数 (6)
构造广义似然比GLR统计量为:
(7)
当原假设
成立时,广义似然比GLR统计量
渐进服从卡方分布,因此可以使用卡方分布对回归模型非参数分量的显著性进行假设检验。
(四) 模型评价
统计学中评价回归模型性能最常用的指标之一为
(R-squared),又称决定系数(Coefficient of Determination),是评价估计量与被估计量之间差异程度的一种度量方法,用于衡量模型对样本数据的拟合优度,反映了模型的预测准确性,核心思想是通过比较模型预测值与实际值的差异,量化模型解释目标变量变异的能力,其值取值范围为0到1,越接近与1,说明模型拟合的越好,解释能力越强,预测精度也越高;反之,则说明模型拟合的效果较差。计算公式为:
(8)
其中
为残差平方和,即预测值与实际值之差的平方和;
为总平方和,即实际值与其均值的偏差平方和。
有如下两个特点:① 具有直观的解释性,
表示模型能解释80%的目标变量差异,剩余20%由其他因素或者随机噪声导致;② 无量纲性,不受目标变量单位影响,便于不同模型间的横向比较。
3. 飞行训练成绩评定
(一) 数据来源及说明
本文选取了100名中高级阶段飞行学员高教机型飞行训练成绩数据,经过前期的数据预处理,共得到315条有效样本,每个样本包含10个变量,分别为:当前架次总成绩、是否为单元首个架次、前一架次总成绩、当前架次动作条目总数、架次动作条目成绩大于标准的总和、架次动作条目成绩小于大纲标准的总和、当前架次大纲要求的标准总数、当前架次难度、架次任务相似度、当前总架次数。其中“当前架次总成绩”为响应变量,其他9个变量为解释变量。
为了使用上的方便,定义变量及变量名称见表1。
Table 1. Variable and variable name
表1. 变量表示及变量名称
变量 |
变量名称 |
|
当前架次总成绩 |
|
当前架次动作条目总数 |
|
前一架次总成绩 |
|
是否为单元首个架次 |
|
架次动作条目成绩大于大纲标准的总和 |
|
架次动作条目成绩小于大纲标准的总和 |
|
当前架次大纲要求的标准总数 |
|
当前架次难度 |
|
架次任务相似度 |
|
当前总架次数 |
(二) 构建多元线性回归模型
为了便于将本文提出的模型与王昌海使用的多元线性模型[2]进行比较,先基于上述10个变量构建了如下的多元线性回归模型:
通过数据拟合,得到的变量估计值及对应的p值见表2。
Table 2. Variable estimates and p-values
表2. 变量估计及对应的p值
变量 |
系数估计值 |
误差标准差 |
t-统计量值 |
p值 |
截距项 |
12.21 |
4.83 |
2.53 |
0.012 |
|
11.99 |
1.03 |
11.67 |
0 |
|
0.66 |
0.04 |
16.2 |
0 |
|
0.12 |
0.15 |
0.77 |
0.44 |
|
0.17 |
0.07 |
2.42 |
0.016 |
|
−0.65 |
0.26 |
−2.49 |
0.013 |
|
0.12 |
0.03 |
3.43 |
0 |
|
−0.23 |
0.06 |
−4.06 |
0 |
|
−0.20 |
2.42 |
−0.08 |
0.93 |
|
−0.01 |
0.01 |
−0.83 |
0.41 |
并进一步计算得到了多元线性回归模型的决定系数为
,残差标准差为
。下面,将使用本文提出的部分线性模型来拟合飞行训练成绩数据。
(三) 构建部分线性变系数模型
众所周知,随着飞行架次的增多,飞行水平会逐渐提高。因此,为了考查“当前总架次数”对其他变量的影响,故本文选取“当前总架次数”
作为模型非参数分量的自变量,即取
。
首先,构建变系数模型[8]:
本文选取的核函数为Epanechnikov核,即:
,使用交叉验证法确定最优带
宽。通过数据拟合,可以得到上述变系数模型的决定系数
,残差标准差
。然后对非参数系数函数进行假设检验,来判断系数函数是否是统计显著的。表3展示了每一个系数函数的统计量值及对应的
值,此处取显著性水平为0.01。
Table 3. Coefficient function test statistic and p-values
表3. 系数函数检验统计量及对应的p值
|
|
|
|
|
|
|
|
|
GLR统计量 |
21.169 |
151.34 |
0.805 |
4.469 |
2.160 |
8.313 |
5.571 |
0.713 |
值 |
0 |
0 |
0.448 |
0.012 |
0.088 |
0 |
0 |
0.636 |
由上表结果可知,
系数函数的
值大于0.01。可以判断
的系数函数不随
的变化而变化,因此可以认为
的系数为常数。
基于上述分析,在变系数模型的基础上,可以将
的系数设为常数,从而构建如下的部分线性变系数模型:
再次使用上述模型拟合数据,此时需要判断
的系数是否是统计显著的。为了验证上述想法,需要构建参数分量的假设检验统计量,假设检验的结果见表4。
Table 4. Parameter component coefficient test statistic and p-values
表4. 参数分量系数检验统计量及对应的p值
|
|
|
|
|
PLR统计量 |
−0.758 |
2.924 |
−2.403 |
−0.776 |
值 |
0.449 |
0.004 |
0.017 |
0.44 |
由上表可知,
系数
检验的
值大于0.01,即
这三个变量的变化对响应变量
几乎没有影响,可以认为
。可得最终的模型为:
继续使用上述模型来拟合数据,最后得到参数分量
的系数
,估计标准误差为0.061。非参数分量系数为函数形式,其估计值见图1黑色曲线所示,其中阴影部分为非参数系数函数的95%置信区间。
Figure 1. Nonparametric component coefficient function estimate
图1. 非参数分量系数函数估计值
此外,可得该部分线性变系数模型的决定系数
,明显大于多元线性回归模型的决定系数
,且该模型的残差标准差
,明显小于多元线性回归模型的残差标准差为
.因此,从上述结果上看,本文使用的部分线性变系数模型在对飞行训练成绩综合评定中要明显优于多元线性模型。
4. 实际指导意义
首先,科学评定能够“以数促训”,实现训练资源的精准投放。传统模式下,教官通常依据经验判断学员薄弱环节,容易出现“一刀切”或“重复加码”的低效训练。引入部分线性变系数模型的方法评价后,模型可自动识别出哪些变量(如前一架次成绩、当前架次难度、任务相似度等)对总成绩影响显著,哪些变量影响微弱。例如,数据显示,“前一架次总成绩”的系数显著为正,而“当前架次动作条目总数”在某些情境下并不显著。这意味着,当飞行学员成绩波动主要由前一架次表现决定时,应将重点放在帮助学员快速消化前序经验、强化动作记忆,而非简单增加飞行架次。通过精准定位关键变量,可把有限的航油、空域、机务保障资源集中到最能产生训练效益的课目和学员身上,显著提升单位资源的训练产出比。
其次,动态评估能够“以数促改”,实现训练方案的滚动优化。部分线性变系数模型的最大优势在于,其非参数部分允许变量效应随“当前总架次数”平滑变化,从而刻画出“学习曲线”的真实形态。图1中
的估计曲线表明,随着总架次数增加,当前架次动作条目总数对成绩的边际贡献先升后降:初期多动作有助于快速积累经验,但达到一定阈值后,过多动作反而分散注意力,导致成绩提升放缓甚至出现波动。这表明在学员飞行生涯早期应敢于“加课目、加动作”,促成“陡坡式”成长;而当飞行小时数累积到拐点后,应及时转入“精炼动作、强化质量”的阶段,避免“高原现象”。通过滚动更新模型参数,训练部门可以每月、每季度生成最新的“学习曲线”档案,据此微调课目编排和训练节奏,实现训练方案与学员成长阶段的精准匹配。
最后,公正评定能够“以数促战”,夯实飞行能力生成的底层逻辑。飞行学员选拔历来是敏感环节,若缺乏量化依据,容易滋生“人情分”“印象分”,挫伤飞行学员积极性。本文所提模型将所有飞行学员置于同一量化标尺下,依据客观数据自动生成排名,让学员对自身水平一目了然。更重要的是,模型结果可与实际背景结合:例如,未来飞行中对低空飞行的精度要求极高,可将“当前架次动作条目成绩大于大纲标准的总和”权重调高,引导学员养成“超标”意识。通过实际需求转化为模型变量权重,训练评定与实际需求实现无缝衔接。
综上,以部分线性变系数模型为核心的飞行训练成绩综合评定体系,不仅能解决传统人工评分“高耗低效、主观偏差”的痛点,更能够通过精准识别关键变量、动态跟踪学习曲线、公正支撑人才选拔,形成“数据驱动、闭环管理”的训练新范式。对航空部门而言,这意味着训练资源投入更精准、训练效益评估更科学;对学员而言,则意味着成长路径更清晰、短板补齐更及时、个人潜力释放更充分。随着数据积累与模型迭代,该体系将持续反哺训练大纲修订、课目标准优化,最终推动飞行学员训练质量呈螺旋式上升。
5. 结束语
本文以飞行学员日常飞行训练成绩数据为研究对象,构建了包括响应变量在内的10个可以衡量飞行学员飞行训练质量的特征,通过数据的预处理,获得了315条有效样本。然后建立了部分线性变系数模型,并基于样本数据,完成了对参数分量和非参数函数分量的有效估计,之后对参数分量和非参数函数分量进行了假设检验,在假设检验的过程中同时完成了对变量选择,即保留与模型显著相关的变量,剔除与模型不相关的变量。最后使用模型评价指标决定系数
和残差标准差
,对部分线性变系数模型和多元线性模型进行了比较,结果表明,无论是决定系数还是残差标准差,部分线性变系数模型在对飞行学员飞行训练成绩综合评定中都要明显优于多元线性模型。研究结果可以有效地辅助带飞教官对学员飞行训练成绩的评定,更加科学、客观、公正地评估飞行学员的训练质量,进一步提高飞行学员人才培养的质量。