1. 引言
考试成绩作为衡量学生学习成果和筛选人才的重要依据,一直是教育行业研究的主要对象。传统的考试成绩分析大多是基于正态分布进行的。然而,近年来越来越多的教育工作者在对考试数据进行分析时,发现真实考试成绩与基于正态分布的成绩分析存在较大差异。多位学者的研究亦表明学生的考试成绩不服从正态分布,并分析了考试成绩不服从正态分布的原因,且提出了合理的替代分布模型。马成有(2013) [1]和岳武陵(2007) [2]对考试成绩和正态分布之间的关系进行了分析讨论,得出大学生的考试成绩基本不可能服从正态分布的结论。喻晓莉(2006) [3]研究了学生成绩偏离正态分布的原因。尹向飞(2007) [4]、张军舰和马岱君(2021) [5]等人的研究也指出考试成绩的分布使用正态分布进行分析也是不合适的。因此寻找合适的分布模型对考试成绩进行分析是一个值得探讨的问题。
为寻找合适的分布模型对考试成绩进行分析,众多学者进行了有效探索。张国才(2002) [6]研究认为由于考试成绩分布与多个因素有关,如学生群体大小、学生群体和教师的能动作用、学生的素质和基础、成绩评定标准等,因此积极有效的教学可能导致成绩呈现负偏态分布,并对成绩符合负偏态的合理性进行了分析。李翔等(2011) [7]研究认为在当前我国国情下,正态分布不一定能反映教师和学生的教学和学习水平,而峰值靠右的负偏分布可能是合适的分布,同时提出利用三次Hermite样条和B样条构造考试成绩标准分布函数的方法。考虑到考试成绩存在多峰分布的特点,尹向飞(2007) [4]、张军舰和马岱君(2021) [5]等建议采用混合正态分布对考试成绩进行分析,通过实证分析,发现相比传统的正态分布,混合正态分布对学生成绩的拟合情况更佳,具有应用上的优势。另外,李金屏(2009) [8]等在考虑了学习时间和学习效率的影响之后给出了一个通用的学生考试成绩分布的数学模型。为了进一步分析影响考试成绩的关键因素,彭长生(2010) [9]基于调查数据采用线性回归模型实证发现学习态度、努力程度、班级学风、家庭背景等对考试成绩有影响。除回归模型外,沈家豪等(2022) [10]采用结构方程模型探索医学硕士研究生课程考试成绩的影响因素。喻铁朔等(2020) [11]通过多种回归模型(广义线性模型、深度学习、梯度提升树、支持向量机)结合各可能影响因素对学生考试成绩进行预测。张莉等(2017) [12]利用支持向量机技术对高考成绩进行预测分析。考虑到考试成绩呈现偏态的特点,Canale等(2016) [13]采用偏t分布拟合大一新生统计学考试成绩,讨论了分布参数的无信息分布,采用贝叶斯方法估计模型参数,并将相应方法应用于多门相关成绩的联合建模。
从现有有关考试成绩建模分析的文献可以发现越来越多的学者关注到考试成绩分布有偏特征,开始尝试用有偏分布进行研究分析,但相关工作还不多见。本文结合考试成绩有偏、多峰的特点,提出采用尺度混合偏态分布对考试成绩进行拟合,重点探讨混合偏正态分布的应用。通过模拟和实证验证所提方法的有效性。进一步,为探讨影响学生考试成绩的因素,提出采用尺度混合偏态误差回归模型对考试成绩进行分析,并与一般回归模型结果进行对比分析,证实所提方法在考试成绩评价中的优势。
2. 有限混合–尺度混合偏正态分布
近年来,有限混合分布被广泛应用于金融、心理、生物医疗等各个领域,相关理论研究成果丰硕[14]。其中,混合正态分布运用较为广泛。但在实际应用中,由于数据分布经常是有偏的,从而正态分布的对称性难以满足,因此混合偏态分布模型常被用来拟合前述的多峰有偏的数据[15] [16]。本文基于Basso等(2010) [16]和Prates等(2013) [17]的研究,侧重于有限混合尺度混合偏正态分布模型的统计推断和应用。
2.1. 尺度混合偏正态分布
设随机变量X具有密度函数:
(1)
则称随机变量X为服从参数
的一元偏正态分布,记为
,其中,
表示位置参数,
表示尺度参数,
表示偏度参数,
为标准正态分布的密度函数,
表示标准正态分布的分布函数。当偏度参数
等于0时,式(1)所表示的密度函数将退化为正态分布的密度函数,即偏正态分布将退化为正态分布。
设
。令
其中U是与Z独立且取值为正的随机变量。U的分布函数和密度函数分别记为
和
,
为分布参数。我们称Y服从尺度混合偏正态分布,记为
。随机变量Y的边缘密度函数为:
注1考虑U的不同取值,有:
1. 当
时,上述尺度混合偏正态分布退化为偏正态分布。
2. 当U取不同分布时,尺度混合偏正态分布对应常见的偏t分布、偏Slash分布、污染偏正态分布等。
若
,即U服从均值为1的伽玛分布,则Y服从偏t分布,记为
,其密度函数为
其中
,
,
表示均值为0,标准差为1,自由度为
的标准t分布函数。当偏度参数
时,Y服从t分布。
若
,其中
为参数
的贝塔分布,则Y服从偏Slash分布,记为
,其密度函数为
若U为离散随机变量,密度函数为
,
,
,其中
,
为示性函数,则Y服从污染偏正态分布,记为
,其密度函数为
2.2. 有限混合–尺度混合偏正态分布
令
,
。若随机变量Y具有密度函数:
(2)
其中
为尺度混合偏正态分布
的密度函数,
为各成分分布的混合比例,满足
且
,则称Y服从由m个尺度混合偏正态成分分布组成的有限混合尺度混合偏正态分布,记为
。为计算方便,下文只考虑
的情况。
2.3. 参数估计
假设
为来自有限混合尺度混合偏正态分布
的一组简单随机样本。由FMSMSN分布的定义可知,样本
应属于m个成分分布中的某一类,但无法确切知道属于哪一类,因此引入隐变量
,其取值为0或1。若样本
来自第j个成分分布则
,否则
。另外,
满足以下条件:
令
,则
相互独立,且服从多项式分布
。为获得模型参数的估计量,Basso等[16]给出了样本
分层表示形式:
其中
,
,
,
为区间
上的半正态分布。
基于上述分层表示形式,把潜变量
,
的值看成是缺失数据,Basso等[16]给出了求解模型参数
极大似然估计的ECME算法。Prates等[17]给出了ECME算法实现的R包mixsmsn。对于有限混合偏正态分布以及有限混合偏t分布,Fruithwirth-Schnater和Pyne [15]给出了获得模型参数
的贝叶斯方法。本文我们采用R包mixsmsn计算模型参数
的极大似然估计。
2.4. 有限混合–尺度混合偏正态分布的数字特征
若
,密度函数如式(2)所示,则由Basso等[16]易得
其中
,
,
。令
为分布
的p分位数,则
满足
给定模型参数
以及成分比例
的值,解上述隐函数方程可得FMSMSN分布的p分位数
。但上述隐函数方程由于涉及到多个成分分布的分布函数,因此求解需要借助数值解法一种比较容易实现的方法是可以通过模拟的方法获取FMSMSN分布的分位数,即利用R包mixsmsn中的rmix函数生成足够多的服从
分布的样本,利用样本的p分位数近似
分布的p分位数。
2.5. 有限混合–尺度混合偏正态误差回归模型
除对学生成绩本身的拟合外,为了分析可能影响学生成绩的因素,考虑采用有限混合-尺度混合偏正态误差线性回归模型对学生考试成绩及其影响因素进行分析。
有限混合-尺度混合偏正态误差线性回归模型表示为
其中
为解释变量,
为回归系数,误差
,
,
。
对于上述模型中回归系数
以及
同样可以采用ECME算法获得参数的极大似然估计[18]。具体可以采用R包FMsmsnReg实现。
3. 数值模拟
尽管上述FMSMSN分布涵盖了多个可能的有限混合分布,如有限混合正态分布、有限混合偏正态分布,有限混合偏t分布,有限混合偏Slash分布等,但考虑到考试成绩有偏、多峰的特点以及模型可接受性等因素,本文重点考察有限混合偏正态分布
在对考试成绩分析中的应用。首先通过一个数值例子研究在真实数据来自混合偏正态分布时,采用ECME算法的估计效果。
采用模型参数估计量的相对绝对偏差(RB)和相对二次均方误差(RMSE)来度量估计效果的有效性,定义如下:
其中Q为总的模拟次数,
为模型参数
在第i次模拟的估计值,而
为参数
的真实值。考虑只含有两个成分分布的有限混合偏正态分布:
(3)
其中
,
,
。令式(3)中的参数真值为
,
,
,
,
,
。另外考虑成分分布比例为
,
以及
,
两种情况。样本量分别取为200、500、1000,重复模拟1000次,具体计算结果如下表1和表2所示。
Table 1. Parameter estimation based on the mixture of skew-normal distribution (π1 = 0.1, π2 = 0.9)
表1. 基于混合偏正态分布模型的参数估计(π1 = 0.1, π2 = 0.9)
参数 |
n |
RB |
RMSE |
参数 |
n |
RB |
MSE |
|
200 |
0.7620 |
0.5281 |
|
200 |
0.3517 |
0.1208 |
500 |
0.7530 |
0.5242 |
500 |
0.3600 |
0.1283 |
1000 |
0.7105 |
0.4637 |
1000 |
0.3490 |
0.1212 |
|
200 |
0.6243 |
0.3103 |
|
200 |
0.2627 |
0.0533 |
500 |
0.5619 |
0.2834 |
500 |
0.2544 |
0.0594 |
1000 |
0.5198 |
0.2550 |
1000 |
0.2479 |
0.0595 |
|
200 |
2.0643 |
0.3643 |
|
200 |
2.7684 |
6.5559 |
500 |
0.9020 |
0.0186 |
500 |
1.8685 |
3.3453 |
1000 |
0.7055 |
0.0155 |
1000 |
1.7597 |
3.0459 |
|
200 |
4.0451 |
15.7200 |
|
200 |
0.4495 |
0.1941 |
500 |
4.0654 |
16.1225 |
500 |
0.4517 |
0.1990 |
1000 |
3.8915 |
14.8802 |
1000 |
0.4324 |
0.1837 |
Table 2. Parameter estimation based on the mixture of skew-normal distribution (π1 = 0.5, π2 = 0.5)
表2. 基于混合偏模型参正态分布数估计结果(π1 = 0.5, π2 = 0.5)
参数 |
n |
RB |
RMSE |
参数 |
n |
RB |
MSE |
|
200 |
0.7600 |
0.5576 |
|
200 |
0.3391 |
0.1099 |
500 |
0.8015 |
0.63.2 |
500 |
0.3621 |
0.1283 |
1000 |
0.7304 |
0.5263 |
1000 |
0.3449 |
0.1182 |
|
200 |
0.5507 |
0.2666 |
|
200 |
0.2819 |
0.5392 |
500 |
0.5414 |
0.2711 |
500 |
0.2870 |
0.6973 |
1000 |
0.4909 |
0.2272 |
1000 |
0.2659 |
0.6608 |
|
200 |
0.9601 |
0.4515 |
|
200 |
1.5322 |
0.1759 |
500 |
0.7297 |
0.3813 |
500 |
1.5311 |
0.2102 |
1000 |
0.5312 |
0.2179 |
1000 |
1.4942 |
0.2175 |
|
200 |
0.0560 |
0.0000 |
|
200 |
0.0560 |
0.0000 |
500 |
0.0355 |
0.0000 |
500 |
0.0355 |
0.0000 |
1000 |
0.0248 |
0.0000 |
1000 |
0.0248 |
0.0000 |
同时为考察在模型为有限混合–尺度混合偏正态分布误差回归模型时ECMC算法估计的效果。我们假定多元线性回归模型为
其中
,
,
,
,
,
,
,
,
,
,
,
。同样考虑两种情况
,
以及
,
。样本量分别取为200、500、1000,重复模拟1000次,具体计算结果如下表3和表4所示。
从模拟和计算结果可以得出以下几个结论:
(1) 表1和表2结果表明混合偏正态分布的总体参数估计具有相合性,即随着样本量的增加,模型参数的估计值趋于真值。并且随着样本量的增加,估计的均方误差(RMSE)也越来越小。相对于参数
和
,参数
和
估计的RB和RMSE值偏大一些,尤其是当两总体的比例相差很大的时候。
(2) 表3和表4结果表明总体而言对于有限混合–尺度混合偏正态分布误差回归模型除个别参数外随着样本量的增加,参数估计量的RB和RMSE值呈现减少趋势。相对于其他参数,参数
和
估计的RB和RMSE值偏大一些。
Table 3. Parameter estimation based on the regression model with a mixture of skew-normal error distribution (π1 = 0.1, π2 = 0.9)
表3. 基于混合偏正态分布误差回归模型的参数估计(π1 = 0.1, π2 = 0.9)
参数 |
n |
RB |
RMSE |
参数 |
n |
RB |
MSE |
|
200 |
0.2717 |
0.0738 |
|
200 |
0.1739 |
0.0053 |
500 |
0.2346 |
0.0550 |
500 |
0.1178 |
0.0057 |
1000 |
0.2213 |
0.0049 |
1000 |
0.0986 |
0.0070 |
|
200 |
14.0620 |
197.74 |
|
200 |
8.8502 |
78.326 |
500 |
11.0126 |
121.28 |
500 |
8.3177 |
69.185 |
1000 |
8.8281 |
77.934 |
1000 |
8.2534 |
68.119 |
|
200 |
1.4985 |
0.9390 |
|
200 |
1.7260 |
2.4884 |
500 |
1.0663 |
0.8640 |
500 |
1.8357 |
3.2623 |
1000 |
0.8408 |
0.6630 |
1000 |
1.9113 |
3.6483 |
|
200 |
0.3009 |
0.0527 |
|
200 |
0.0334 |
0.0000 |
500 |
0.1501 |
0.0095 |
500 |
0.0167 |
0.0000 |
1000 |
0.0872 |
0.0029 |
1000 |
0.0097 |
0.0000 |
|
200 |
0.3268 |
0.0682 |
|
200 |
0.3289 |
0.0003 |
500 |
0.2805 |
0.0707 |
500 |
0.1865 |
0.0002 |
1000 |
0.2648 |
0.0684 |
1000 |
0.1223 |
0.0001 |
|
200 |
0.3353 |
0.0000 |
|
|
|
|
500 |
0.2129 |
0.0000 |
|
|
|
1000 |
0.1495 |
0.0000 |
|
|
|
Table 4. Parameter estimation based on the regression model with a mixture of skew-normal error distribution (π1 = 0.5, π2 = 0.5)
表4. 基于混合偏正态分布误差回归模型的参数估计(π1 = 0.5, π2 = 0.5)
参数 |
n |
RB |
RMSE |
参数 |
n |
RB |
MSE |
|
200 |
1.0323 |
1.0657 |
|
200 |
4.2473 |
1.7045 |
500 |
1.0629 |
1.1298 |
500 |
4.4090 |
2.5259 |
1000 |
1.0597 |
1.1230 |
1000 |
4.4517 |
2.4460 |
|
200 |
11.7818 |
138.81 |
|
200 |
5.0273 |
25.273 |
500 |
12.2169 |
149.25 |
500 |
4.6847 |
21.946 |
1000 |
12.5434 |
157.34 |
1000 |
4.8138 |
23.172 |
|
200 |
0.6480 |
0.1189 |
|
200 |
1.8300 |
3.0715 |
500 |
0.3505 |
0.0247 |
500 |
1.8646 |
3.3966 |
1000 |
0.2155 |
0.0023 |
1000 |
1.9213 |
3.6163 |
|
200 |
0.0572 |
0.0003 |
|
200 |
0.0572 |
0.0003 |
500 |
0.0375 |
0.0001 |
500 |
0.0375 |
0.0001 |
1000 |
0.0263 |
0.0000 |
1000 |
0.0263 |
0.0000 |
|
200 |
0.9729 |
0.9466 |
|
200 |
0.2141 |
0.0000 |
500 |
0.9720 |
0.9448 |
500 |
0.1399 |
0.0000 |
1000 |
0.9705 |
0.9419 |
1000 |
0.0962 |
0.0000 |
|
200 |
0.3454 |
0.0000 |
|
|
|
|
500 |
0.2625 |
0.0000 |
|
|
|
1000 |
0.2009 |
0.0000 |
|
|
|
4. 实证分析
4.1. 基于混合偏正态分布的考试成绩分析
运用某高校599名大学生《统计学》考试成绩进行实证分析。表5为考试成绩的描述性统计结果。图1为考试成绩的QQ图。
Table 5. Descriptive statistics of exam scores
表5. 考试成绩的描述性统计
均值 |
标准差 |
中位数 |
最小值 |
最大值 |
偏度系数 |
峰度系数 |
72.03 |
16.97 |
76 |
8 |
97 |
−1.73 |
2.86 |
对数据进行正态性检验,考虑Anderson-Darling、Cramer-vonMises、Lilliefors、pearson卡方以及Shapiro-Francia正态性检验方法,结果均显示p值小于0.005,拒绝原假设,表明所使用的成绩数据是非正态的。由表5、图1以及正态性检验的结果,可知学生考试成绩的分布具有明显的偏斜,不符合正态分布。以下我们采用有限混合–尺度混合偏正态分布(FMSN)进行拟合。为确定最优成分数,表6计算了不同信息准则下不同成分组数对应模型的信息准则值。
Figure 1. QQ plot for exam scores
图1. 考试成绩QQ图
Table 6. Values of different information criteria for cases with different number of components
表6. 不同信息准则不同成分组数下信息准则值
信息准则 |
m = 1 |
m = 2 |
m = 3 |
m = 4 |
AIC |
4524.877 |
4369.032 |
4362.306 |
4362.372 |
BIC |
4537.856 |
4399.315 |
4409.894 |
4427.264 |
EDC |
4533.063 |
4388.132 |
4392.321 |
4403.301 |
ICL |
4537.856 |
4399.892 |
4560.78 |
4573.571 |
由表6,结合图1,我们选用成分数为2的混合偏正态模型(4),并使用ECMC算法求解模型参数的极大似然估计,结果如表7所示。
(4)
Table 7. Parameter estimation for the mixture of skew-normal distribution
表7. 混合偏正态分布参数估计结果
|
|
|
|
|
|
|
|
0.1104 |
0.8896 |
43.3539 |
82.8538 |
269.3054 |
100.0410 |
−4.9657 |
−0.9954 |
估计的密度曲线如图2所示。作为对比,图2还给出了核密度估计曲线。结果表明构成混合偏正态的两个偏态分布均有偏,其中第一个成分的偏度(
)要小于第二成分的偏度(
)。两成分的混合偏正态分布密度与核密度估计结果比较接近。表8给出了基于估计分布的均值,以及20%,40%,60%,80%分位数,同时表中也给出了实际考试分数的平均分,以及20%,40%,60%,80%分位数。结果表明基于混合偏正态分布的估计结果与实际结果比较接近。
Figure 2. Fitting of exam scores to a mixture of skew-normal distribution
图2. 考试成绩混合偏正态分布拟合情况
Table 8. Mean and quantile values under different distributions
表8. 不同分布模型下均值以及分位数值
模型 |
均值 |
20%分位数 |
40%分位数 |
60%分位数 |
80%分位数 |
实际数据 |
72.034 |
66 |
73 |
78 |
84 |
FMSN |
72.034 |
66.404 |
73.608 |
78.441 |
83.481 |
FMN |
71.988 |
66.610 |
73.435 |
78.233 |
83.391 |
FMT |
71.852 |
66.444 |
73.374 |
78.160 |
83.371 |
FMST |
71.977 |
66.380 |
73.555 |
78.400 |
83.441 |
FMSSL |
72.009 |
66.483 |
73.622 |
78.423 |
83.482 |
NORM |
70.203 |
57.003 |
66.867 |
75.109 |
84.134 |
除两成分的混合偏正态分布外,我们考虑了两成分的其他混合分布,如混合正态分布(FMN)、混合t分布(FMT)、混合偏t分布(FMST),并与混合偏正态分布(FMSN)进行比较,各信息准则的值见表9。表8也给出了各估计分布下均值以及分位数的估计值。表8同时还给出了单个正态分布(NORM)模型下平均分以及各分位数的值。表9给出的结果表明FMSN和FMN模型要优于其他模型。表8的结果表明相对其他混合分布模型,单一成分的正态分布模型效果最差。整体FMSN模型要略好于FMN模型,尤其是尾部分位数。
Table 9. Values of information criteria under different distributions
表9. 不同分布模型下各信息准则的值
模型 |
AIC |
BIC |
EDC |
ICL |
FMSN |
4369.032 |
4399.315 |
4388.132 |
4399.892 |
FMN |
4375.345 |
4396.975 |
4388.988 |
4398.444 |
FMT |
4379.042 |
4404.999 |
4395.414 |
4406.633 |
FMST |
4372.516 |
4407.125 |
4394.345 |
4407.852 |
FMSSL |
4371.039 |
4405.648 |
4392.868 |
4406.226 |
4.2. 基于有限混合–尺度混合偏正态分布误差的线性回归模型
本节考虑影响学生成绩可能的因素。限于数据的可获取性,我们考虑两个影响因素:学生性别(sex)和上一学期《概率论》成绩(prob),建立如下有限混合偏正态分布误差的线性回归模型(SNLM):
除误差服从有限混合偏正态分布的线性回归模型(FSNLM)外,我们还考虑了误差服从有限混合偏t分布的线性回归模型(FSTLM)和有限混合偏slash分布的线性回归模型(FSSLLM)进行了对比分析。计算结果见表10。
Table 10. Estimation of linear regression model with finite mixture skew error distribution
表10. 基于有限混合偏态分布的线性回归模型的估计
|
FSNLM |
FSTLM |
FSSLLM |
LM |
估计值 |
标准误差 |
估计值 |
标准误差 |
估计值 |
标准误差 |
估计值 |
标准误差 |
|
24.534 |
0.009 |
24.388 |
0.828 |
22.124 |
0.836 |
21.580 |
6.995 |
|
3.240 |
0.001 |
3.428 |
0.048 |
3.246 |
0.045 |
6.583 |
1.431 |
|
0.499 |
0.029 |
0.504 |
0.015 |
0.520 |
0.037 |
0.510 |
0.080 |
|
−37.623 |
17.000 |
−40.57 |
9.059 |
−35.175 |
12.162 |
- |
- |
|
4.749 |
16.400 |
4.963 |
5.265 |
4.396 |
9.457 |
- |
- |
|
180.315 |
0.764 |
162.96 |
4.203 |
264.801 |
3.989 |
- |
- |
|
83.014 |
125.000 |
67.812 |
258.913 |
97.031 |
545.036 |
|
|
|
−0.685 |
2.290 |
−0.704 |
27.064 |
1.551 |
35.168 |
- |
- |
|
0.625 |
0.769 |
0.313 |
3.115 |
−1.175 |
3.400 |
- |
- |
|
0.112 |
0.088 |
0.109 |
1.128 |
0.111 |
0.593 |
- |
- |
|
0.888 |
0.088 |
0.801 |
1.128 |
0.889 |
0.593 |
- |
- |
续表
Loglik |
−2179.592 |
−2181.767 |
−2181.444 |
−2339.313 |
AIC |
4379.192 |
4383.533 |
4382.889 |
4686.627 |
BIC |
4422.453 |
4426.795 |
4426.15 |
4703.931 |
EDC |
4406.478 |
4410.819 |
4410.175 |
- |
ICL |
19048.17 |
17702.45 |
15698.22 |
- |
由表10可知,对于两个解释变量,学生性别(sex)、上一学期《概率论》成绩(prob)的p值均小于0.01。因此,两个因素影响都是显著的。
依据信息准则结果,由Loglik值、AIC、BIC、EDC准则值可知,有限混合偏正态分布的线性回归模型的拟合效果最好,在ICL准则下有限混合偏slash分布的线性回归模型的拟合效果较好。
为进行比较,我们还考虑了误差项服从正态分布,即
的线性回归模型
模型估计的结果见表10的最后两列。由Loglik值、AIC和BIC信息准则值可知,所建立的误差项为有限混合偏态分布的线性回归模型比普通的线性回归方程拟合效果好,其中有限混合偏正态分布的线性回归模型的拟合效果最好。
5. 结论
本文针对学生考试成绩有偏、多峰的特点,提出采用有限混合–尺度混合偏正态分布进行分析,利用ECMC算法求解模型参数的极大似然估计,数值模拟结果表明该方法是有效可行的。实证结果表明有限混合偏正态分布或有限混合正态分布在对考试成绩进行分析时较正态分布具有较好的拟合效果。同时在对影响考试成绩的因素进行研究时,基于有限混合–尺度混合偏正态误差的线性回归模型也较正态误差线性回归模型拟合效果要好。
基金项目
上海高校市级重点课程建设项目“贝叶斯统计”(2024);国家自然科学基金项目“多因子试验具有最小支撑点的最优回归设计”(11971318)。