1. 引言
斜交双因子模型(Oblique Two-Factor Model)是结构方程模型(Structural Equation Modeling, SEM)中的一种特殊类型,旨在分析多个潜在变量之间的关系,允许因子之间存在一定的相关性[1]。与传统的正交双因子模型假设因子间相互独立不同,斜交模型放宽了这一假设,允许因子之间具有相关性,通常通过估计因子间的协方差来反映这种相关性。但斜交双因子模型允许局部因子之间的相关性,这可能导致残差项之间的相关性,从而违背结构方程模型的基本假设。例如,当因子间的相关性过强时,可能导致模型的收敛性问题或参数估计的不准确性,这也是斜交双因子模型在实际应用中的常见挑战。这些特性使得斜交双因子模型在实际应用中常常面临收敛性差、参数估计不准确等问题,严重影响了其应用效果。为了克服这些挑战,研究斜交双因子模型的性质,并提出有效的解决策略显得尤为重要。本文旨在分析斜交双因子模型中的主要问题,并提出改进的计算方法,以提高模型的收敛性和参数估计的准确性,从而推动该模型在实际应用中的发展。
2. 相关理论概述
2.1. 斜交双因子模型
双因子模型包括正交双因子模型、斜交双因子模型、双因子(S∙I-1)模型,在很多领域都有应用,如管理心理学[2]、健康心理学[3]、教育心理学[4]等。斜交双因子模型(oblique factor model)是双因子模型的一种,常用来检验共同方法偏差[5],拟合维度间相关的多维构念(multidimensional construct)及计算同质性系数(homogeneity coefficient)、合成信度(composite reliability)等[6]-[10]。其中,斜交双因子模型是一种结构方程模型的扩展形式,用于分析多个潜在变量之间的关系,特别是当这些潜在因子之间可能存在相关性时,放宽了因子独立性的假设,允许潜在因子之间有一定的相关性。在正交模型中,假设因子之间完全独立,相关性为零;而在斜交模型中,允许因子之间存在相关性,这使得模型更适用于现实中的复杂数据情境,其中潜在因子之间可能存在相互作用或重叠。斜交双因子模型通常用于描述两个潜在因子之间的关系,其中这些因子不仅与一组观测变量相关,还可能彼此相关。这种模型可以揭示潜在因子之间的相关影响,适用于因子间关系复杂的场景。
斜交因子模型由多个部分组成,主要包括潜在因子、观测变量、因子载荷、因子间的相关性以及误差项。其中,潜在因子可分为全局因子和局部因子,全局因子通常代表广泛的特征或概念,而局部因子则反映特定领域的特征。观测变量是可以直接观测的变量,它们由潜在因子的线性组合表示。因子载荷表示观测变量与潜在因子之间的关系,假设有一组观测变量
与潜在因子G和
相关,则有:
其中,
和
分别是观测变量在全局因子G和局部因子
上的载荷,
是误差项。斜交双因子模型的关键特性之一是允许全局因子和局部因子之间存在相关性,它们的相关性通过协方差或者相关系数表示,这种相关性可能是模型的核心要素,公式为:
其中,
是全局因子和局部因子之间的相关系数,该相关性反映了潜在因子之间的相互作用或重叠。误差项表示观测变量中不被潜在因子解释的部分,通常假设为独立且正态分布。每个观测变量的误差项
假设是独立的,且在模型的估计过程中不会与其他误差项或潜在因子相关。斜交双因子模型如图1所示。
Figure 1. Schematic diagram of the oblique two-factor model
图1. 斜交双因子模型示意图
2.2. 极大似然函数
极大似然估计(MLE) [11]是一种通过最大化似然函数来推断模型参数的常用方法,旨在通过最大化似然函数来推断模型参数。在MLE框架上,参数的估计值是通过选择使得观测数据出现概率最大的参数值来确定的。在斜交因子分析模型中,MLE用于估计潜在因子的载荷和因子间的相关性。由于斜交因子分析模型允许因子之间存在相关性,因此MLE需要考虑因子间的协方差,进而优化模型的参数。
在斜交双因子模型下,可得因子之间的协方差矩阵为:
写出对数似然函数,表示为观测数据在给定模型参数下的联合概率:
进一步写出对数似然函数,其中,
为观测数据的均值向量:
2.3. 贝叶斯方法
贝叶斯方法基于贝叶斯定理,通过结合先验知识和观测数据,推断模型参数的后验分布。与极大似然估计仅依赖于数据不同,贝叶斯方法在推断过程中考虑了先验分布,即在观察数据之前对参数的已有知识或假设,这使得贝叶斯方法能够在数据稀缺时仍然提供有意义的推断结果。
贝叶斯统计认为概率是由主观知识和客观现象结合而决定的。人们基于工作和生活中的经验,形成对事件的先验信息,影响概率分布。贝叶斯统计认为未知参数是随机变量,参数是服从某种概率分布[12]。贝叶斯统计的优点主要在置信区间、假设检验、小样本方面[13]。贝叶斯定理表明,给定观测数据X和参数
的后验分布
可以表示为:
其中,
为参数
在给定数据X后的后验分布。
为似然函数,即在给定参数
下观察到数据X的概率。
为先验分布,表示在未观察数据之前对参数
的认识。
为边际似然,通常作为常数,确保后验分布的归一化。
在斜交因子分析模型中,贝叶斯方法能够有效地量化参数的不确定性,尤其是在数据量较小或存在较强先验知识时具有显著优势。贝叶斯方法不仅提供了点估计,还通过后验分布为参数提供了全概率描述。
贝叶斯推断的核心是计算后验分布,即在给定观测数据的条件下,对潜在因子载荷和因子相关性质。贝叶斯方法通过贝叶斯定理结合先验分布和似然函数推导后验分布。具体推导过程如下:1) 选择先验分布:选择适当的先验分布
,其中
是模型的参数。先验分布反映了在没有观测数据时对参数的先验知识。对于斜交因子分析模型,常使用共轭先验分布来简化计算。2) 计算似然函数:与MLE方法类似,贝叶斯推断中的似然函数依赖于观测数据X和参数
。由于斜交因子分析模型中假设因子存在相关性,似然函数不仅包含因子载荷,还考虑因子间的协方差。3) 计算后验分布:先验分布乘似然函数,得到后验分布
,通过后验分布,贝叶斯方法能够为每个参数提供概率分布,而不仅仅是一个点估计。4) 利用蒙特卡洛方法从后验分布中抽样,得到模型参数的后验分布。
对置信区间的解释,贝叶斯统计更合理、更易理解。在假设检验方面,贝叶斯统计可以处理多重检验的问题。在小样本方面,贝叶斯统计估计更准确。
2.4. 模型识别问题
模型识别问题是结构方程模型(SEM)中至关重要的一部分,直接关系到参数估计的唯一性和模型的可解性。如果模型不可识别,将导致参数估计出现多解或无法收敛,严重影响模型的解释力和应用价值。因此,在模型建立过程中,需要明确识别条件并设置适当的约束。
斜交双因子模型的识别条件包括潜在因子的量纲、观测变量与潜在因子的关系、因子间的相关性约束,以及模型的自由度要求。本节将具体说明识别条件、约束设置及自由度计算方法。潜在因子的量纲需通过固定某些参数来明确,以消除模型中潜在的尺度不确定性。常见的量纲约束方法包括:固定某一潜在因子的某个因子载荷为1,以定义该潜在因子的量纲;每个潜在因子至少需关联两个以上的观测变量,以提供足够的自由度支持参数估计。若关联观测变量数量不足,模型将出现不可识别的问题。若模型允许潜在因子之间存在相关性,则需对部分因子间协方差设置固定值(例如0或1),以避免因子间协方差参数的多解问题。假设观测变量的误差项相互独立,且与潜在因子无关。这一假设能够减少模型中的冗余参数,从而提高识别性。
针对本研究采用的斜交双因子模型,为确保模型识别性,设置了以下具体约束:本研究将全局因子的第一个观测变量的因子载荷固定为1,以定义全局因子的量纲。该约束明确了全局因子的单位,为其他参数的估计提供了参考。对于每个局部因子,本研究将其第一个观测变量的因子载荷固定为1,以定义局部因子的量纲。这种方式确保了局部因子的尺度具有唯一性。将局部因子间的协方差值固定为0.3,而全局因子与局部因子之间的协方差则由模型自由度估计。这种约束方式既保证了因子间的关系结构合理,又防止了多解问题。假设观测变量的误差项相互独立,且与潜在因子无相关性,从而简化模型的复杂性,并提高参数估计的稳定性。
通过上述识别条件与约束设置,本研究确保了斜交双因子模型的识别性,避免了参数估计的多解问题,并提高了模型结果的解释力。全局因子和局部因子的量纲通过固定因子载荷得到明确,局部因子间的协方差被合理约束,全局因子与局部因子的协方差通过自由度估计。此外,误差项的独立性假设简化了模型复杂度。自由度的计算进一步验证了模型的可识别性,为后续的参数估计和模型应用奠定了基础。
3. 斜交双因子模型估计方法的比较
本研究采用包含三个局部因子、每个局部因子各包含三个指标的斜交双因子模型。局部因子之间的相关系数设定为
(斜交情形)。具体模型参数的设置如下:1) 全局因子负荷:全局因子的负荷分别设置为0.3、0.4、0.5、0.6和0.7。2) 局部因子负荷:每个局部因子的负荷设置如下:第一个局部因子:0.3、0.4、0.5;第二个局部因子:0.4、0.5、0.6;第三个局部因子:0.5、0.6、0.7;第四个局部因子:0.6、0.7、0.8。设定局部因子间的相关系数为0.3。
为了比较不同估计方法(包括极大似然法和贝叶斯法)的性能,本研究设计了多个实验,分别评估无先验信息和有先验信息的贝叶斯估计。对于贝叶斯估计,实验设置了不同类型的先验分布,以考察其对斜交双因子模型估计结果的影响。本研究采用以下三种估计方法:1) 极大似然法(ML法):对样本容量N = 200和N = 500的数据进行参数估计;2) 无先验信息的贝叶斯估计(Noninformative prior):未设置明确的先验分布;3) 有先验信息的贝叶斯估计(Informative prior):设置相关系数
的先验分布为
,分别设置样本容量为N = 200和N = 500。在每种样本容量下,使用Mplus 7.4软件生成1000个独立的数据集。
为实现贝叶斯方法中的参数估计,本研究采用了马尔科夫链蒙特卡洛(MCMC)方法,并选择Gibbs采样作为具体的采样算法。MCMC采样的具体参数设置如下:为确保采样充分,设置最大迭代次数为50,000次。其中,前5,000次被设为燃烧期(Burn-in phase),用于消除初始值对采样结果的影响。为减少样本自相关性,每隔5次采样取1个值(Thinning),以提升后验样本的独立性。运行两条独立的MCMC链,用于诊断采样是否收敛。本研究分别设置了以下三种类型的先验分布,以评估先验信息对参数估计的影响:
第一种先验分布:正态分布,均值为0.3,方差为0.2;
第二种先验分布:正态分布,均值为真值(0.3)的10%偏差,即0.33,方差为0.2;
第三种先验分布:正态分布,均值为0.33,方差为0.01。
上述参数设置的目的是在确保算法收敛性的同时,提高采样效率和估计精度。
本实验的目的是通过设置不同的先验分布,比较贝叶斯法在有无先验信息情境下对斜交双因子模型参数的估计效果。同时,将贝叶斯法与极大似然法进行对比,分析两种方法在不同样本容量下的收敛性和参数估计精度。
收敛率是指在进行模型估计时,随着样本量的增大,估计值趋近于真实值的比例。具体而言,收敛率反映了估计方法在重复实验中能够成功估计真实参数的频率。高收敛率表明估计方法具有较强的稳定性和准确性,尤其在数据量不足或存在噪声时,能够提供可靠的结果。在结构方程模型(SEM)或潜在变量模型中,收敛性是模型估计的核心指标之一。收敛率较低意味着估计过程可能未能找到合适的参数值,进而导致模型拟合度差、参数估计不准确,影响研究结论的可靠性。因此,确保估计方法具有较高的收敛率对于提高模型的有效性至关重要。
3.1. 不同估计方法下斜交双因子模型的收敛率
在本研究中,收敛率是通过对每种估计方法进行1000次独立模拟来计算的。在每次模拟中,若估计过程成功收敛,即模型参数的估计值与真实值之间的误差在预设的容忍范围内,则视为收敛。最终的收敛率是指成功收敛的模拟次数占总模拟次数的比例,结果见表1。
Table 1. Convergence rates of the oblique two-factor model under different estimation methods
表1. 不同估计方法下斜交双因子模型的收敛率
负荷 |
ML法 |
贝叶斯法 |
无先验信息 |
有先验信息 |
b |
a |
N = 200 |
N = 500 |
N = 200 |
N = 500 |
N = 200 |
N = 500 |
(0.3, 0.4, 0.5) |
0.3 |
46.1 |
55.6 |
100 |
100 |
100 |
100 |
0.4 |
45.3 |
54.0 |
100 |
100 |
100 |
100 |
0.5 |
45.9 |
52.3 |
100 |
99.8 |
100 |
100 |
0.6 |
46.8 |
54.4 |
100 |
99.1 |
100 |
100 |
0.7 |
49.1 |
61.9 |
100 |
99.0 |
100 |
100 |
(0.4, 0.5, 0.6) |
0.3 |
52.0 |
57.6 |
100 |
99.9 |
100 |
100 |
0.4 |
48.6 |
53.0 |
100 |
99.9 |
100 |
100 |
0.5 |
51.0 |
56.6 |
100 |
99.8 |
100 |
100 |
0.6 |
50.7 |
60.6 |
100 |
98.4 |
99.9 |
100 |
0.7 |
55.0 |
71.6 |
99.4 |
98.2 |
99.9 |
100 |
(0.5, 0.6, 0.7) |
0.3 |
54.8 |
58.7 |
100 |
99.9 |
100 |
100 |
0.4 |
54.6 |
59.1 |
100 |
99.4 |
100 |
100 |
0.5 |
55.0 |
59.1 |
98.9 |
98.9 |
100 |
100 |
0.6 |
57.8 |
65.3 |
99.1 |
96.1 |
100 |
100 |
0.7 |
70.4 |
89.4 |
78.6 |
86.0 |
99.1 |
99.1 |
(0.6, 0.7, 0.8) |
0.3 |
58.3 |
61.6 |
99.9 |
99.7 |
100 |
100 |
0.4 |
56.8 |
59.8 |
99.9 |
98.4 |
100 |
100 |
0.5 |
59.8 |
63.3 |
97.1 |
92.8 |
100 |
100 |
0.6 |
68.5 |
83.8 |
55.1 |
59.4 |
94.6 |
100 |
如表1所示,使用最大似然法(ML)时,在较小样本量(N = 200)下,收敛率显著低于贝叶斯法。例如,因子负荷为(0.3, 0.4, 0.5)时,ML法的收敛率为46.1%,而贝叶斯法(无先验信息)为100%。随着样本量增大(N = 500),两者的收敛率逐渐接近,贝叶斯法的收敛率在N = 500时稳定为100%。尤其是在使用有先验信息的贝叶斯法时,无论样本量为200还是500,收敛率均为100%,表明先验信息显著提高了模型的收敛性。收敛率的提高显著提升了模型参数估计的准确性。在本研究中,贝叶斯法(特别是带有先验信息时)的高收敛率保证了在各种样本量和负荷条件下,参数估计的稳定性和准确性。相比之下,最大似然法在较小样本量时收敛性较差,可能导致参数估计的偏差,这也强调了使用贝叶斯法的优势,尤其是在处理复杂模型时。
3.2. 不同估计方法下斜交双因子模型的相对偏差
Table 2. Relative bias of the oblique two-factor model under different estimation methods (N = 500)
表2. 不同估计方法下斜交双因子模型的相对偏差(N = 500)
负荷 |
ML法 |
贝叶斯法 |
无先验信息 |
有先验信息 |
b |
a |
b |
a |
ρ |
b |
a |
ρ |
b |
a |
ρ |
(0.3, 0.4, 0.5) |
0.3 |
7.95 |
−19.83 |
2.07 |
3.03 |
−10.90 |
26.87 |
1.95 |
−6.27 |
6.77 |
0.4 |
10.45 |
−16.10 |
−11.23 |
7.95 |
−11.10 |
34.30 |
1.97 |
−2.48 |
6.03 |
0.5 |
11.25 |
−16.26 |
−6.93 |
11.10 |
−8.52 |
33.27 |
2.62 |
−1.32 |
6.43 |
0.6 |
11.98 |
−10.98 |
−21.20 |
12.05 |
−6.68 |
30.60 |
3.95 |
−0.87 |
6.43 |
0.7 |
8.20 |
−6.69 |
−19.80 |
13.53 |
−5.24 |
23.00 |
5.00 |
−0.54 |
6.43 |
(0.4, 0.5, 0.6) |
0.3 |
3.50 |
−23.33 |
0.57 |
3.68 |
−18.70 |
26.73 |
2.88 |
−11.37 |
9.60 |
0.4 |
10.30 |
−30.65 |
−7.30 |
9.28 |
−21.30 |
40.47 |
2.40 |
−4.50 |
8.90 |
0.5 |
6.30 |
−15.16 |
−14.83 |
13.02 |
−18.22 |
47.43 |
2.72 |
−2.36 |
8.20 |
0.6 |
2.48 |
−8.85 |
−33.53 |
14.28 |
−13.67 |
42.40 |
3.84 |
−1.78 |
7.93 |
0.7 |
1.12 |
−4.67 |
−35.77 |
12.58 |
−8.54 |
29.07 |
3.76 |
−0.97 |
6.53 |
(0.5, 0.6, 0.7) |
0.3 |
1.97 |
−25.93 |
−8.00 |
3.40 |
−25.13 |
23.90 |
3.20 |
−18.60 |
11.87 |
0.4 |
1.58 |
−19.85 |
−12.07 |
8.45 |
−28.85 |
40.20 |
2.67 |
−7.55 |
11.03 |
0.5 |
−0.35 |
−15.62 |
−27.70 |
11.45 |
−24.08 |
46.67 |
2.38 |
−3.36 |
9.30 |
0.6 |
−2.48 |
−7.38 |
−39.40 |
12.95 |
−18.12 |
44.97 |
2.25 |
−1.78 |
8.10 |
0.7 |
−3.35 |
−0.34 |
−27.20 |
8.83 |
−8.07 |
22.87 |
2.23 |
−1.13 |
5.13 |
(0.6, 0.7, 0.8) |
0.3 |
−1.49 |
−25.20 |
−4.93 |
2.83 |
−30.27 |
21.33 |
2.76 |
−24.27 |
12.43 |
0.4 |
−5.33 |
−22.05 |
−11.97 |
6.26 |
−31.83 |
34.80 |
2.63 |
−11.13 |
12.87 |
0.5 |
−3.83 |
−13.12 |
−18.77 |
9.21 |
−26.98 |
40.77 |
1.01 |
−3.02 |
9.87 |
0.6 |
−4.46 |
−1.05 |
−25.30 |
15.27 |
−29.72 |
50.40 |
4.01 |
−5.08 |
7.33 |
接下来比较最大似然法(ML法)和贝叶斯法(无先验信息和有先验信息)在斜交双因子模型中的参数估计精度,特别关注它们在不同负荷条件下的相对偏差。表2、表3展示了在不同估计方法下,斜交双因子模型的参数估计相对偏差。相对偏差反映了估计值与真实值之间的差距,负值表示估计值低于真实值,正值表示估计值高于真实值。我们通过对比不同方法、不同样本容量下的相对偏差,评估了各估计方法的准确性和稳定性。结果如表2、表3所示。
Table 3. Relative bias of the oblique two-factor model under different estimation methods (N = 200)
表3. 不同估计方法下斜交双因子模型的相对偏差(N = 200)
负荷 |
ML法 |
贝叶斯法 |
无先验信息 |
有先验信息 |
b |
a |
b |
a |
ρ |
b |
a |
ρ |
b |
a |
ρ |
(0.3, 0.4, 0.5) |
0.3 |
−19.07 |
−30.27 |
−11.30 |
−5.53 |
0.77 |
−0.83 |
1.22 |
−5.77 |
4.10 |
0.4 |
5.89 |
−30.00 |
14.87 |
−0.98 |
−2.43 |
8.43 |
0.80 |
−0.75 |
4.53 |
0.5 |
31.64 |
−28.60 |
19.20 |
2.05 |
−2.20 |
9.27 |
0.10 |
1.18 |
4.60 |
0.6 |
41.82 |
−22.97 |
7.77 |
5.70 |
−1.98 |
9.53 |
1.40 |
1.57 |
4.63 |
0.7 |
62.85 |
−18.04 |
0.43 |
8.95 |
−2.10 |
10.50 |
2.18 |
1.79 |
5.07 |
(0.4, 0.5, 0.6) |
0.3 |
−32.47 |
−26.40 |
−13.63 |
−2.80 |
−0.67 |
3.50 |
1.94 |
−8.77 |
5.80 |
0.4 |
−41.45 |
−40.68 |
21.57 |
1.48 |
−5.85 |
14.83 |
2.24 |
−3.50 |
7.00 |
0.5 |
9.26 |
−24.52 |
15.57 |
6.36 |
−7.76 |
23.73 |
1.62 |
−0.16 |
6.63 |
0.6 |
26.75 |
−20.77 |
−1.27 |
10.08 |
−7.70 |
32.10 |
1.40 |
1.15 |
6.43 |
0.7 |
47.13 |
−13.56 |
−3.63 |
13.18 |
−7.67 |
35.67 |
2.26 |
1.51 |
6.50 |
(0.5, 0.6, 0.7) |
0.3 |
−46.73 |
−26.63 |
1.73 |
−2.13 |
−0.37 |
6.53 |
2.00 |
−12.77 |
7.07 |
0.4 |
−29.12 |
−23.23 |
6.17 |
2.83 |
−10.58 |
20.63 |
3.08 |
−7.50 |
8.80 |
0.5 |
−10.65 |
−22.80 |
−4.37 |
11.30 |
2.64 |
43.50 |
2.18 |
19.90 |
7.87 |
0.6 |
12.42 |
−18.02 |
−7.03 |
11.50 |
−14.73 |
43.07 |
2.25 |
−1.78 |
8.10 |
0.7 |
48.49 |
−7.40 |
−16.40 |
9.78 |
−9.87 |
48.17 |
4.13 |
−0.47 |
9.10 |
(0.6, 0.7, 0.8) |
0.3 |
−54.08 |
−20.93 |
−0.53 |
−1.24 |
−2.90 |
9.67 |
1.89 |
−16.17 |
7.90 |
0.4 |
−43.33 |
−25.20 |
2.40 |
2.66 |
−14.45 |
24.23 |
3.21 |
−12.60 |
10.67 |
0.5 |
−26.47 |
−23.62 |
−5.37 |
6.46 |
−18.28 |
39.23 |
2.86 |
−5.28 |
10.17 |
0.6 |
17.16 |
−9.72 |
−15.53 |
9.66 |
−20.18 |
46.17 |
3.89 |
−3.90 |
11.87 |
表2和表3展示了在不同估计方法下,斜交双因子模型参数估计的相对偏差。对于最大似然法和贝叶斯法(无先验信息和有先验信息),在不同负荷条件下,参数b、a和ρ的相对偏差表现各异。总体来看,贝叶斯法(无先验信息)在较大负荷(例如b = 0.7)下表现出了较低的偏差,尤其在样本量较大时(N = 500),相对偏差更小。相比之下,最大似然法的相对偏差较大,尤其是在N = 200时,偏差波动较为明显。
贝叶斯法(有先验信息)表现出较低的相对偏差,尤其在ρ参数估计时,偏差较为稳定。在负荷为(0.3, 0.4, 0.5)时,贝叶斯法(有先验信息)相对偏差更接近于真实值,且随着样本量的增加,偏差值进一步减小。具体来说,ρ参数在贝叶斯法(有先验信息)的估计中,偏差低至18.42%,而最大似然法的相对偏差为44.74%。
3.3. ML、无先验信息的贝叶斯法和有先验信息的贝叶斯参数估计值的相对偏差
接下来展示最大似然法(ML法)和贝叶斯法(无先验信息和有先验信息)对斜交双因子模型进行参数估计时,不同参数的相对偏差。具体来说,表格中的参数包括因子负荷和因子间的相关性。通过比较这些方法在不同条件下的估计偏差,旨在分析贝叶斯法在引入先验信息时对参数估计准确性的提升,见表4。
Table 4. Relative bias of parameter estimates using ML, noninformative bayesian, and informative bayesian methods
表4. ML、无先验信息的贝叶斯法和有先验信息的贝叶斯参数估计值的相对偏差
参数 |
ML法 |
贝叶斯法 |
无先验信息 |
有先验信息 |
b |
44.74 |
65.79 |
100 |
a |
21.05 |
50.00 |
78.95 |
ρ |
44.74 |
18.42 |
81.58 |
从表4的结果可以看出,贝叶斯法(无论有无先验信息)在估计准确性上均优于最大似然法(ML法)。尤其是当贝叶斯法引入先验信息时,所有参数的相对偏差大幅减少,收敛性和估计精度得到显著提升。这表明,在斜交双因子模型的参数估计中,采用贝叶斯法(特别是有先验信息时)能够有效提高估计的稳定性和准确性。因此,建议在实际应用中,尤其是在模型复杂或样本量较小的情况下,优先选择贝叶斯法作为参数估计的首选方法。
3.4. 不同先验分布时斜交双因子模型的收敛率
接下来展示不同先验分布条件下斜交双因子模型的收敛率,研究了先验分布的设置(均值和方差)对模型收敛性的影响,见表5。
Table 5. Convergence rates of oblique two-factor models under different prior distributions
表5. 不同先验分布下斜交双因子模型的收敛率
负荷 |
N (0.3, 0.2) |
N (0.33, 0.2) |
N (0.33, 0.01) |
b |
a |
N = 200 |
N = 500 |
N = 200 |
N = 500 |
N = 200 |
N = 500 |
(0.3, 0.4, 0.5) |
0.3 |
100 |
99.6 |
100 |
100 |
100 |
100 |
0.4 |
100 |
99.6 |
99.9 |
99.5 |
100 |
100 |
0.5 |
99.9 |
99.2 |
100 |
99.3 |
100 |
100 |
0.6 |
100 |
99.0 |
99.9 |
98.6 |
100 |
100 |
0.7 |
100 |
99.3 |
100 |
98.9 |
100 |
100 |
(0.4, 0.5, 0.6) |
0.3 |
100 |
99.8 |
100 |
99.8 |
100 |
100 |
0.4 |
100 |
99.5 |
100 |
99.6 |
100 |
100 |
0.5 |
100 |
98.3 |
99.9 |
98.8 |
100 |
100 |
0.6 |
100 |
98.6 |
99.9 |
97.8 |
100 |
100 |
0.7 |
100 |
98.7 |
99.8 |
98.7 |
100 |
100 |
(0.5, 0.6, 0.7) |
0.3 |
100 |
100 |
100 |
99.9 |
100 |
100 |
0.4 |
100 |
99.1 |
100 |
99.5 |
100 |
100 |
0.5 |
100 |
98.1 |
99.7 |
98.3 |
100 |
100 |
0.6 |
96.8 |
96.8 |
96.3 |
96.3 |
99.9 |
99.9 |
0.7 |
96.8 |
97.2 |
98.1 |
97.5 |
99.6 |
99.6 |
(0.6, 0.7, 0.8) |
0.3 |
100 |
99.2 |
100 |
99.5 |
100 |
100 |
0.4 |
100 |
97.9 |
100 |
97.7 |
100 |
99.9 |
0.5 |
99.9 |
93.6 |
99.9 |
95.3 |
100 |
99.8 |
0.6 |
91.1 |
76.2 |
91.9 |
74.0 |
97.4 |
87.3 |
当先验分布的均值更接近真实值(如从N (0.3, 0.2)调整为N (0.33, 0.2))或先验方差更小(如从N (0.33, 0.2)调整为N (0.33, 0.01))时,模型的收敛率显著提高。这表明更加精确的先验信息有助于提升模型的稳定性,尤其在样本量较小时效果更加显著。随着样本量的增加(从N = 200到N = 500),所有先验分布下的模型收敛率均有所提升,但即使在较小样本量条件下,引入精确先验分布也能有效提高收敛性。在低负荷条件下,模型的收敛率几乎不受样本量或先验分布的影响。然而,在高负荷条件下,先验分布的准确性对收敛率的提升具有更为显著的作用。
因此,研究表明,在斜交双因子模型的参数估计中,引入更精确的先验分布(如N (0.33, 0.01))能够有效提升收敛性,尤其在样本量较小或因子负荷较高的情况下。这为实际应用中选择适当的先验分布提供了重要参考依据。从表5的结果可以看出,最大似然法(ML法)和贝叶斯法(无先验信息和有先验信息)在不同样本量下的收敛率表现存在显著差异。对于较小样本量(N = 200),贝叶斯法的收敛率明显优于最大似然法。例如,在负荷为(0.3, 0.4, 0.5)时,最大似然法的收敛率为46.1% (N = 200),而贝叶斯法(无先验信息)则表现为100%。随着样本量的增大(N = 500),两者的收敛率逐渐接近,但贝叶斯法在N = 500时的收敛率始终保持100%。尤其在采用先验信息的贝叶斯方法中,无论样本量为200还是500,收敛率均为100%,进一步凸显了贝叶斯法在提高模型收敛性方面的优势。
3.5. 收敛率与检验力作为后验分布质量的间接评估方法
Table 6. Statistical test power of oblique two-factor model under different estimation methods (N = 500)
表6. 不同估计方法下斜交双因子模型的统计检验力(N = 500)
负荷 |
N (0.3, 0.2) |
N (0.33, 0.2) |
N (0.33, 0.01) |
b |
a |
b |
a |
ρ |
b |
a |
ρ |
b |
a |
ρ |
(0.3, 0.4, 0.5) |
0.3 |
0.729 |
0.440 |
0.324 |
0.731 |
0.405 |
0.366 |
0.818 |
0.634 |
1.000 |
0.4 |
0.713 |
0.820 |
0.294 |
0.732 |
0.795 |
0.308 |
0.788 |
0.979 |
1.000 |
0.5 |
0.747 |
0.969 |
0.256 |
0.754 |
0.965 |
0.315 |
0.796 |
1.000 |
1.000 |
0.6 |
0.797 |
0.993 |
0.284 |
0.806 |
0.992 |
0.332 |
0.861 |
1.000 |
1.000 |
0.7 |
0.883 |
0.999 |
0.339 |
0.869 |
0.999 |
0.377 |
0.926 |
1.000 |
1.000 |
(0.4, 0.5, 0.6) |
0.3 |
0.893 |
0.257 |
0.511 |
0.891 |
0.245 |
0.532 |
0.950 |
0.442 |
1.000 |
0.4 |
0.878 |
0.623 |
0.457 |
0.886 |
0.566 |
0.482 |
0.927 |
0.918 |
1.000 |
0.5 |
0.889 |
0.887 |
0.420 |
0.903 |
0.870 |
0.446 |
0.922 |
0.999 |
1.000 |
0.6 |
0.911 |
0.979 |
0.398 |
0.918 |
0.984 |
0.472 |
0.940 |
1.000 |
1.000 |
0.7 |
0.946 |
0.997 |
0.445 |
0.948 |
0.998 |
0.473 |
0.986 |
1.000 |
1.000 |
(0.5, 0.6, 0.7) |
0.3 |
0.960 |
0.168 |
0.628 |
0.963 |
0.162 |
0.657 |
0.984 |
0.273 |
1.000 |
0.4 |
0.943 |
0.438 |
0.616 |
0.959 |
0.420 |
0.664 |
0.981 |
0.803 |
1.000 |
0.5 |
0.961 |
0.751 |
0.591 |
0.958 |
0.726 |
0.607 |
0.966 |
0.994 |
1.000 |
0.6 |
0.960 |
0.959 |
0.559 |
0.964 |
0.946 |
0.606 |
0.979 |
1.000 |
1.000 |
0.7 |
0.986 |
0.998 |
0.627 |
0.987 |
0.997 |
0.665 |
0.993 |
1.000 |
1.000 |
(0.6, 0.7, 0.8) |
0.3 |
0.991 |
0.136 |
0.773 |
0.985 |
0.135 |
0.787 |
0.996 |
0.186 |
1.000 |
0.4 |
0.985 |
0.337 |
0.756 |
0.987 |
0.321 |
0.785 |
0.995 |
0.633 |
1.000 |
0.5 |
0.974 |
0.698 |
0.730 |
0.982 |
0.690 |
0.753 |
0.996 |
0.975 |
1.000 |
0.6 |
0.962 |
0.959 |
0.732 |
0.968 |
0.962 |
0.739 |
0.994 |
0.998 |
1.000 |
Table 7. Statistical test power of oblique two-factor model under different estimation methods (N = 200)
表7. 不同估计方法下斜交双因子模型的统计检验力(N = 200)
负荷 |
N (0.3, 0.2) |
N (0.33, 0.2) |
N (0.33, 0.01) |
b |
a |
b |
a |
ρ |
b |
a |
ρ |
b |
a |
ρ |
(0.3, 0.4, 0.5) |
0.3 |
0.556 |
0.223 |
0.133 |
0.563 |
0.223 |
0.163 |
0.656 |
0.326 |
1.000 |
0.4 |
0.579 |
0.565 |
0.138 |
0.578 |
0.576 |
0.167 |
0.610 |
0.813 |
1.000 |
0.5 |
0.599 |
0.881 |
0.117 |
0.622 |
0.853 |
0.146 |
0.637 |
0.991 |
1.000 |
0.6 |
0.690 |
0.971 |
0.144 |
0.698 |
0.958 |
0.171 |
0.711 |
1.000 |
1.000 |
0.7 |
0.786 |
0.991 |
0.157 |
0.791 |
0.982 |
0.202 |
0.808 |
1.000 |
1.000 |
(0.4, 0.5, 0.6) |
0.3 |
0.822 |
0.166 |
0.247 |
0.832 |
0.148 |
0.274 |
0.889 |
0.239 |
1.000 |
0.4 |
0.833 |
0.409 |
0.243 |
0.834 |
0.359 |
0.297 |
0.859 |
0.702 |
1.000 |
0.5 |
0.834 |
0.700 |
0.258 |
0.847 |
0.660 |
0.292 |
0.860 |
0.974 |
1.000 |
0.6 |
0.877 |
0.889 |
0.255 |
0.868 |
0.864 |
0.291 |
0.884 |
1.000 |
1.000 |
0.7 |
0.904 |
0.950 |
0.256 |
0.901 |
0.953 |
0.307 |
0.927 |
1.000 |
1.000 |
(0.5, 0.6, 0.7) |
0.3 |
0.943 |
0.127 |
0.368 |
0.954 |
0.122 |
0.423 |
0.971 |
0.171 |
1.000 |
0.4 |
0.939 |
0.285 |
0.377 |
0.934 |
0.263 |
0.426 |
0.963 |
0.550 |
1.000 |
0.5 |
0.922 |
0.785 |
0.377 |
0.942 |
0.765 |
0.397 |
0.964 |
0.997 |
1.000 |
0.6 |
0.960 |
0.959 |
0.559 |
0.964 |
0.946 |
0.606 |
0.979 |
1.000 |
1.000 |
0.7 |
0.932 |
0.945 |
0.369 |
0.948 |
0.932 |
0.414 |
0.957 |
1.000 |
1.000 |
(0.6, 0.7, 0.8) |
0.3 |
0.975 |
0.094 |
0.513 |
0.980 |
0.083 |
0.550 |
0.994 |
0.110 |
1.000 |
0.4 |
0.978 |
0.221 |
0.538 |
0.978 |
0.174 |
0.586 |
0.991 |
0.386 |
1.000 |
0.5 |
0.970 |
0.429 |
0.520 |
0.964 |
0.400 |
0.556 |
0.989 |
0.802 |
1.000 |
0.6 |
0.947 |
0.690 |
0.572 |
0.961 |
0.675 |
0.622 |
0.961 |
0.974 |
1.000 |
在本研究中,模型估计使用贝叶斯方法,后验分布的收敛性能通过收敛率与检验力进行间接评估。收敛率定义为成功收敛的模拟次数占总模拟次数的比例,高收敛率表明MCMC链条能够稳定达到后验分布。检验力通过统计显著性捕获真值的能力,间接反映后验分布参数估计的准确性和置信水平,见表6、表7。
收敛率与检验力结果如表5~7所示。在贝叶斯估计中,采用不同先验分布的斜交双因子模型表现出极高的收敛率(均值>98%),尤其在有精确先验信息(N (0.33, 0.01))条件下,所有条件下的收敛率均达到100%。这种表现间接说明了MCMC链条的稳定性以及后验分布生成的可靠性。此外,检验力结果表明,局部因子负荷和因子相关系数的估计更为准确,支持了后验分布的稳定性。
4. 结论与展望
4.1. 结论
总体而言,贝叶斯法,尤其是在有先验信息的情况下,相较于最大似然法,在收敛率和相对偏差方面表现出了较为稳定和精确的估计。随着样本量的增大,贝叶斯法的收敛率趋于100%,而最大似然法则需要较大的样本量才能达到类似的性能。此外,先验信息的引入显著提高了模型的收敛率,并减少了参数估计的相对偏差,特别是在样本量较小的情况下。这些结果为斜交双因子模型的参数估计提供了有力的依据,尤其在实际应用中,贝叶斯法的优越性值得进一步的关注和应用。
有先验信息的贝叶斯法估计斜交双因子模型,模型收敛率和参数估计的准确性较高。但是在使用贝叶斯方法时,先验分布的确定尤为关键。为保证合理设置先验分布,研究探究有先验信息的贝叶斯法的容错性,发现当先验分布弱错误或弱精确时,贝叶斯法也能较好估计斜交双因子模型。根据以上研究,推荐研究者使用有先验信息的贝叶斯法估计斜交双因子模型,可将变量间的皮尔逊相关系数作为先验分布的均值。
4.2. 展望
在本文中仍有一部分内容需要进一步探究,首先,本文模拟研究只考虑了最常见的ML估计法,其他基于经典统计理论的估计法估计斜交双因子模型的表现如何,是否可以准确计算参数,有待进一步研究。其次,结构系数是研究潜变量之间关系的重要参数,可以继续探究双因子模型结构系数估计的准确性以及结构模型是否同测量模型一样存在收敛率和估计问题。最后,可以将斜交双因子模型的研究拓展到多水平模型和追踪研究,探究多水平双因子模型和纵向双因子模型的表现。如果解决这些有待研究的问题,将会促进斜交双因子模型的进一步应用。