1. 前言
自2016年起,我国硕士研究生报考人数在高位上保持高增长趋势,2015~2022年,7年平均增长率为15.8% (中国教育在线,2022)。考研竞争激烈,考研学生存在心理健康方面的不良症状(程春燕,张琴,李正赤,2013;周婷,2007)。但越来越多的人选择考研,也说明这是一项值得青年人为之奋斗的事情。换言之,考研是一件有意义的事情。怎么才算有意义的事情?最近研究者认为,有意义的事情有三个关键特征:重要性,目的性和连贯性(Heintzelman & King, 2018; King, Heintzelman, & Ward, 2016; Ward & King, 2017),而考研符合这几个特征。从这个角度讲,考研过程中也不全是消极体验,也可能伴随着积极体验——人生意义感。
人生意义感是积极心理学的重要主题之一。较高水平的人生意义感往往伴随着幸福、健康以及适应功能的提升(King et al., 2016; Heintzelman & King, 2014)。Seligman (2012)曾认为人生意义感是一种少数幸运者才有机会领悟的非凡体验。但最近的观点是,当生活有超越琐碎或瞬间的重要性,有目的,或有超越混乱的一致性时,普通人也能感到人生有意义(King et al., 2016; King et al., 2006)。重要性、目的性和连贯性是人生意义感的关键特征,有人把这称为三成分模型(tripartite models) (Costin & Vignoles, 2020; Martela & Steger, 2016)。具备这三个成分的活动或环境刺激都能促进个体的人生意义感(Heintzelman & King, 2018; Ward & King, 2017)。
考研活动具备这三个成分。对大学生而言,考研可以提升就业竞争力、获得社会认同感,也是投身科研事业的主流路径(赵雪娇,2023),其重要性不言而喻。另有研究发现,考研大学生的学习动机更强(耿译航,王双玲,李昱莹,谢琼,张旻,孙炜,2022),且大多有额外的时间安排和学习计划(罗腾,马蓉,杨亚薇,2020)。这在一定程度上体现了目的性和连贯性。因此,我们认为,相比于不考研大学生,考研大学生可能体验到更多的意义感。验证这一假设需要两个条件:一个评估人生意义感的工具和一套令人信服的组间比较程序(考研组vs不考研组)。人生意义问卷(Meaning in Life Questionnaire, MLQ) (Steger et al., 2006)是最常用,经过充分地检验的评估工具。而独立样本T检验则是最常用的组间比较方法,但这种做法默认MLQ在两组大学生之间具有一定程度的测量等值性(Measurement Invariance, MI) (Meredith, 1993; Cheung & Rensvold, 2002)。这种默认的MI实际上可能并不成立,而如果MI不成立,不同群组在量表上的平均分差异就不能直接解释为其相应特质的差异(Cheung & Rensvold, 2002)。因此,在T检验之前要先进行MI的检验,确保它是成立的。
验证性因子分析(CFA)和探索性结构方程模型(ESEM)都可用于进行MI的检验。但CFA不允许交叉负荷,这种严格限定有时会导致模型不能很好地拟合数据。而ESEM既可以如探索性因子分析(EFA)那样允许交叉负荷,又兼备CFA的功能,往往能得到优于CFA的拟合度数据(Asparouhov & Muthen, 2009; Marsh et al., 2014)。因而Marsh等人(2014)认为ESEM是一种将EFA和CFA的优点集于一身的检验程序,并提出了使用ESEM检验MI的13个模型(见表3)。我们将用这套程序来进行MI的检验。
综上所述,当前研究旨在检验MLQ在考研大学生和不考研大学生之间的MI,并在此基础上比较两组大学生在人生意义感上的差异。研究分成三个步骤:
第一,检验MLQ的双因子结构;
第二,检验MLQ在两组大学生之间的MI;
第三,如果MLQ的MI假设成立,则检验两组大学生(考研组vs不考研组)在MLQ上的得分差异。
2. 方法
2.1. 被试
采用方便抽样法招募1374名来自武汉和广西几所高校的大学生,排除答题不全的问卷后,剩下1338份有效问卷。这批被试的年龄从18岁到25岁不等(M = 20.1, SD = 1.35),男生491人(36.7%),女生847人(63.3%);大一新生70人(5.2%),大二学生760人(56.8%),大三学生145人(10.8%),大四学生363人(27.1%)。其中,547人(40.9%)称自己要考研,而791人(59.1%)称自己不考研。
2.2. 测量工具
人生意义问卷有两个分量表:人生意义体验量表(Presence of Meaning, POM)和人生意义追寻量表(Search for Meaning, SFM) (Steger et al., 2006)。POM评估一个人在多大程度上感觉到自己的人生有意义(例题,我很了解自己的人生意义),而SFM则评估一个人在多大程度上正寻找自己的人生意义(例题,我正在寻找自己的人生意义)。整个量表共10个题目,POM和SFM各占5个。对于每个题目,答题者要在7点量表(1 = 完全不符合,7 = 完全符合)上评价题目陈述与自身情况的符合程度。人生意义问卷具有较好的信度和效度(Steger et al., 2006)。王孟成和戴晓阳(2008)将量表翻译成中文,并发现人生意义问卷的中文版(C-MLQ, Chinese Version of MLQ)在结构上与原问卷完全一致,也具有较好的信度和效度。在本研究中,C-MLQ的总量表、POM分量表和SFM分量表的克伦巴赫系数分别为:0.844,0.843和0.855。
大学生的考研意愿仅用一个题目考察,即“到了大四,你会考研吗?”,这个题目有两个选项:选1意味着要考研,选2意味着不考研。
2.3. 数据分析
数据分析的工具为Mplus7.4和SPSS13.0,共分为三个步骤:1) 同时采用CFA和ESEM检验C-MLQ的双因子结构;2) 采用多组ESEM来检验C-MLQ在两组大学生(考研组vs不考研组)之间的MI,即检验Marsh等人(2014)提出的13个模型;3) 根据潜变量因子均数等值性、Mplus特有的组间均数差异检验和独立样本t检验的结果确定两组大学生在C-MLQ上的得分差异。
虽然Marsh等人(2014)提出的MI模型有13个,研究者通常主要关注其中四个(Meredith, 1993):形态等值(configural invariance),弱等值(weak invariance),强等值(strong invariance)和严格等值(strict invariance)。这四个MI模型的水平由低到高,逐级把更多参数在群体间限制为相等。只有在较低水平的MI得到确认之后,进行更高水平的MI检验才有意义。形态等值指量表的因子数量、因子与题目的对应关系在不同人群中是一样的,它是之后所有等值模型检验的先决条件和比较基线。弱等值在形态等值设定的基础上,将因子负荷在不同人群中限制为相等,这意味着题目得分变化一个单位,其对应因子的变化量在不同人群中是相同的。而强等值则同时将因子负荷和截距在不同群体中限制为相等,截距相等意味着处于不同群体的个体如果在潜在特质水平上相同,其题目得分也会相同。如果强等值假设成立,则因子均数上的差异就可以解释为相应潜在特质的差异了。严格等值在强等值设定的基础上,进一步将每个题目的残差方差在不同群体中限制为相等,残差方差相等意味着量表的题目信度在两个群体中保持相同,这样的话,显变量均数的群体差异也可以用潜在特质的群体差异来解释了。
CFA和ESEM均使用稳健极大似然估计(robust maximum likelihood estimation, MLR),以此应对数据中可能存在的非正态情况。拟合度指标均选用χ2,RMSEA (root mean square error of approximation)及其90%置信区间,CFI (Comparative Fit Index)和TLI (Tucker-Lewis Index) (Hu & Bentler, 1999; Jackson, Gillaspy, & Purc-Stephenson, 2009)。χ2太容易受样本量大小的影响,因此主要参考其余几种指标的取值。RMSEA小于0.08为达标,小于0.05为优良;CFI和TLI大于0.90为达标,大于0.95为优良(Bentler, 1990; Kenny & McCoach, 2003; Kline, 2010)。ESEM选择Mplus程序中默认的GEOMIN斜交旋转,因为GEOMIN旋转适合比较简单的因子负荷矩阵结构(Asparouhov & Muthen, 2009)。
13个MI模型之间具有层级嵌套关系。在多组ESEM检验中,嵌套模型之间的拟合度比较采用两个指标:ΔCFI和ΔRMSEA,分别为CFI和RMSEA的在两个嵌套模型之间的变化值,如果两个嵌套模型的ΔCFI没有超过0.01,则可以认为这两个模型的拟合度指标没有差异,不能拒绝测量等值性的假设(Cheung & Rensvold, 2002)。如果两个嵌套模型的ΔRMSEA没有超过0.015,也不能拒绝测量等值性的假设(Chen, 2007)。
3. 结果
3.1. C-MLQ的两因子结构:CFA vs ESEM
CFA和ESEM的结果都呈现在表1和表2中。CFA的结果显示,除第9题外,C-MLQ所有题目的因子负荷均超过0.60,而第9题的因子负荷也超过0.40。POM和SFM之间呈中等程度的正相关(r = 0.431),说明两者有联系也有区别,是同一构念(人生意义感)的不同方面。此外,C-MLQ的双因子结构在总样本,考研组和不考研组等三个群体中对数据的拟合程度都可以接受:CFI和TLI均超过0.90,其中考研组和不考研组的CFI还超过0.95,而RMSEA则均小于0.08。
Table 1. Standardized factor loadings and residual variances of C-MLQ in the total sample
表1. C-MLQ在总样本中的标准化因子负荷和误差方差
注:MLQ-P = 人生意义体验量表;MLQ-S = 人生意义追寻量表;Uniq = 误差方差。
ESEM的结果显示,C-MLQ是明显的双因子结构,与CFA的结果完全一致。除第10题外,几乎所有的双重负荷都是显著的,但没有一个双重负荷的两个负荷绝对值之差小于0.25。POM和SFM之间也呈正相关,但相关系数比CFA中要小(r = 0.261)。C-MLQ的双因子结构在总样本,考研组和不考研组中都完美地拟合数据:CFI和TLI都超过0.95,RMSEA则都小于0.05。
总之,CFA和ESEM的结果支持C-MLQ的双因子结构(POM和SFM),而ESEM模型比CFA模型能更好地拟合数据,且因子间的相关系数在ESEM模型中较小。
Table 2. Fit indices of the two-factor model in the total sample, postgraduate entrance examination candidates, and non-candidates
表2. 双因子模型在总样本,考研组和不考研组等三个群体中的拟合度指标
注:RMSEA = 近似误差均方根;CI = 置信区间;CFI = 比较拟合指数;TLI = Tucker-Lewis指数;所有χ2值的显著性都是p < 0.01。
3.2. 多组分析
比较考研和不考研两组大学生在C-MLQ两个维度上的差异,我们需要保证C-MLQ在两组大学生中至少要达到强等值性。表3中是测量等值性分析的结果。
形态等值M1的拟合度指标中,RMSEA不超过0.05,而CFI和TLI则都超过0.95,说明该模型能够完美地拟合数据。因此,C-MLQ在考研和不考研两组大学生中具有相同的结构。
弱等值由M1和M2的比较来确立。M2在M1的基础上将C-MLQ两因子模型的因子负荷在两组人群(考研大学生vs不考研大学生)之间限定为相等后,拟合度指标的变化为:RMSEA由0.046变为0.041,ΔRMSEA为0.005,不超过0.015;CFI由0.978变为0.977,ΔCFI为−0.001,没有超过0.01的分界值。因此,弱等值性成立,即两因子模型的因子负荷在考研大学生和不考研大学生之间是相等的。
强等值由M2和M5的比较来确立。M5在两组人群中将C-MLQ的因子负荷与截距都限定为相等,与M2相比,拟合度指标的变化为:RMSEA由0.041变为0.040,ΔRMSEA为0.001,不超过0.015;CFI由0.977变为0.975,ΔCFI为−0.002,也没有超过0.01。因此,强等值性成立,即两因子模型的因子负荷和截距在两组人群中都相等。
严格等值由M5和M7的比较来确立。M7将C-MLQ的因子负荷、截距和误差方差在两组人群中都限定为相等,与M5相比,拟合度指标的变化为:RMSEA由0.040变为0.037,ΔRMSEA为0.003,不超过0.015;CFI由0.975变为0.977,ΔCFI为0.002,也没有超过0.01。因此,严格等值性也成立,即两因子模型的因子负荷、截距和误差方差在两组人群中都相等。
Table 3. Fit indices for different levels of measurement invariance
表3. 不同测量等值性水平的拟合度指标
注:FL = Factor Loading (因子负荷),Uniq = Uniqueness (误差方差),FVCV = Factor Variance/Covariance (方差协方差),Inter = Intercept (截距),FMn = Factor Mean (因子平均数);M1~M13 = Model 1~Model 13;方括号内的值表示嵌套关系,如Model 3相应的方括号为[1, 2],表示Model 3嵌套于Model 1和Model 2。所有模型都嵌套于Model 1,而Model 13嵌套于所有其他模型。RMSEA = 近似误差均方根;CI = 置信区间;CFI = 比较拟合指数;TLI = Tucker-Lewis指数;所有χ2值的显著性都是p < 0.01,且所有Δχ2也都是显著的。
因子方差–协方差等值由M2和M4的比较来确立。M4将C-MLQ的因子负荷、因子方差和协方差在两组人群中都限定为相等,与M2相比,拟合度指标的变化为:RMSEA完全没有变化,依然是0.041;CFI由0.977变为0.976,ΔCFI为−0.001,没有超过0.01。因此,C-MLQ的两因子模型的因子负荷、因子方差和协方差在两组人群中都相等。因子方差和协方差的等值性还可以由(M3 vs M6, M5 vs M8, M7 vs M9, M10 vs M12, M11 vs M13)等模型比较来确立,由表3中数据可知,这些模型拟合度的比较结果均与“M2 vs M4”完全一致,支持因子方差和协方差的等值性。
因子(潜变量)平均数的等值最后4个模型(M10~M13)都将因子平均数在两组人群中设为0,同时伴随有其他参数的等值性设定。故能确定因子平均数等值性的模型比较有这样4对:M5 vs M10,M7 vs M11,M8 vs M12,和M9 vs M13。在这些模型比对中,并无一对在拟合度指标上的改变超过分界值,但离分界值已经非常接近。例如,M10在M5的基础上设定因子平均数不变后,RMSEA由0.040变为0.045,ΔRMSEA为0.005;CFI由0.975变为0.968,ΔCFI为−0.007,其绝对值接近0.01。其余几对模型比较的结果也是如此。因此,虽然因子平均数等值性得到支持,但证据较弱。
3.3. 因子平均数差异比较
对于两组大学生在C-MLQ两个因子上的得分差异,在多组比较中还有一种检验方法。即将其中一组(考研组)的潜变量均值固定为0,对另一组(不考研组)的潜变量均值则自由估计。其结果是:在考研组,POM和SFM的均值都为0;而在不考研组,POM的均值为:M = −0.329,p = 0.000,SFM的均值为:M = −0.006,p = 0.918。这里,不考研组的潜变量均值,实际上相当于两组人群在均值上的差值。也就是说,不考研大学生在POM上得分显著低于考研大学生,而在SFM上的得分与考研大学生没有显著差异。t检验的结果与之一致,考研大学生(M = 4.82, SD = 1.18)的POM得分显著高于不考研大学生(M = 4.44, SD =1.16):t(1, 1336) = 5.968,p = 0.000,d = 0.33;而其SFM得分(M = 5.00, SD =1.14)与不考研大学生(M = 4.99, SD = 1.09)无显著差异:t(1, 1336) = 0.142,p = 0.887,d = 0.01。
4. 讨论
我们的研究比较了考研大学生与不考研大学生在人生意义感上的差异,发现前者比后者有更多的人生意义体验,但后者并不比前者有更强的意义寻求倾向。而更加重要的是,我们事先通过多组ESEM确认了人生意义感测量工具(C-MLQ)在考研和不考研大学生之间具有严格等值性,保证了进行上述比较的合理性。在这一过程中,我们还确认了C-MLQ的双因子结构,并发现ESEM模型对CFA模型的优势。
工欲善其事,必先利其器。检查C-MLQ的结构以及它在考研大学生和不考研大学生之间的测量等值性是这项研究的关键部分。就C-MLQ的结构而言,ESEM和CFA的结果都体现出清晰的双因子结构,与之前研究者的因子分析结果基本一致(刘思斯,甘怡群,2010;王孟成,戴晓阳,2008)。这是C-MLQ有良好结构效度的证据。虽然ESEM和CFA模型的结构大同小异,但ESEM模型中的交叉负荷绝大部分都显著地大于0,而CFA模型本身不允许交叉负荷。Marsh等人(2014)曾经指出,CFA模型零交叉负荷的严格设定会导致两个问题:1) 模型的拟合度指数很难达标(例如,CFI,TLI > 0.9;RMSEA < 0.05);2) 因子间的相关程度容易被高估。而ESEM模型允许交叉负荷,会在这两个方面优于CFA模型。在我们的研究中,虽然CFA模型的拟合度指标也基本达到合格标准,但ESEM模型对数据的拟合程度明显更优。而且,与CFA模型相比,ESEM模型中的因子间相关系数也明显更低。ESEM模型确实展现出了上述两个优势。
多组ESEM的结果显示,C-MLQ的因子负荷,题目截距,题目误差方差,因子方差协方差在两组大学生之间都是相等的。测量等值性所要回答的问题是:处于不同群体的个体,其测量分数在同一测量尺度上是否具有可比性?它是用统计模型研究群体差异的基本要求或前提,一旦建立了测量等值性,就可以进一步解决有关潜变量均值或方差的群体差异问题(Reise, Widaman, & Pugh, 1993)。因子方差等值性并非本研究关注的重点,但协方差等值性提供的信息表明,POM和SFM之间的相关程度在两组大学生之间是不变的,这说明C-MLQ在两组大学生之间具有相同的区分效度。而因子负荷,题目截距,题目误差方差的等值性则说明C-MLQ在考研大学生和不考研大学生之间达到严格等值的标准,这样比较两组大学生显变量(题目得分)均值的做法就有了正当性。
CML-Q均值比较的结果与我们的预期一致,考研大学生比不考研大学生更觉得人生有意义。这次研究中“考研人”的样貌完全不同于之前的研究(程春燕等,2013;周婷,2007)。之前的研究倾向于把考研活动看作一种压力事件,揭示出“考研人”心理健康受到威胁的一面,例如,程春燕等人(2013)发现医学生在考研阶段心理问题检出率要高于非考研阶段,他们在考研阶段最明显的问题是人际敏感性。而周婷(2007)则发现,考研毕业生在研究生入学考试前的心理健康水平低于其他毕业生,他们的焦虑情绪尤为明显。我们的研究则假设整个考研过程是一种有意义的生活,揭示出“考研者”在这一过程中获得的积极体验。实际上,许多看似让人不愉快的活动都会让人感到人生有意义。例如,Heintzelman和King (2018)指出工作能增强人生意义感,Ward和King (2017)则发现日常惯例性的活动也有助于产生意义感,如今,我们又发现考研活动与人生意义感的关系。这些发现都可以用三成分理论来解释,即这些活动之所以能构成有意义的生活,是因为它们能够在不同程度上满足重要性,目的性和连贯性这三个特征(Costin & Vignoles, 2020; Martela & Steger, 2016)。
值得注意的是,三成份理论并不是MLQ编制的理论基础。作为评估人生意义感的工具,人生意义体验分量表的题目主要涉及目的性(例如,我已发现满意的人生目标),不涉及重要性和连贯性。因此,这次研究的结果没能与三个成分完整地对应起来。今后的研究要弥补这个缺憾,可以使用能同时评估重要性、目的性和连贯性的人生意义测量工具(Costin & Vignoles, 2020)。
总的说来,这次研究运用ESEM对中文版人生意义感量表进行了因子分析和测量等值性检验,为这个量表提供了结构效度的新证据以及跨组比较的合理性。在此基础之上,我们揭示出“考研人”在人生意义体验上的优势。这让我们可以重新考虑考研对于大学生适应功能的意义:作为一种激烈的竞争,它有着威胁心理健康的消极面,但作为一种目的明确,重要且有规律的活动,它又有增强人生意义感的积极面。
基金项目
湖北省教育科学规划2021年度一般课题(编号:2021GB054);武汉体育学院青年教师科研基金项目资助(编号:2022J01)。
NOTES
*共第一作者。
#通讯作者。