1. 引言
近年来频发的大学生焦虑、抑郁甚至自杀等事件,使大学生的心理健康问题成为学校、家庭和社会关注的焦点。医学生作为在院校特点、学制期限和学习繁重程度等方面异于其他专业的学生群体,承受了更大的心理压力,易于诱发其心理健康问题(李茵等,2016;辛素飞等,2019)。另一方面,日益紧张的医患关系也增加了医学生的心理负担,影响其心理健康(邵一鸣等,2016;王雨桐等,2018)。症状自评量表(Symptom Check List 90, SCL-90)虽已广泛用于测量中国人各类群体的心理健康水平,但尚未有研究探讨医学专业新生心理健康的敏感指标,以揭示医学生心理健康水平的参考值。研究医学新生心理健康的参考值有利于早期发现其心理健康问题,进行早期心理健康教育,进而预防由心理健康问题导致的悲剧。
信度和效度是心理测验的核心问题(易晓明,2020),是评价心理测量优劣的常用指标。作为最常用的心理健康测评工具之一,SCL-90问卷已广泛用于测量当代中国人(刘媛媛等,2018)、医学专业大学生(辛素飞等,2019)、老年人(辛素飞等,2020)、独生与非独生子女(廖友国,连榕,2020)、新冠疫情下民众的心理健康(苏斌原等,2020)等方面,其信度和效度问题也引起了比较多的关注(Yu et al., 2019; 陈树林,李凌江,2003;谢华,戴海崎,2006)。杨雪花和戴梅竞(2000)使用纸笔施测的方式探讨了SCL-90在大学生中的信度和效度,结果发现其分半信度、内部一致性信度和内容效度较好,但其结构效度不佳。施玲燕等(2013)使用纸笔测试方式也发现SCL-90在大学生群体中的信度和效度较好。最近一项大样本研究也采用纸笔测验形式探讨了SCL-90问卷的信度和效度,结果发现其组内相关系数(intraclass correlation coefficients)、题总相关系数和因子拟合度较高。以上研究表明,纸笔测验形式的SCL-90问卷在中国大学生中的信度和效度较好。
自网络普及以来,使用手机、电脑等进行心理测验已非常普遍(Musch & Reips, 2000)。由于网络测验在数据收集经济性、数据录入和数据取样便利性、答题形式简便性等方面比纸笔测验具有更大优势(王道阳,刘争光,2018),纸笔测验方式有逐渐被网络测验取代的趋势(Raffaelli et al., 2016)。心理测验在网络施测环境下的信度和效度问题也成为国内外学者关注的热点(Buchanan et al., 2005; 蔡华俭等,2008)。如有研究探讨了生活满意度量表在网络测验环境下的可靠性问题,发现测验完成时间、测试环境噪音、被试情绪等影响测试质量。最近的一项研究(易晓明,2020)探讨了纸笔测试和网络测试对16PF问卷中文版信度的影响,研究采用上海某大学跨度16年的53750名大学生的测验数据,对16PF问卷中文版的信度和效度进行分析,结果发现网络测试条件下的信度优于纸笔测试条件,问卷信度系数的波动在16年间变化较小。但到目前为止尚未有研究探讨网络施测对SCL-90问卷信度和效度的影响。
因此,有必要对网络测验条件下SCL-90问卷的信度和效度进行系统检验。首先,作为1984年被引进国内的心理健康测评工具,SCL-90问卷在诸多心理健康测评工具中的使用频次最高(李坚,2007),虽然该问卷在纸笔测试条件下的信度和效度已得到大量研究的证实(施玲燕等,2013;杨雪花,戴梅竞,2000),但尚没有研究探讨网络施测条件下SCL-90问卷的信度和效度。其次,越来越多的研究开始关注时代变迁对大学生心理健康的影响(李文福等,2020;辛自强等,2012),以比较不同年代大学生心理健康水平是否发生系统变化,而时代变迁会导致问卷信、效度的改变(易晓明,2020),但尚没有研究关注网络实测环境下时代变迁对SCL-90问卷信度和效度的影响。综上所述,本研究拟对某医学院校2010~2019年间共10个年级学生的SCL-90问卷的施测数据进行分析,以揭示网络施测条件下SCL-90问卷的信度和效度及时代变迁的影响,并确定SCL-90问卷的医学新生常模,以便提供该人群心理健康筛查的标准,为有效心理健康教育提供参考。
2. 对象与方法
2.1. 对象
采用北京心海导航教育科技股份有限公司开发的学生心理档案系统,对某医学院校2010~2019级的本科新生进行调查。测试在每年新生参加军训后的10~12月份,以班级为单位进行网络施测,测试时每个页面呈现1个题目。10年来共测试35,446人,其中有效问卷33,673份,有效回收率为95.0%。其中男生14301人,女生19,372人,分别占42.5%和57.5%;农村生源20,036人,城市生源13,637人,分别占60.6%和39.4%。各年度下研究对象的分布情况见表1。

Table 1. The distribution of gender and place of birth [n(%)]
表1. 性别和生源地分布[n(%)]
2.2. 研究工具
SCL-90 (Derogatis et al., 1973; 汪向东等,1999)包括90个关于个体感觉体验、情感、思维、意识、行为以及生活习惯、人际关系等方面的问题,并可以分成躯体化、强迫、人际关系、抑郁、焦虑、敌对性、恐怖、骗纸、精神病性和睡眠及饮食共10个因子。每个题目均为1~5的5点评分,分别对应无、轻度、中度、偏重和严重。因子均分是该因子所包含的所有题目总分除以题目个数,得分越高表明心理问题越严重。参照孟健男等(2019)的做法,以因子均分 ≥ 2分或量表总分 ≥ 160分为心理问题检出标准,量表总分 ≥ 250分作为严重心理问题检出标准。
2.3. 统计学分析
使用SPSS 22.0统计软件包进行各个题目得分与总分之间的Spearman相关分析,各因子和总分的内部一致性信度(Cronbach’s alpha)分析、各因子的内部一致性信度与数据收集年份的Spearman相关分析、各因子均分的Pearson相关分析、各题目得分的Spearman相关分析以及源于10个因子的12道题目得分的Spearman相关分析。
各个题目得分与总分之间的相关分析用于项目分析,以检验各题目的区分度。内部一致性信度分析的结果用于评估SCL-90问卷的信度情况以及时代变迁与信度的关系。如果各因子的信度系数与数据收集年份显著相关,可以推测时代变迁对问卷施测有影响,反之没有影响。因子均分之间的相关分析可以用于检验问卷的结构效度,该方法被广泛用于因素独立性的验证(易晓明,2020)。各因子均分之间的相关系数绝对值越高,各因子之间的相互独立性越差。因子分与总分之间的相关用于检验问卷的效度,因子分与总分之间的相关越高,表明问卷的内容效度越好,各因子分与总分之间的相关系数超过各因子分之间的相关系数是结构效度的指标。各题目得分之间的相关分析可以用于因素独立性假设的检验,虽然以往研究指出该方法可能会高估测题与因子之间的关联,但为了显示题目之间的相关趋势,本研究以图的形式显示题目之间的不同相关程度,并进一步以10个因子中的12道题目(因子2和因子9各2道题目,其余因子各1道题目)为代表进行检验。如果各因子测题符合因素独立性假设,同一因子下的题目间相关应较强,而不同因子下的题目间相关应较弱(易晓明,2020)。即不同因子下题目之间的相关系数绝对值大于同一因子下题目之间的相关系数绝对值,就可以认为问卷的结构效度较差。
3. 结果
3.1. SCL-90问卷在医学新生上的参考值
3.1.1. 心理问题检出情况
从收集到的有效问卷中筛选有心理问题和严重心理问题的学生,发现8041名学生存在心理问题,占比23.88%,633名学生存在严重心理问题,占比1.09%。在8041名心理问题学生中,男生和女生心理问题发生率分别为23.89%和23.87%,差异无统计学意义(χ2 = 0.0006, P = 0.980);城市和农村学生心理问题发生率分别为23.54%和24.11%,差异无统计学意义(χ2 = 1.46, P = 0.226)。2010~2019年间,不同性别和生源地的发生率检验结果如表2所示。

Table 2. Incidence of gender and place of birth of each year
表2. 各年份不同性别和生源地的发生率检验
注:*表示在0.05水平(双侧)有统计学意义;**表示在0.01水平(双侧)有统计学意义,下同。
3.1.2. 医学院校新生SCL-90问卷的参考值
由于在性别上,除躯体化、强迫、人际关系、精神病性和睡眠及饮食因子外,其他因子的差异均达到统计学显著(P值均 < 0.05);在生源地上,除躯体化、强迫因子外,其他因子的差异均达到统计学显著(P值均 < 0.05),因此,分别从不同性别和生源地上计算各因子的参考值。参照已有研究(施玲燕等,2013),计算各因子95%的百分位数作为参考值,结果如表3。

Table 3. Reference value of SCL-90 of medical students
表3. 不同性别不同生源地医学生SCL-90问卷的参考值
3.2. 信度分析
3.2.1. 项目分析
参照以往研究(Yu et al., 2019)做法,对各个题目得分与总分进行Spearman相关分析。结果表明,除了第4、5、12、13、15、16、35、47、64、82题在0.34~0.39之间外,其余80道题目均在0.40~0.69之间,所有相关系数均在0.01 (双侧)水平有统计学意义。根据Nunnally和Bernstein (1994)的建议,题总相关系数超过临界值0.3时,表明项目信度较好。
3.2.2. 内部一致性信度
利用各年度测量数据,分别计算各因子的内部一致性系数(克伦巴赫α系数),结果如表4所示。结果表明,SCL-90问卷的整体信度较高,各因子每年份的信度系数均大于0.7 (Kline, 2020),只有睡眠及饮食因子在2010~2015年间的信度系数略小于0.7,表明各因子的信度较好。

Table 4. Reliability coefficient of SCL-90 factors among each year (Cronbach alpha)
表4. 各年度下SCL-90各因子的信度系数(克伦巴赫α系数)
3.2.3. 各因子信度系数与数据收集年份的相关分析
对各因子的克伦巴赫α信度系数与数据测量年份进行相关分析,由表5可知,躯体化、强迫、人际关系、抑郁、偏执、精神病性、睡眠及饮食因子的信度随测评年份逐渐提高,焦虑、敌对性和恐怖因子的信度系数随年份没有变化,表明测量年份不会导致问卷信度降低。

Table 5. The relationship between reliability coefficient and year (spearman correlation coefficient)
表5. SCL-90各因子信度系数与年份的相关系数(Spearman相关)
3.3. 效度分析
3.3.1. 内容效度
各因子分与总分之间的相关可以用于考察量表的内容效度(王极盛等,1999),由表6可知,各因子分与总分之间的相关系数在0.76~0.92之间,表明该量表的内容效度较好。
3.3.2. 结构效度
各因子分与总分的相关是否超过各因子分之间的相关是衡量量表结构效度的检验方法之一(王极盛等,1999),由表6可知,各因子分之间的相关系数在0.55~0.82之间,接近各因子分与总分之间的相关系数(在0.76~0.92之间),表明该量表的结构效度欠佳,各因子间的独立性不好。

Table 6. The relationship among each factor of SCL-90
表6. SCL-90各因子均分之间的Pearson相关分析结果
注:所有相关系数均在0.01 (双侧)水平有统计学意义。
研究继续对所有题目得分进行相关分析,作为量表结构效度的另一指标。由图1可发现,同一因子下的题目相关较高,但也有较多不同因子下的题目相关较高,如人际关系与抑郁因子以及抑郁与焦虑因子。为了量化不同因子间题目的相关情况,表7显示分属于不同因子的12道题目得分之间的相关系数(均P小于0.01),属于精神病性因子的第62题和第77题之间的相关系数几乎比这两道题目与其他9个因子的相关都低,属于强迫因子的第51题和第28题之间的相关系数也表现出同样的趋势,表明因素间的独立性较差。
注:图中题目顺序按照因子进行划分排列,对角线上为10个因子内部相关情况,灰色方格表示相关系数大于0.30,黑色方格表示相关系数大于0.40。
Figure 1. Correlation coefficient matrix among each item of SCL-90
图1. SCL-90各题目的相关系数矩阵

Table 7. The Spearman correlation coefficient among twelve items of ten factors
表7. 来自10个因子的12道题目得分的Spearman相关结果
注:所有相关系数均在0.01(双侧)水平有统计学意义。
4. 讨论
4.1. 医学专业新生的SCL-90参考值
本研究采用近10年的连续测量数据,探讨医学院校新生的心理健康水平参考值。结果发现在2010~2019年间的33673份有效问卷中有8041名学生存在心理问题,占比23.88%,633名学生存在严重心理问题,占比1.09%。该检出率结果与以往研究发现一致(张静,2016),表明大学生心理问题的发生率较高,需要引起相关心理健康教育部分的重视。已有研究发现医学新生在强迫症状、人际关系等心理问题检出率上分别为26.17%和20.31% (靳蔚云等,2016),其他研究也发现医学专业本科生的阳性检出率为23.20% (李雪,2020),医学专业毕业生的SCL-90阳性检出率为18.70%。本研究的结果进一步表明,医学专业新生的心理问题突出,需要加强心理健康教育和心理卫生干预,以提高其心理健康水平。
研究结果发现,男生和女生心理问题发生率分别为23.89%和23.87%,城市和农村学生心理问题发生率分别为23.54%和24.11%,不同性别和不同生源地学生的心理问题发生率差异均无统计学意义。该结果与以往研究关于大学生心理问题检出率和性别差异的发现一致(施玲燕等,2013),表明性别和生源地对医学专业新生的心理问题检出率没有影响。但研究也发现,不同性别医学专业新生在抑郁、焦虑、敌对性、恐怖和偏执因子上的差异具有统计学意义,不同生源地医学专业新生在人际关系、抑郁、焦虑、敌对性、恐怖、偏执、精神病性和睡眠及饮食因子上的差异具有统计学意义。该结果可能是由于不同性别大学生在就业压力等方面存在差异,而导致其心理问题严重程度不同(杜燕红,2012;辛自强等,2012)。其他研究也表明农村生源和城市生源大学生持有的教育观念、享有的教育资源以及感受到的生活压力等的差异(罗伏生等,2009;周晓琴等,2013),使不同生源地大学生的心理健康水平产生差异。结果提示,需要对不同性别和生源地医学专业新生进行有针对性的心理健康教育和干预,以有效促进医学生的心理健康。
4.2. SCL-90问卷的信度
研究结果发现,SCL-90问卷的各因子的内部一致性信度系数在0.70~0.89之间,仅睡眠及饮食因子在2010~2015年间的信度系数在0.67~0.70之间,表明SCL-90问卷的信度较好,题总相关分析发现除了第4、5、12、13、15、16、35、47、64、82题与总分相关在0.34~0.39之间外,其余80道题目与总分相关系数均在0.40~0.69之间,研究结果表明SCL-90问卷的内部一致性信度较高,该结果与以往纸笔测验的发现一致。杨雪花和戴梅竞(2000)使用纸笔施测的方式研究了SCL-90问卷在大学生中的信度,结果发现其分半信度和内部一致性信度较好。施玲燕等(2013)也发现SCL-90问卷总量表的内部一致性系数为0.954,各因子的内部一致性系数平均值为0.765,表明SCL-90问卷的信度较好。最近一项大样本研究(Yu et al., 2019)也发现SCL-90问卷的组内相关系数(intraclass correlation coefficients)和题总相关系数较高。本研究进一步表明SCL-90问卷在网络测验条件下的信度较高,印证了SCL-90问卷信度较高的结论。
4.3. SCL-90问卷的效度
各因子的内部一致性信度较高、因子之间彼此独立是问卷结构效度的重要条件(易晓明,2020)。根据表4可知问卷的信度系数在0.70~0.89之间,表明问卷不存在信度问题。根据表6,各因子分与总分之间的相关系数在0.76~0.92之间,达到中等以上的相关,表明该量表的内容效度较好。但各因子分之间的相关系数在0.55~0.82之间,同样达到中等以上的相关,表明各因子之间的独立性较差。图1和表7的结果揭示了各因子分之间相关较高的原因。依据图1,对角线上为各因子所属题目内部的相关模式,对角线之外的为不同因子所属题目的相关模式,可以发现各因子下的题目不仅与同因子下的其他题目相关较高,与其他因子下的题目相关也较高。依据表7,来自10个因子的12道题目之间的相关都较高,属于精神病性因子的第62题和第77题之间的相关系数几乎比这两道题目与其他9个因子的相关都低,属于强迫因子的第51题和第28题之间的相关系数也表现出同样的趋势,说明原本用于测量不同因子的题目在心理意义上的关系过于紧密(易晓明,2020)。这些关联紧密的题目分别被用于测量不同的心理症状(例如,第51题和第56题:51、脑子变空了;56、感到身体的某一部分较弱无力),由此可知,不同因子下的题目有一部分关联过于紧密,语义相似性过高,是导致各因子独立性较差的原因,降低了SCL-90问卷的结构效度。
4.4. 时代变迁对SCL-90信度的影响
揭示SCL-90问卷的信度是否随时代变迁而变化是本研究的第三个目的。根据表5,躯体化、强迫、人际关系、抑郁、偏执、精神病性、睡眠及饮食7个因子的内部一致性信度与测评年份的相关系数在0.77~0.99之间,焦虑、敌对性和恐怖3个因子的信度系数与测评年份的相关没有达到统计学显著,相关系数分别为0.39、0.51、0.58。相关结果表明SCL-90问卷各因子的信度系数没有因为年代变迁而降低,与最近研究发现的SCL-90问卷的信度较高的结论(Yu et al., 2019)一致。同时,该结果进一步印证了网络测试与纸笔测试形式不影响问卷信度的结论(蔡华俭等,2008;易晓明,2020)。易晓明(2020)也指出设计合理的网络测验能够提高测验信度,网络测验对受测者的认知资源需求较小、降低了答题出错概率,进而提高了内部一致性信度。另外,本研究使用数据为学校心理健康教育中心通过班级辅导员完成测试任务的下发,学生在测验服从度上较高,也可能使问卷的一致性信度较高。
4.5. 反思和研究展望
本研究通过对2010~2019年间某医学院校33,673名新生SCL-90问卷的测量数据进行分析,发现不同性别和不同生源地学生的心理问题检出率没有差异,并构建了医学院校新生SCL-90问卷各因子95%的参考值,为医学院校新生的心理健康评估提供参考。研究也发现SCL-90问卷在网络施测环境下的项目质量、内部一致性信度和内容效度较好,能作为大规模网络施测大学生心理健康的测评工具。但本研究也有部分局限,比如研究数据来源于医学本科院校,其他类型院校或非高等教育受测者是否也有这种结果尚需进一步验证。本研究发现SCL-90问卷的结构效度欠佳,在以后的研究中可能需要针对不同的数据进行不同的因子划分,而不是使用统一的因子结构划分标准,使研究结果更适合特定的研究对象,为心理健康测评提供更科学有效的工具。
基金项目
本项目受山东省自然科学基金(JY2015BS03)、山东省高等学校“青创科技计划”项目(2019RWF003)、贺林院士新医学科研基金项目(JYHL2019MS03)、济宁医学院教师科研扶持基金(JYFC2019KJ011)的资助。
NOTES
*通讯作者。