1. 引言
在现实的工作和生活中,会遇到各种各样的问题,这些问题会影响着我们的生理和心理健康。若无法有效的自我调整或得不到社会支持,容易产生抑郁、焦虑等负性情绪,而负性情绪一旦持续较长时间,极易产生心理问题和心理疾病(Shelley, 2006)。抑郁症作为心理疾病中最为常见也最为人熟知的一类心理疾病,受到了越来越多的关注。常见的抑郁量表有症状自评量表(SCL-90)、抑郁自评量表(SDS)等(金婷,张磊晶,2017),它们的因素结构得到了各自验证。美国国立精神卫生研究院(NIH) Radloff编制的流调中心抑郁量表(Center for Epidemiological Studies Depression Scales, CES-D),是目前世界上使用最广泛的抑郁症测量工具之一,在我国应用广泛,被用来识别一般中年人群的抑郁症状。Radloff (1977)的研究中将量表分成4个维度:躯体症状、抑郁情绪、积极情绪和人际问题。
截止目前,已经有研究报道了二因素结构(Cheung & Bagley, 1998; Edman, Danko, Andrade, Mcardle, Foster, & Glipa, 1999; Kazarian & Taher, 2010)、三因素结构(Guarnaccia, Angel, & Worobey, 1989; Liang, Van, Krause, & Markides, 1989; Yen, Robins, & Lin, 2000)、四因素结构(张娜,张英辉,马梅,张韬,邱培媛,2014),甚至是五因素结构(Thorson & Powell, 1993; Ying, Lee, Tsai, Yeh, & Huang, 2000)。特定群体中CES-D抑郁量表的因素结构可能会发生一定的改变,由于文化背景、地域等因素的各种影响,对量表项目进行认知理解和解释时会存在差异。在国内研究中,不同年龄、地域的群体,因素结构会存在差异。例如:凌宇(2008)等人的研究发现CES-D中文版的四因素结构模型在高中生的研究数据中拟合最佳,张宝山,李娟(2012)发现CES-D的16项目三因素结构在我国老年人群数据中拟合最佳,而痴呆病人照顾者的CES-D因素结构为不同于常模的三因素结构(Huang, Wang, & Liao, 2015)。
国内近几年关于CES-D抑郁量表的研究多集中在CES-D中文版的信效度研究和本土常模的建立。章婕等人(2010)以各个年龄段的普通人群为样本,获得了各个年龄组的常模,在城市人群全面地验证了CES-D中文版的信度与效度。其次,国内关于CES-D的研究大多集中在以青少年或老年期的被试为年龄段样本的研究,对于以多年龄段被试为样本的研究甚少,未见到以中国全年龄段为样本的20题CES-D信度与效度的研究。
闫丁和焦璨(2016)对简版流调中心抑郁量表的研究和张宝山,李娟(2012)对流调中心抑郁量表的研究中得出一致性的结论:积极情绪对量表因素结构的拟合水平贡献不大。在之前的研究中有结果表明积极情绪与其它项目相关较低,对积极情绪的合理性提出质疑。因此,我们也将在CES-D中考察积极情绪这一维度,探讨是否对CES-D中文版的拟合程度和可靠性造成影响。
2. 对象与方法
2.1. 研究对象
本研究采用分层随机抽样的方法,在全国范围内抽取22个省、31个地市的612名被试,剔除无效和作答率低(未作答项目 ≥ 2)的问卷后,最终获得579份有效问卷。此次抽样年龄段为18~55岁,基本情况为:男性261人,占总体的45.10%,女性310人,占总体的53.50%,有1.40%的缺失数据;419人(72.40%)为城镇户口,91人(15.70%)为农村户口,69人(11.90%)缺失;5人(0.90%)为小学以下学历,88人(15.20%)为初中学历,80人(13.80%)为高中学历,22人(3.80%)为职业高中,65人(11.20%)为中专学历,145人(25.00%)为大专学历,大学本科和硕士及艺术的人数分别为142人(24.50%)和30人(5.20%),2人(0.30%)缺失;在婚姻状况中已婚人士占到377人(65.10%),未婚人士有177人(30.60%),有7人(1.20%)缺失数据。
2.2. 工具
采用CES-D中文版测量抑郁症状的水平,共20题,包含16个消极情感和4个积极情感的项目,4级评分,0 = “偶尔或无”,3 = “多数时间或持续”,所有题分数相加为抑郁总分,总分范围为0~60,分数越高,代表被试抑郁程度越高。该抑郁量表的测量内容包含了国际上关于抑郁症认定的大部分症状,包括抑郁心境、精力减退、注意力差以及睡眠困扰等,但是不包括精神运动性改变以及存在自杀观念等(陈祉妍,杨小冬,李新影,2009)。
2.3. 统计方法
1) 使用SPSS23.0软件进行因素间的相关及卡方检验等分析。
2) 通过Mplus7.4软件对CES-D流调中心抑郁量表的因素结构进行验证性因素分析,基于拟合指数比较,找出拟合最好的模型,获得适合中国人的最佳因素模型。
3) 通过JASP0.8.4.0软件,对获得的最佳模型进行内部一致性信度分析,获得该模型的各个维度Cronbach’s α系数及McDonald ω系数。
2.4. 数据处理与估计法的选择
CES-D量表信度与效度研究,在以中国人为样本时,存在分析方法的局限性。CES-D量表为4点计分的工具,收集到的CES-D数据却常被看作是连续的,把这些离散数据当作连续数据处理违反多元正态假设,会扰乱因素结构和相关的结果。Mplus软件在验证性因素分析中,默认用极大似然估计法(Maximum Likelihood, ML),在国内关于CES-D的验证性因素分析中,大多数研究使用ML法进行参数估计。ML估计法的使用前提必须是数据连续分布、多元正态分布、数据独立和大样本,大多把项目看作是连续变量,且认为数据是正态分布,因此CES-D量表的类型违背了极大似然估计法的前提要求。在Mplus软件中,进行验证性因子分析时常采用的估计法有ML、MLM和WLSMV (王孟成,2014)。有研究表明,当选项数在5个以上时,将其作为连续变量可以获得可靠的估计结果(Johnson & Creech, 1983),但是这种数据本质还是类别数据。所以验证性因素分析中,在Mplus中指定数据类型为类别数据,此时Mplus默认的估计方法为稳健加权最小二乘法。
3. 结果
3.1. 研究对象的得分情况
研究对象在各题目上的得分情况见表1,满分60分,被试得分在0~54分之间,平均分为11.08,中数为8.00,标准差为9.68。如表1所示,通过对偏态,峰态的比较,不像是一般能力类或者人格类量表分布均为正态分布,抑郁量表题目分数的分布有一些是正偏态分布。

Table 1. CES-D item descriptive statistics
表1. CES-D各条目的描述统计量
3.2. CES-D流调中心抑郁量表的模型比较
3.2.1. CES-D模型比较现状
CES-D量表自Radloff于1977年编制完成后,在原来20题版本的基础上相继出现了以特定群体为研究对象的13题版本(张宝山,李娟,2011)、12题版本(Poulin, Hand, & Boudreau, 2005)和Björgvinsson等人(2013)测验过的10题简化版本等,不同版本量表的因素结构不尽相同。
Radloff最初把CES-D的20个项目分成了四个症状组:抑郁情感(DA,7题)、躯体症状(SC,7题)、人际关系问题(IP,2题)和积极情感(PA,4题),在美国各个人群的研究中都得到了有力支持(Wang, Yang, & Xiong, 2018)。现在,CES-D已被用作各个年龄群体,包含了老年人群体、成年人群体、大学生群体、青少年群体、儿童群体(Wang, Armour, Wu, Ren, Zhu, & Yao, 2013),以及城市群体与农村群体。本研究意在比较全国人口抽样调查的各个可能模型与样本的拟合程度。分别考察Radloff提出的四因素模型、Yen,Robins,Lin提出的三因素结构、Guarnaccia,Angel,Worobey提出的三因素模型、Edman等人提出的二因素模型和单因素模型。讨论最激烈的三因素模型有两个,其一是Yen等人提出的三因素结构,把积极情绪因素的4个项目归为一个因素,撤销了人际问题这一维度,将人际问题的项目分布在了其他两个维度上;另一个是Guarnaccia等人提出的三因素模型,把躯体症状和抑郁情绪合并成了一个因素,另两个因素不变。二因素由Edman等人发现,该模型分为积极情绪和消极情绪两个维度。单因素结构模型由抑郁这个单一特质构成(凌宇,魏勇,蚁金瑶,肖晶,姚树桥,2008)。
3.2.2. 模型拟合指数比较
采用单一拟合指标评价模型存在缺陷:研究者根据模拟研究或经验得出近似拟合指数的临界值或划界分,每一个拟合指标所对应的临界值并不绝对准确,这些临界值本身在研究者中没有达成一致(Beauducel & Wittmann, 2005; Fan & Sivo, 2005; Hau, Marsh, & Wen, 2004)。所以,本研究通过综合比较上述五个模型的假设检验卡方(CFI)、比较拟合指数(TLI)和近似误差均方根(RMSEA),对五个竞争模型进行比较。良好的拟合指数评价标准为TLI和CFI > 0.90,RMSEA < 0.08 (温忠麟,侯杰泰,马什赫伯特,2004)。基于五个模型的拟合数据分析,除单因素模型外,其他模型的拟合程度均达到理想水平。如表2所示,模型四(Yen,Robins,Lin提出的三因素模型)拟合指数:c2 = 390.94,df = 167.00,TLI = 0.96,CFI = 0.97,RMSEA在90%显著性取值范围在0.04~0.06。通过比较,Yen,Robins,Lin研究的三因素模型相比其他模型获得了更好的拟合,Yen三因素模型为适合中国人的最佳因素模型。

Table 2. Comparison of CES-D Chinese version five model fitting indicators
表2. CES-D中文版五模型拟合指标对比
注:*p < 0.05;**p < 0.01,下同。
3.3. Yen三因素模型的各项目载荷分析
研究对象在各维度上项目载荷情况见表3,项目1至项目20中除项目4外,其余载荷范围均在0.83~0.53之间,积极情绪维度中项目4载荷最低为0.35。每个项目都应在其公共因子上有较高负荷值,一般要求大于0.40 (李灿,辛玲,2008),对其他公共因子的负荷值则较低。如果一个项目在所有的因子上负荷值均较低,说明其反映的意义不明确。项目4因子载荷小于0.40不符合测量学标准,这与章婕等人(2010)的研究结论一致。

Table 3. Yen’s three-factor model load analysis
表3. Yen三因素模型各维度项目载荷分析
3.4. Yen三因素模型的信度分析
问卷测量内容包括多个因素,宜分别对其估算α系数,否则整个问卷的内部一致性可能较低,一般要求问卷的Cronbach’s α系数大于0.80 (李灿,辛玲,2008)。CES-D总量表Cronbach’s α为0.88,McDonald ω为0.90,各分量表的Cronbach’s α在0.82~0.84之间,McDonald ω范围在0.90~0.91之间(见表4)。

Table 4. Reliability analysis of Yen’s three-factor model
表4. Yen三因素模型各维度项目载荷分析
3.5. 探究积极情绪维度对总量表一致性信度的影响
闫丁和焦璨(2016)研究发现积极情绪维度会影响测评结果,减弱老年被试测评结果的真实性。张娜,张英辉,马梅,张韬,邱培媛(2014)对农村女性群体的研究发现,删除积极情绪维度会减弱量表的整体信度。因此,本研究对积极情绪的合理性提出质疑。使用JASP0.8.4.0软件,观察依次删除积极情绪维度项目(项目4、8、12、16)后总量表内部一致性信度变化,结果详见表5。

Table 5. Change in the reliability coefficient of CES-D
表5. CES-D内部一致性信度系数变化
依次删除项目4、8、12之后,总量表内部一致性信度逐步提高,Cronbach’s α系数从0.88上升至0.91。删除项目16后,量表内部一致性信度降低。积极情绪维度削弱了量表对所选取被试的抑郁水平的评估效果。
3.6. 因素之间的相关
积极情绪因素削弱了CES-D量表的内部一致性信度,积极情绪维度可能并不与其他两个维度共享同一高阶因素。存在共同高阶因素是量表总分具有测量学意义的前提,这需要因素间满足高相关,否则难以保证量表总分的有效性。故通过验证三者之间的相关大小来检验三者是否共享同一高阶因素。见表6。

Table 6. The correlation among the three factors in Yen’s three-factor model
表6. Yen三因素模型三因素间的相关
积极情绪与躯体症状和抑郁情绪的相关均低于0.40,无法构成高阶因素。躯体症状与抑郁情绪相关为0.75,满足构成高阶因素的条件。积极情感项目可能不适合纳入抑郁自评量表,积极情绪项目破坏了量表信度和因子间的相关性,直接测量消极情感来预测抑郁情况可能较好。
4. 讨论
基于CES-D多竞争模型拟合指数比较,Yen,Robins,Lin提出的三因素模型在各个拟合指数上优于其它模型,达到理想拟合标准,Yen等人提出的三因素模型更适合中国人的抑郁结构。三因素模型将Radloff提出的四因素模型中人际关系因素纳入到抑郁情绪因素,躯体症状和积极情绪因素无变动。根据DSM-V抑郁症的诊断标准,此三因素与抑郁症的主要症状因素相吻合。抑郁情绪与积极情绪是测量近两周的直接情绪状态,躯体症状是情绪状态的间接表现,三因素模型具有良好的适配性和合理性。
研究表明,中国人习惯把人际关系问题和抑郁情绪(夏凌翔,万黎,宋艳,杨翼龙,2011)相联系,习惯把困扰自己的人际关系问题与抑郁情绪等同。因此,三因素模型将四因素模型中人际关系因素纳入抑郁情绪因素时拟合度上升。从临床角度看,人际关系极易造成抑郁。抑郁症主要是由生物性和社会性因素以及人际关系压力等综合因素导致的一组综合征(霍平,郑红光,孙丽丽,徐晓丽,程显山,2000)。在进行抑郁症筛查时工作者会从人际关系出发,人际关系出现问题的患者有可能以抑郁情绪的方式表达出来。因此,将人际关系因素纳入抑郁情绪因素在国内具有合理性。
本研究同样发现删除积极情绪因素的项目会使量表的内部一致性信度提高,积极情绪因素会降低该量表的信度。积极情绪因素与其它两个因素的相关明显低于消极情绪因素与躯体症状因素之间的相关,消极情绪与躯体症状共享同一个高阶因素,积极情绪不支持该高阶因素。为此,对积极情绪削弱量表信度效度的原因进行讨论。
Jang等人(2010)提出亚洲文化对积极情绪有抑制作用,这可能与中国的历史、地域、文化有关。中国文化强调收敛、平庸,面对积极情绪时,中国人不会很顺利地表达此情绪,使得题目处理加工受阻,影响量表的可靠性。另一方面,侯杰泰等人(2011)提出反向题目确实自成一个负向方法因子,尤其是对低龄的学生来说,这个负向方法因子与学生的能力关系显著。研究显示,用“不”或与主要概念相反的词句,回答者可能产生一些含混或复杂的心理反应,应小心分析处理。反向计分题目还会让被试付出认知转换和重复的代价(孙天义,许远理,郭春彦,2011)。陶沙(2006)基于已有研究发现一般结果期待倾向是抑郁的重要预测因素,结果指出,乐观倾向和悲观倾向是相关而不同的两种结果期待倾向,悲观倾向对于抑郁变异的独立贡献率高于乐观倾向,研究结论对积极情绪的抑郁拟合贡献水平较低提供了支持。在归因方式上,戴琴,冯正直,戴勤素(2009)的研究表明,在经历一个负性事件时,具有消极归因方式的人比具有积极归因方式(将负性事件归因为外部的、暂时的和具体的原因,正性事件归因为内部的、稳定的和全面的原因)的人更容易产生抑郁,这个观点得到了广泛的研究支持,消极情绪因素比积极情绪因素更容易联系抑郁。积极情绪的题目会对国内CES-D测量结果产生较少的不良影响,降低可靠性。
基金项目
本研究受到济南大学博士基金的支持:B1706。