1. 前言
1.1. 关于Rosenberg自尊量表因素结构的争议
自尊是积极心理学中的重要概念,被认为是消极情绪的缓冲机制,与身心健康、幸福感、甚至寿命等都有密切关系 (Urbán, Szigeti, Kökönyei, & Demetrovics, 2014) 。一般自尊测量中最常用的量表之一是Rosenberg自尊量表(RSES)。量表中有5个正向题和5个反向题。RSES最初被设计为单维结构,但探索性和验证性因素分析却经常发现正向和反向题测量的是两种不同的自尊因素(5个正向题测量的因素被命名为正向自尊,5个反向题测量的因素被命名为反向自尊) ( Ang, Neubronner, Oh, & Leong, 2006 ; Boduszek, Hyland, Dinghra, & Mallet, 2013 )。有人甚至将自尊区分为自我胜任感和自我喜爱两个维度 (Schmitt & Allik, 2005) 。但近来除在一些特殊群体(如少年犯)中的研究发现二因素模型最能拟合数据外 (Boduszek et al., 2013) ,RSES在少年至成年的正常人群中都测量单维的自尊结构。
如何认识自尊量表中的方法因素(method factor,MF),即题目陈述方向带来的反应偏差? Marsh (1996) 首先发现,在CFA分析中引入与反向题目有关的MF后,RSES测量了单维的自尊结构。此后的研究进一步发现,当正向题目MF与反向题目MF都包括在模型中时,模型拟合才更理想 (Marsh, Scalas, & Nagengast, 2010; Quilty, Oakman, & Risko, 2006) ,说明正向题与反向题都存在MF。相比之下,一般认为反向题目带来的方法偏差更大,而正向题目带来的MF较少(Huang & Dong, 2012)。但也有研究发现正向题目的MF更大。 Wang,Siegal,Falck和Carlson (2001) 在吸毒人群中发现正向MF的影响远远大于反向MF。而 Wu (2008) 在台湾被试中的研究发现正向与反向自尊题目对测验结构效度的影响程度相当,因此他们建议中国文化中的自尊测量应该平衡使用正向和反向题。
Schmitt和Allik (2005) 发现正向与反向自尊量表都与神经质和外向性等人格变量存在非常一致的相关,说明二者测量的内容相同,从反面支持了自尊的单维结构。同时也发现了反向题目偏差,即在反向题上得分显著低于正向题。他们还发现了文化因素对自尊量表的影响。
1.2. 方法因素的性质及其相关物
题目陈述效应在不同人群中的表现形式和效应并不一致,这与被试如何理解问卷题目有关 (Schmitt & Allik, 2005; Wang et al., 2001) 。 Marsh (1996) 发现与反向题目有关的人为因素(artifacts)在低言语能力的人中作用较明显,在高言语能力的人中则作用降低。 Tomás,Oliver,Galiana,Sancho和Lila (2013) 发现RSES等自尊量表中的MF与焦虑水平显著负相关。这是因为焦虑的人会对威胁性的和不确定性的信息优先注意,所以对反向题目有赞同偏好。
更多学者则倾向于将MF视为一种稳定的反应风格,甚至是有用的人格变量 (Urbán et al., 2014) 。RSES中的反向MF与其他量表(心理控制源量表等)中的MF存在一致性,且具有跨年龄和跨性别的稳定性 (Lindwall et al., 2012; Urbán et al., 2014) 。有研究发现自我意识强、害怕负面评价的人更少地表现出与反向题目有关的MF。回避动机则与反向MF负相关(可以推论高回避动机的人更愿意赞同反向题)。大五人格中的责任感、情绪稳定性也与反向MF表现出正相关(即责任感强、情绪稳定的人更不愿意赞同反向题) (Quilty, Oakman, & Risko, 2006) 。 Lindwall et al. (2012) 进一步发现反向MF与呈抑郁负相关而与生活满意度呈正相关。说明高抑郁、低生活满意度的人更倾向于赞同反向题目。正向MF则与生活满意度负相关。但MF与社会赞许性(SDR)不具有相关性,说明是一种不同于SDR的系统误差。
1.3. 中国人的自尊特点
Schmitt和Allik (2005) 发现RSES的正向与反向自尊维度与外部效标的相关相当一致,但 Ang等(2006) 在新加坡学生中发现二维自尊模型更能拟合数据,且正向自尊能预测掌握目标导向(mastery goal orientation)和自我效能感,而反向自尊则能够预测破坏行为。 Kim,Peng和Chiu (2008) 在中国被试也发现正向自尊题目能预测坚持性、心理坚强、寻求挑战和达成挑战性目标的行为,反向题则不能。这种不一致很可能是由于中国人与西方人相比更不需要保持自我的统一性 (Boucher, Peng, Shi, & Wang, 2009) 。另有研究发现中国被试中反向自尊与抑郁正相关,而正向自尊则与抑郁没有相关(Supple, Su, Plunkett, Peterson, & Bush, 2013)。这暗示中国被试中可能存在二元自尊结构,两种自尊有不同的心理测量学性质。
多数学者承认的另一个事实是中国人在自尊量表上的得分低于西方人 (Spencer-Rodgers, Peng, Wang, & Hou, 2004; Kim, et al., 2008) 。其原因很可能是中国人拥有辩证的自我观。中国人相信任何事物都有正反两面。因此既能接纳积极自我又能接纳消极自我。表现在自尊量表上就是既赞同正向题又赞同反向题。西方人则追求自我的统一性,其在正向题和反向题上的得分高度一致。正是因为中国人对反向记分自尊题目的肯定倾向导致其自尊量表得分低于西方人。 Kim等人(2008) 的研究证明了这一特点,同时发现中国被试在正向和反向自尊题目上得分的一致性低于北美人。
也有人认为中国人既倾向于赞同反向题,又在正向题上存在谦虚偏差 (Wu, 2008; Kim, et al., 2008) 。如 Farh和Cheng (1997) 发现台湾公司职员的自我绩效评估分数显著低于上级对他们的评价,这种效应在正向题目中表现得尤为明显。下属的自我绩效评估中包括2个因素(分别载荷于正向题目和反向题目),而用同一量表对上司的评估却得到了单维结构。可能是中国文化中的谦逊价值观造成了这一结果,而且正向题目会扩大这一趋势。因此他们建议反向题目更符合中国被试。
1.4. 问题的提出
关于RSES中的MF问题是几十年来争论的热点,而且波及到其他自陈量表。很多重要的理论性问题仍然没有得到解决。而MF在中国被试中的表现形式和特点尤其值得研究。概括起来,本研究拟解决的问题有:1) 自尊量表中的MF在中国被试中是否存在。2) 在承认正向和反向MF都存在的前提下,测验的单维因素结构是否被破坏。3) 如果正向和反向MF都存在,哪种MF所带来的偏差更强?4) 正向和反向MF会不会对题目所测量的内容产生实质性影响?5) 正向和反向MF在其他自陈式量表中是否也存在?6) 正向和反向MF与人格量表间有怎样的关系,是不是有用的人格变量?7) 中国人在自尊量表上的得分有哪些不同于国外的特点?
2. 研究方法
2.1. 测量工具
本研究中的测量工具都有中文修订版且信效度经过了检验。Rosenberg自尊量表(RSES)。包含10个测量一般自尊的题目,4级记分,Cronbach α系数为0.885。自尊对人的身心健康领域的人格变量有广泛影响 (Schmitt & Allik, 2005; Urbán, et al., 2014) 。因此除自尊量表外,按照本研究的目的,通过参阅文献,我们选择了可作为自尊测量效标的人格测量工具。包括BFI-44,Cronbach α系数为0.680;一般健康问卷GHQ-12,Cronbach α系数为0.829;状态–特质焦虑问卷STAI,状态焦虑和特质焦虑量表的Cronbach α系数分别为0.921、0.884;流调中心用抑郁量表CES-D,Cronbach α系数为0.800;中文版人际反应指针IRI-C,Cronbach α系数为0.744;WLEIS情商量表,Cronbach α系数为0.876;总体幸福感量表GWB,Cronbach α系数为0.851;社会期望量表MCSD,Cronbach α系数为0.690。
2.2. 被试和程序
采用整群抽样的方式从东部某省份一所综合性大学中选取525名大学生(男239人,女286人)为被试,以团体施测的方式实施测验。每位被试都得到礼物作为补偿。平均年龄20.13岁,标准差1.97岁。该校生源来自全国各地,因此样本具有较好的代表性。
2.3. 统计分析方法
历史上关于RSES的研究模型多达10个。考虑到有的模型本身没有实际价值,本研究只采纳了1、2、3因素模型,并依据CTCM方法设置研究模型。CTCM可以估计MF的大小及与其他量表中特质因素和方法因素的关系,这是CTCU所做不到的。研究中用SPSS18.0进行初步的数据处理和信度分析,用AMOS17.0进行模型验证。
3. 结果
3.1. 自尊与其他人格测量的信度
首先计算出自尊与其他人格测量正反向陈述分量表及总量表的信度(表1)。情商量表中只有正向题,MCSD量表的因素结构在中国还没有得到很好的确认,因此本研究只计算了它们的总分和总信度。
表中列出了本研究中所用的人格量表的信度(alpha系数)。可以看出各量表的总体信度都在可接受的范围内,保证了研究结论的可靠性。总体上看反向记分量表的信度略低于正向量表,但差异不明显。而反向自尊量表的信度甚至超过了正向自尊量表。

Table 1. Reliability of the positive and negative subscales in RSES and other psychological measures
表1. 自尊等量表正反向陈述分量表及总量表的信度
3.2. 自尊与其他人格测量间的相关
然后根据研究目的计算出了正向自尊、反向自尊与可能的效标变量(根据题目陈述方向也划分了正向和反向分量表)间的相关(表2)。
正向与反向自尊如果与其他人格测量间存在一致性的相关,则证明正向与反向自尊其实是一种自尊。为更详细地评估MF,我们对每种人格量表都区分出了正向与反向两种形式。这里的考虑是:如果MF对测验影响不大,则用正向与反向题目测量的特质与用正向与反向题目测量的特质间的相关应该相当一致。从结果中可以看出正向自尊、反向自尊与外部效标间的相关相当一致,说明题目陈述方向没有改变自尊量表题目所测量的内容。支持自尊量表的单维结构。总体自尊与SDR呈负相关,说明自尊测量较少受社会赞许性的影响。
从另一角度分析,如果MF的作用强大,则题目陈述方向相同的两个特质得分间的相关就更大。即正向自尊与正向健康由于共享了正向MF,其相关应大于正向自尊与反向健康间的相关。同样反向自尊与反向健康由于共享了反向MF,其相关也应该更大。从上表的结果中可以看出正向自尊、反向自尊与其他人格量表正反两种得分间的相关并未表现出明显差异,说明正向与反向MF并没有导致测验题目背离所测量的内容。这一结论适用于本研究中的所有人格量表。
正向自尊与反向自尊量表的差值也是个重要的分析指标。差值为正说明被试更愿意赞同正向自尊题目,差值为负说明被试更愿意赞同反向自尊题目。这是不是一种有价值的人格倾向?从结果中可以看出正反向自尊的差值与抑郁、神经质、同情心呈负相关。这说明越情绪化的人越愿意赞同反向题。这与先前的结论 (Lindwall et al., 2012) 非常一致。
3.3. 方法因素对模型拟合的影响
为探讨MF是否影响自尊结构,设置了如下模型(表3)。包括单维自尊模型M1a、双维自尊模型M1b、含有正向MF的自尊模型M1c、含有反向MF的自尊模型M1d、含有正向和反向MF的自尊模型M1d。同时再将自尊、一般健康、状态焦虑量表的题目放在一个模型中估计,产生了三因素模型M2a (模型中只设置了自尊、一般健康、状态焦虑3个特质)、M2b (设置了正向MF)、M2c (设置了反向MF)。通过模型比较可判断自尊量表、一般健康量表、状态焦虑量表中的MF是否有相同的性质。
从表3中可见所有单因素和二因素模型都不符合模型拟合严格标准 (Marsh, Hau, & Wen, 2004) 。而引入MF后模型拟合得到了明显提高。但只有在正向和反向MF同时纳入模型后单维量表的模型拟合才接近或超过模型拟合的严格标准。说明正向和反向MF在不同量表中都存在,且反向MF对测验结构的破坏力更大。
将M2b、M2c与M2a比较,发现其拟合是相当理想的。因此可以认为自尊、一般健康、状态焦虑量表中的正向、反向MF具备同质性,是性质相同的反应偏差。

Table 2. Correlation between positive and negative RSES subscales and criterions
表2. 正向自尊、反向自尊与可能的效标变量间的相关
注:*p < 0.05,*p < 0.01。

Table 3. Fitness statistics of the hypothesized models
表3. 研究模型的拟合优度统计量
3.4. 方法效应的大小及与人格的相关
一般用特质因素和方法因素对应的因子载荷的平方和表示特质效应和方法效应。结果发现自尊量表反向题目方法载荷的平均值(0.48)明显大于正向题目(0.21)。说明反向MF对测验结果的影响更大。因子载荷的平方和也是反向题目(1.32)大于正向题目(0.30)。这与先前研究很一致。
在分离出自尊量表中的MF后我们分析了MF与不同人格变量的关系。具体做法是将MF设置为自变量,将人格量表得分设置为因变量,在AMOS17.0软件中进行单自变量、单因变量的路径分析。以便计算出的路径系数不受其他变量影响。计算结果见表4。
从表4中可见正向与反向MF都与人格变量之间存在一定相关,相关的方向与国外研究基本一致。抑郁、一般健康、神经质、特质焦虑与反向MF的相关相当可观,说明高抑郁、心理健康状况差、情绪不稳定、焦虑的被试更倾向于赞同反向题目。正向MF则与情商、一般健康、经验开放性等有相当可观的负相关,说明有这些特点的人更不愿意赞同正向自尊题目。这看起来矛盾,却揭示了另一个事实:情商高、心理健康、经验开放的人更能辩证地认识自我,对自己的优点并不急于承认,这恰恰是一种成熟的自信。
3.5. 中国被试在自尊量表上的得分模式
本研究发现大学生在正向自尊量表上的得分虽然高于反向自尊量表(p < 0.00),但差异(1.26)却没有想象的大,与美国被试(1.2)和英国被试(1.1)非常接近。这一结果与先前研究有一定出入 (Schmitt & Allik, 2005; Wu, 2008) 。中国被试的正向和反向自尊量表得分都低于美国被试,但没有证据表明中国人在自尊量表上的低分是由于中国人更愿意赞同反向题目。在Schmitt和Allik的样本中香港被试正向和反向自尊量表上的均分差值是1.8,台湾则是2.3。 Schmitt和Allik (2005) 的研究是10年前进行的,10年前香港和台湾人在自尊量表上的得分模式更像欠发达国家的被试。而本研究的结果却更接近世界发达国家。这说明中国人寻求自我统一性的需求增强了。
但中国被试在正向和反向自尊量表上的得分仍然低于美国等西方国家。这部分可以用 Farh和Cheng (1997) 的观点来解释:中国被试在正向自尊题目上可能有低估自己的倾向。其实这正是谦虚偏差的表现。即一般人不会直接承认自己的优点(即赞同正向自尊量表上的题目),这才体现出含蓄和教养。这与先前研究是一致的。即中国被试在自尊量表上存在谦虚偏差,能辩证地认识积极和消极自我。
4. 讨论
4.1. 自尊量表中反向题目的使用
测验中是否该使用反向题目仍然是目前心理学界争论的热点。有人认为反向题目能起到认知减速器的作用,能促使被试在完全搞懂题目的意义后再作答。正向与反向题目的平衡使用可以抵消默认等反应偏差,相加得到的总分就较少包含测量误差,也就能更准确地计算与其它变量的关系 (Podsakoff, MacKenzie, & Podsakoff, 2012) 。
本研究从正向与反向自尊量表的信度、与外部效标的相关等方面都没有发现正向和反向自尊量表在信效度上的差异。而且有足够证据表明正向和反向自尊量表测量了同一种特质。尽管自尊量表中反向方法因素解释的总变异量大于正向方法因素,但二者对模型拟合的贡献又难分伯仲。只有同时纳入两种MF时模型拟合才能达到满意的水平。这些结果表明自尊量表及本研究所涉及的其他量表中反向题目的心理测量学性能并不比正向题目差。两类题目都会带来测量误差,都应该控制。综合以上分析我们赞同中国人的人格测量中应平衡使用正向和反向题目的结论 (Wu, 2008) 。

Table 4. Correlation between method factors and personality measures
表4. 方法因素与人格的相关
注:*p < 0.05。
4.2. 方法因素的性质
本研究发现不同人格量表中的MF具备同质性,MF与多个人格特质存在不容忽视的相关,说明MF不是随机误差而是系统误差,甚至是有用的人格变量。即不论测量的是哪些人格特质,只要采用反向(或正向)陈述的形式,有某些人格特征的人(如抑郁、神经质等)都会做出有规律性的、异常的应答模式。从被试在反向和正向陈述题目上得分的差异也能揭示出关于被试人格的有用信息。本研究发现正向和反向MF都与社会期望性量表(MCSD)存在低相关,这与以往研究是一致的。说明MF与社会赞许性不是同一种测验偏差。结合本研究和以往研究的发现,我们认为在抑郁、神经质、焦虑、回避动机、自我意识等方面表现出高分特点的被试容易受MF的影响,因此设计测验题目时要考虑这些被试的特点,对他们的测验分数要采用某种手段进行校正。
4.3. 中国人的自尊特征
Schmitt和Allik (2005) 的研究发现一个国家的文化特质会影响人们对反向自尊量表题目的理解,导致自尊量表得分的跨文化比较出现困难。几乎所有国家都存在反向题偏差,即正向自尊量表得分大于反向自尊量表。而且二者的差值越大测验信度越低。发达国家的差值都不大。比如差值最小的是德国(0),然后是其他欧美国家和日本等。差值最大的是墨西哥(3.4)和玻利维亚(3.3),非洲国家(如民主刚果为3.4)也比较大。集体主义强的国家趋中反应倾向明显,而且总分较低,比如日本(0.8)。尽管日本人的自尊得分低于美国人,自尊量表的心理测量学性能却与美国人相近。自尊量表的编写和标准化是在美国进行的,但却适用于与美国文化异质的日本。这显示了心理机制的普适性。但对非洲国家则不然。
本研究发现中国被试的自尊得分模式与10年前的香港和台湾有较大差异,但却更接近 Schmitt和Allik (2005) 研究中的发达国家。即中国人寻求自我统一性的需求增强了,另外在自尊量表的信效度、因素结构、正向与反向量表的相关上中国被试也接近发达国家。这应该能折射出几十年来中国人社会文化心态的变化。
同时中国被试在正向和反向自尊量表上的得分仍然体现了东方文化的特点。谦虚、含蓄,不直接承认自己的优点,也不掩饰自己的缺点,能辩证地认识自我的积极面和消极面等。
5. 结论
1) 自尊量表中的正向和反向题测量相同的因素,在信效度等心理测量学指标上没有实质性差异,因此应该平衡使用。而且这一结论可以推广到本研究所涉及到的人格测量工具。
2) 正向和反向MF在中国被试中都存在,但却没有破坏自尊的单维结构。用CTCM等技术将MF分离出来后就能估计自尊与其他研究变量间的真实关系。
3) 自尊及其他自陈式量表中的MF,可视为一种与测量工具有关的系统误差,或有用的人格变量。在抑郁、神经质、焦虑、回避动机、自我意识等方面表现出高分特点的被试容易受MF的影响。在解释测验结果时要考虑被试的人格特点,必要时应采用某种手段进行校正。
4) 对自尊量表进行跨文化比较时要考虑文化背景。中国被试在自尊量表上的得分体现了东方文化的特点,如谦虚、含蓄,能辩证地认识自我的积极面和消极面等。这一结论似乎也可以推论到其他自陈式人格测量。