1. 引言
学业拖延,又叫学习拖延,作为拖延在学习方面的体现,已经成为学校里司空见惯的一种现象,研究显示半数大学生有学业拖延行为(庞维国,韩贵宁,2009),而王莉华与高源月在2021年的研究更是表明,研究生群体中的学业拖延比例高达80% (王莉华,高源月,2021)。学业拖延往往导致学生将学习任务不断推迟,使得学习时间被压缩,进而影响学习成绩。同时,拖延还会让学生在面临未完成的学习任务时产生焦虑等负面情绪,影响心理健康。这种影响可能会在学生的日常学习和生活中慢慢积累,长此以往,可能会引发更严重的问题,比如焦虑症或者学习倦怠等情况的出现(Stöber & Joormann, 2001;姚进,赵芯禹,2023)。
只有对学业拖延进行深入研究,人们才能更好地认识它并加以有效控制。学业拖延影响学生的学习效率,学业拖延影响学生的学习效率,拖延使得学生无法合理安排学习时间,学习任务不断积压。在学校里,如果大量学生存在学业拖延现象,会导致教育资源(如教师的教学时间、教学设施等)不能得到充分有效的利用。研究学习拖延可以帮助教育者制定策略,提高学生对教育资源的利用率,从而提升整个教育体系的运行效率。从长远来看,在学业中养成拖延习惯的大学生和研究生,进入职场后往往也难以高效地管理时间,学业拖延反映了学生时间管理能力的不足(柯金佳,2023),和在学习任务上责任感的不足(江澜,2023),这种责任感的缺乏在职场中会使他们难以承担重要的工作任务,也难以获得领导和同事的信任。当大量学生因为拖延而未能充分发挥自己的学习潜力(咸金花,2024),他们进入社会后可能无法高效地投入到工作中,从而影响整个社会的创新能力和经济发展速度。研究学习拖延并找到有效的解决方案,有助于提高未来劳动力的整体素质,进而推动社会生产力的提升。
学业拖延现象不可忽视,有效的测量工具可以对其进行量化进而开展研究,许多学者基于对于学业拖延的独特的认识和理论基础,开发了不同的量表。Solomon等人将学业拖延看作在具体学习情境中,非必要地拖延学习活动并伴随着主观不适感的一种状况,编制了拖延评定量表-学生版(Procrastination As-sessment Scale-Students, PASS) (Solomon & Rothblum, 1984),包括不同情景和学习任务中个体的拖延状况和拖延原因两个部分。Bruce W. Tuckman等人对拖延下了定义,认为它是一种行为的倾向和特点(Tuckman, 1991),制定了单维Tuckman拖延量表(Tuckman Procrastination Scale),这个量表包含诸如浪费时间、拖延和故意推延应做之事等倾向方面的内容。Lay等人提出了不同的定义,他们认为拖延是整体活动的一部分,是在推迟既定任务所产生的行为,并伴随着特定的负面情绪,基于此编制了一般拖延量表(General procrastination scale, GPS)测量主要测量人们的发生在不同时间、不同情境中的拖延行为,为单维量表(Lay & Schouwenburg, 1993)。此外,随着对学业拖延研究的深入,以及时代的变化,国内外出现了新型学业拖延量表,如大学生线上学业拖延量表,行动阶段拖延量表(Action Phases Procrastination Scale, APPS)等等。
现有的拖延量表普遍侧重于拖延的行为和状态,忽视了拖延的情绪方面的表现。拖延是一种复杂的心理现象,是认知、情感和行为模式互相影响所形成的,有着不同的成分和表现形式。拖延行为或状态时常会有主观不适感相随,这种不适感为拖延的严重后果之一,只是在现有的拖延量表中,情感因素遭到忽视(毕翠华,2016)。拖延带来的消极情绪影响着人们的心理健康水平,拖延行为会增加人们的焦虑、抑郁水平(彭芳,2008),造成适应不良和消极认知(Flett et al., 2016)。诸多研究表明,在大五人格体系里,神经质这一维度和学业拖延之间存在着显著的相关性(王俐苹,刘丹,2017;张烨,2018),情绪在拖延行为和神经质之间起到了中介作用(王武,2017;Lee et al., 2006),具体而言,那些神经质水平比较高的人群,他们的情绪状态往往呈现出不稳定的特征。在遇到各类问题的时候,这类人群更容易采用诸如自我妨碍、逃避等消极的应对方式,而这些消极应对方式最终会致使拖延行为的产生(黄真浩等,2014)。学业拖延情绪成分连接着个体的认知和人格,其重要性可见一斑。
Bobe等人认为拖延是自愿推迟预定的任务或决定,伴随着主观上的不适和其他负面后果的行为,情绪是拖延定义的重要部分。针对现有学业拖延量表的不足,Bobe等人编制了行为和情绪的学习拖延量表(BEPS) (Bobe et al., 2022),包括拖延行为(ds)和主观不适(sds)两个维度,拖延行为分量表较为精确地概括了学生常见的拖延行为,主观不适分量表突出了情感因素在拖延中的作用,BEPS涵盖了拖延定义的所有方面,弥补了已有量表内容效度方面的不足。BEPS将拖延行为从具体的情景中抽离出来,把拖延视为一种习惯性行为,用于测量学生拖延的一般倾向,有利于推进学业拖延的研究和干预。另外,BEPS仅有6个条目,在保证测验质量的同时,极大地节约了测验者的时间和精力,适合大样本数据的收集。BEPS在国外学生群体中具有较好的信效度,能够很好地反映学生的拖延状态。本研究拟修订行为和情绪的学习拖延量表中文版,并进行信效度检验,为大学生学业拖延行为提供有效测量工具。本研究使用Aitken拖延问卷(Aitken Pro-crastination Inventory, API)和简版一般拖延量表(Short General Procrastination Scale, SGPS)作为拖延行为(ds)的效标量表,中国大五人格问卷简式版——神经质分量表(Chinese Big Five PersonalityInventory brief version, BFI-PI-B)作为主观不适(sds)的效标量表,从不同的方面验证量表修订的有效性。
经典测量理论CTT的原理相对简单,易于理解,模型参数呈现出直观的特性,并且在实施的时候,对条件的要求并不严格,所以被广泛应用于问卷修订与编制。不过,CTT也有明显的缺点,例如测量结果极度依赖样本,参数与被试水平参照各异,而且信度方面也不够精确(俞晓琳,1998)。项目反应理论IRT着重构建各数据拟合模型,确定被试潜在特质值和其项目反应间的联系,这弥补了CTT所存在的不足(孙晓敏,关丹丹,2009)。IRT具有独特的优点,其项目参数独立于样本群体;具有参数不变性;项目参数的难度和区分度相互独立,猜测参数可计算,因而更具科学性。CTT和IRT两者在问卷修订中,可以取其精华,对量表进行客观全面的评价。本研究基于CTT理论进行项目分析、信效度检验,并使用IRT技术对问卷条目进行分析,计算各个条目的难度、区分度和项目信息量,对BEPS的条目参数进行更加直观和科学的呈现。
2. 对象和方法
2.1. 被试
样本1:采用方便抽样的方法,在线上向天津某高校大学生群体发放问卷,回收有效问卷457份,有效率92.0%,用于项目分析、探索性因素分析和信度分析。其中男性112人(24.5%),女性345人(75.5%),大一129人(28.2%),大二28人(6.1%),大三40人(8.8%),大四187人(40.9%),研究生及以上73人(15.9%),平均年龄为21.41 ± 2.08岁。
样本2:采用方便抽样的方法,在线上向大学生群体发放问卷,回收有效问卷526份,有效率为89.9%,用于验证性因素分析和信效度分析。男性178人(33.8%),女性348人(66.2%),大一161人(30.6%),大二115人(21.9%),大三131人(24.9%),大四41人(7.8%),研究生及以上78人(14.8%),平均年龄20.93 ± 2.17岁。
样本3:在样本1群体中随机抽取50人,四个月之后进行重测,用于分析问卷的重测信度。
2.2. 研究工具
2.2.1. 行为和情绪的学习拖延量表(Behavioral and Emotional Academic Procrastination Scale, BEPS)
由Bobe等人编制,共6道题目,包括拖延行为(ds)和主观不适(sds)两个维度,采用Likert 5点计分(1 = 从不,5 = 总是),得分越高,学业拖延程度越强。
2.2.2. Aitken拖延问卷(Aitken Procrastination Inventory, API)
该问卷由Aitken于1982年编制,用于评估大学生持续性拖延行为。陈小莉等人修订为中文版(陈小莉等,2008),问卷为单维度,共19个题目,采用Likert 5点计分(1 = 完全不符合,5 = 完全符合),得分越高表明拖延水平越高。
2.2.3. 简版一般拖延量表(Short General Procrastination Scale, SGPS)
该量表由Sirois等人在一般拖延量表的基础上开发形成,张亚利等人修订为中文版(张亚利等,2020)。该量表为单维度,共9个题目,3道题目为反向计分,采用5点计分(1 = 完全不符合,5 = 完全符合),得分越高个体的拖延倾向越明显。
2.2.4. 中国大五人格问卷简式版——神经质分量表(Chinese Big Five PersonalityInventory Brief Version,
BFI-PI-B)
采用王孟成等人编制的(王孟成等,2011),共8道题目,1道题目反向计分,采用6点计分(1 = 非常不符合,6 = 非常符合),得分越高,特质表现越明显。
2.3. 统计方法
使用SPSS27.0进行项目分析、探索性因素分析和信效度检验,使用R 4.3.0软件进行IRT项目分析,运用于Mplus8.0进行验证性因素分析和等值性分析。
3. 结果
3.1. 项目分析
使用样本1对该问卷的6个条目进行项目分析。根据被试的BEPS总分将得分的前27%设定为低分组,将后27%设置为高分组,进行独立样本T检验,结果表明高分组和低分组在6个条目上得分差异显著。将每个条目的得分与总分进行相关分析,均显著相关,结果见表1。
本研究基于IRT中的等级反应模型GRM进行项目分析,BEPS量表为两维度,使用R软件中的mirt包进行模型计算。进一步分析BEPS的6个条目的难度、区分度,结果可见表2。BEPS采用Likert 5点计分,每个条目会产生4个难度系数,6个条目的难度系数在−2.183~1.497之间,均在−4~4的区间内,难度适中,且呈单点递增的趋势,符合统计学标准。区分度数值越大代表量表越能区分不同特质水平的被试,BEPS条目区分度均在2.068以上,具有良好区分度(刘叶等,2022)。
Table 1. T-tests for each item, item-total correlation coefficients, and factor loadings
表1. 各条目T检验、题总相关系数及因子载荷量
条目 |
t |
r |
因子载荷 |
拖延行为 |
主观不适 |
b1我在开始完成学习任务之前没有必要地浪费了很多时间。 |
−17.845** |
0.713** |
0.806 |
|
b2我本可以开始学习任务,但是我会选择先做一些别的事情。 |
−18.875** |
0.734** |
0.868 |
|
b3即使有机会开始尚未进行的学习任务,我也不会立即去做。 |
−16.283** |
0.661** |
0.867 |
|
b4我在毫无必要地拖延学习任务时感到难过。 |
−19.911** |
0.760** |
|
0.880 |
b5我在无缘无故地拖延学习任务时感到内疚。 |
−17.969** |
0.732** |
|
0.917 |
b6我在不必要地拖延学习任务期间感到担忧。 |
−18.162** |
0.761** |
|
0.865 |
注:**代表P < 0.01,下同。
Table 2. Parameters for each item project
表2. 各条目项目参数
条目 |
a |
b1 |
b2 |
b3 |
b4 |
1 |
2.068 |
−2.183 |
−0.997 |
0.026 |
1.497 |
2 |
3.799 |
−1.884 |
−0.726 |
−0.056 |
1.207 |
3 |
2.290 |
−1.746 |
−0.676 |
0.041 |
1.357 |
4 |
3.085 |
−1.888 |
−0.916 |
−0.161 |
1.211 |
5 |
4.228 |
−1.783 |
−0.826 |
−0.174 |
0.963 |
6 |
2.948 |
−1.782 |
−0.914 |
−0.132 |
1.218 |
注:a为项目区分度;b为项目难度。由于本量表为五级计分,所以难度参数共有四个,b1为选项1与选项2交点;b2为选项2与选项3的交点;b3为选项3与选项4的交点;b4为选项4与选项5的交点。
3.2. 效度分析
3.2.1. 探索性因素分析
使用样本1进行探索性因素分析,KMO值为0.777,巴特莱特球性检验值为1360.988 (P < 0.001),数据可以进行因素分析。使用主成分分析法提取因子,最大方差法进行旋转,提取特征值超过1的因子2个,参照原量表命名为拖延行为和主观不适,条目1~条目3属于拖延行为,条目4~条目6属于主观不适,累积解释率78.185%,6个条目的因子负荷量在0.806~0.917之间,均符合测量学标准,结果可见表1。
3.2.2. 验证性因素分析
使用样本2对6个条目进行验证性因素分析,模型拟合结果为,CFI = 0.997,TLI = 0.995,SRMR = 0.021,RMSEA = 0.025,两因素模型拟合指数良好。
3.2.3. 效标效度
使用样本2进行效标关联效度检验,行为和情绪学业拖延量表的总分及各维度与Aitken拖延问卷,简版一般拖延量表,中国大五人格问卷简式版——神经质分量表均呈现显著正相关,表明结果见表3。
Table 3. Total BEPS score and criterion-related validity of each dimension
表3. BEPS总分及各维度效标关联效度
|
API |
SGPS |
BFI_PI_B |
BEPS |
0.407** |
0.339** |
0.399** |
ds |
0.380** |
0.364** |
0.352** |
sds |
0.279** |
0.184** |
0.293** |
3.3. 信度分析
使用样本1和样本2,测得行为和情感学业拖延量表总分及各维度的Cronbach’s α系数为0.795,0.802和0.852。4个月之后进行重测,行为和情感学业拖延量表总分及各维度重测信度分别为0.721,0.735和0.867。
3.4. 等值性分析
使用Mpuls 8.0对样本1和样本2的行为和情感学业拖延量表进行跨性别和跨年级的等值性检验。结果显示,形态等值、弱等值、强等值、严格等值4个模型的CFI、TLI、RMSEA等指数均达到了心理测量学基本要求,且每一步的测量等值性检验ΔCFI和ΔTLI均小于0.01,可见表4。说明BEPS在形态,因子载荷,截距以及相同指标的误差方差等方面具有跨性别等值性(Putnick & Bornstein, 2016)。使用同样的方法对样本1和样本2进行跨年级的等值性检验,结果表明BEPS在形态、因子载荷,截距以及相同指标的误差方差等方面具有跨年级的等值性,结果可见表5。
Table 4. BEPS cross-gender measurement invariance testing
表4. BEPS跨性别测量等值性检验
条目 |
模型拟合 |
模型比较 |
|
Χ2 |
df |
RMSEA |
CFI |
TLI |
SRME |
△CFI |
△RMSEA |
形态等值 |
47.463 |
16 |
0.063 |
0.987 |
0.975 |
0.032 |
|
|
单位等值/弱等值 |
51.005 |
20 |
0.056 |
0.987 |
0.980 |
0.035 |
0 |
−0.007 |
尺度等值/强等值 |
66.392 |
24 |
0.060 |
0.982 |
0.977 |
0.035 |
−0.003 |
0.004 |
误差方差等值/严格等值 |
98.707 |
30 |
0.068 |
0.971 |
0.971 |
0.048 |
−0.011 |
0.008 |
Table 5. BEPS cross-grade measurement invariance testing
表5. BEPS跨年级测量等值性检验
条目 |
模型拟合 |
模型比较 |
|
Χ2 |
df |
RMSEA |
CFI |
TLI |
SRME |
△CFI |
△RMSEA |
形态等值 |
146.722 |
70 |
0.078 |
0.965 |
0.948 |
0.067 |
|
|
单位等值/弱等值 |
156.727 |
86 |
0.067 |
0.968 |
0.961 |
0.071 |
0.003 |
−0.011 |
尺度等值/强等值 |
171.319 |
102 |
0.061 |
0.969 |
0.968 |
0.074 |
−0.006 |
−0.006 |
误差方差等值/严格等值 |
232.583 |
126 |
0.068 |
0.952 |
0.960 |
0.086 |
0.007 |
0.007 |
3.5. 人口学变量分析
对样本1和样本2的数据进行人口学变量的数据分析,结果发现BEPS,ds和sds得分在性别上存在显著差异,女性得分显著高于男性。BEPS和ds得分在年级上具有显著差异,大四年级被试的BEPS得分显著高于大一和大三年级,研究生被试的BEPS得分显著高于大一年级,其他年级无显著差异。大四年级和研究生年级的ds得分显著高于其他年级,数据结果可见表6和表7。
Table 6. Total BEPS score and gender differences in scores across dimensions
表6. BEPS总分及各维度不同性别得分差异
|
男性(n = 290) |
女性(n = 693) |
T |
BEPS |
19.07 ± 4.61 |
20.06 ± 4.57 |
−4.722** |
ds |
9.29 ± 2.74 |
9.99 ± 2.81 |
−3.635** |
sds |
9.78 ± 2.93 |
10.61 ± 2.82 |
−4.114** |
Table 7. Total BEPS score and grades differences in scores across dimensions
表7. BEPS总分及各维度不同年级得分差异
|
大一 (n = 290) |
大二 (n = 143) |
大三 (n = 171) |
大四 (n = 228) |
研究生及以上 (n = 151) |
F |
BEPS |
19.39 ± 4.59 |
20.27 ± 4.63 |
19.72 ± 4.28 |
21.11 ± 4.81 |
20.52 ± 4.58 |
5.091** |
ds |
9.31 ± 2.81 |
9.78 ± 2.72 |
9.46 ± 2.70 |
10.51 ± 2.69 |
9.96 ± 2.97 |
6.751** |
sds |
10.08 ± 3.01 |
10.05 ± 2.95 |
10.26 ± 2.62 |
10.60 ± 2.95 |
10.56 ± 2.72 |
1.376 |
4. 讨论
学业拖延研究依赖测量工具,国内常用量表忽视情绪内容,受限于学习情景、题量多等因素。基于这样的情况,而本研究引入的行为和情绪学业拖延量表,它能够涵盖情绪内容,不受特定学习情景的限制,题量也更为合理。因此希望通过这个新的量表为学业拖延提供一种全新的测量工具。学业拖延研究具有多方面的社会重要性。在教育领域,有助于优化教育资源的利用,教师不必因学生拖延而过度耗费精力督促,能提升整体教育效率。同时可促使教育制度和课程设置更完善,从根源上减少拖延现象。其次,从人才培养角度看,大学生和研究生是未来劳动力的主力,学业拖延习惯可能延续到职场,研究学业拖延能提前干预,提升未来劳动力的综合素质。而且,这一研究有助于倡导积极社会价值观,营造积极向上的社会文化氛围,对社会稳定和发展意义深远。
项目分析结果表明,各条目高低组差异显著,鉴别力良好,与总分显著相关,量表整体具有较高的同质性。根据项目反应理论,各条目的难度和区分度符合测量学标准。探索性因素分析表明该量表为两因素结构,与原量表结构一致,根据原量表将两因素命名为拖延行为和主观不适。验证性因素分析模型拟合度良好,表明该量表具有较高的结构效度。行为和情绪学业拖延量表与效标量表,Aitken拖延问卷、简版一般拖延量表、中国大五人格问卷简式版——神经质分量表呈显著正相关,表明该量表具有较好的效标关联效度,可以有效测量学业拖延行为和一般状态,也反映了拖延所伴随的负面情绪。此外该量表的各维度和总分的Cronbach’s α系数在0.795~0.852之间,重测信度在0.721~0.867之间,符合测量学标准,具有较好的信度。等值性检验的结果表明该量表在性别和年级上具有测量等值性。
本研究中,女生的学业拖延情况比男生严重,与已有的研究结果不同(唐庆鑫等,2017;郑茜茜等,2018)。本研究所使用的行为和情绪学业拖延量表增加了拖延的情绪部分,更加全面的测量学业拖延的状态。女生心思细腻,更加关注情绪问题,在拖延过程对自身产生的负面情绪有更加清晰的觉察,导致主观不适得分会高于男生。究其原因是多方面的,性别刻板印象让女生在学习数理内容不自信进而逃避,现有的教学风格偏向男性的思维方式,学习环境更加强调竞争等等。大四年级学生的学业拖延问题严重,他们除学业任务以外,还要考虑实习、毕业求职、考公考研等问题,未来的不确定和社会过高的期望压力造成了毕业年级的心理状况比一般年级更加复杂的现象,他们经常面临多任务叠加的情况,需要同时处理重要事务,在时间规划时比对一些任务进行必要的拖延。研究生的学习很大部分与科研任务挂钩,学业压力更大,研究进展不顺利,实验结果不理想是经常出现的情况,很容易产生学业拖延的现象。大四年级学生和研究生的学业拖延受客观因素的影响较大,因此他们的BEPS和拖延行为维度得分显著高于其他年级学生,主观不适维度得分并没有显著差异。
5. 结论
综上所述,本次修订的行为和情绪的学业拖延量表项目分析及信效度均符合测量学要求,可以适用于中国大学生群体,进行学业拖延状况和特质的测量。该量表对拖延情绪方面的重视也有利于推进学业拖延的相关研究。本研究在大学生群体中施测,未来可以考虑在其他群体中进行施测。