1. 引言
学生的学业成绩是一直教育工作者、心理学家研究的热点问题。许多学者认为学业成绩主要受到智力的和非智力的因素的影响 [1],其中主要的非智力因素包括自我效能感、归因、成就目标定向等 [2] [3] [4] [5]。
班杜拉认为自我效能感是人类动因的中心机制,是人们行动的重要基础 [6]。作为一种重要的非智力因素,自我效能感通过影响个体的认知过程、动机过程、情感过程和选择过程而调节人类活动 [7]。Schunk的实验结果表明:无论学习任务处于何种难度水平或对待被试的方式如何,自我效能是一个对学业成绩的良好预测指标 [8]。
高中学生的数学学业成绩无疑与学生的自我效能感有关。在前期的研究中,我们参照边玉芳博士的《学习自我效能感量表》 [9]、倪颍丽的《数学学习自我效能感调查问卷》 [10],结合高中数学学科特点,编制了《数学学习自我效能感量表》进行了实证研究。本文我们将在此基础上,就基于数学学习的自我效能感对数学学业成绩的预测开展研究,给出合理的学业成绩的预测模型。为方便计,下文中所说的自我效能感指的是数学学习的自我效能感。
2. 数据来源
以淮安市淮海中学高一年级的学生为调查对象,共获得了108名同学的自我效能感与数学成绩数据,其中女生占比为47.2%,男生占比为52.8%。部份观测数据参见文末附录。处理数据所用的软件是SPSS19.0 [11]。
调查问卷采用四点李克特量表,其有35个变量,以平均得分来衡量学生的数学学习的自我效能感水平,并以平均得分参与建模,变量名为“自我效能感得分”。参与建模的数学成绩分两种级制,其一是百分制,总分为150分,变量名为“数学成绩”;其二是等级制,共分优、良、中、差四级,变量名为“学业等级”。
3. 基本统计分析
表1给出了数学成绩与自我效能感得分的基本统计量,其中数学成绩的最高分为146分,最低分为47分,均值为97.53分,标准差为21.393;而自我效能感得分的最低分为1.63,最高分为3.43,均值为2.496,标准差为0.33059。

Table 1. Descriptive statistics of academic performance and self-efficacy in math
表1. 数学成绩与自我效能感得分的基本统计量
为了研究数学成绩与自我效能感得分是否存在线性关系,我们计算了二者之间的相关系数,对是否线性相关进行了假设检验,结果如表2。假设检验的p-值几近为0,若取显著性水平为0.05,则拒绝原假设,认为数学成绩与自我效能感是相关的。另一方面Pearson相关系数为0.795,表明二者之间呈正相关且具较高的线性相关性,因此可以尝试进行线性回归分析。为方便计,在接下来的所有假设检验问题中,所取的显著性水平皆为0.05。

Table 2. The correlation between academic performance and self-efficacy in math
表2. 数学成绩与自我效能感得分的相关系数
关于性别及家庭教育方式是否对数学成绩产生显著影响,我们进行了双因素方差分析,结果如表3所示,其中家庭教育方式分为“民主”、“放任”、“严厉”与“专制”四种类别。这里我们仍然取显著性水平为0.05,不难发现无论是“性别”、“家庭教育方式”还是这二者交互都不会对学生的数学成绩产生显著影响,因为它们所对应的p-值分别为0.720、0.843和0.640都大于显著性水平。因此,在进行线性回归分析以及Logistic回归时都不考虑这两个因素的影响。

Table 3. Two-way ANOVA of the gender and family education on the math academic performance
表3. 性别与家庭教育方式对数学成绩影响的双因素方差分析
4. 基于自我效能感的数学成绩的线性回归模型
这一节我们采用加权最小二乘法 [12],以数学成绩作为被解释变量,以自我效能感作为解释变量建立线性回归模型,其中权重为残差的平方的倒数。
统计计算的结果依次呈现在表4~8中。表4表明采用加权最小二乘法可以获得很高的拟合优度:0.987,表明利用加权最小二乘法得到的回归直线很好地拟合了数据点。
表5给出了利用方差分析的方法对回归方程的显著性进行检验的结果。可以看出F检验的p-值几近为0 (<显著性水平0.05),表明被解释变量与所有的解释变量间存在线性关系。

Table 5. Significance test of regression equation
表5. 回归方程的显著性检验
表6给出加权线性回归方程的系数以及对回归系数是否为0进行了检验,检验的p-值也几近为0 (<0.05),表明回归方程中变量“自我效能感得分”的系数与0有显著差异,也即“自我效能感得分”与被解释变量“数学成绩”间有显著的线性关系。由表6可得回归方程为
(1)

Table 6. Significance test of regression coefficients
表6. 回归系数的显著性检验
接下来我们检验模型的合理性。表7给出了残差的正态性检验,结果表明K-S检验的p-值为0.280,在显著性水平为0.05的条件下接受原假设,认为残差呈正态分布。而表8中的t检验表明,残差的均值在显著性水平为0.05的条件下与0无显著差异。这里的两个检验表明模型的残差是满足线性回归分析的先决条件的。

Table 8. One sample t-test of residuals
表8. 残差的单样本t检验
进一步地,我们对残差进行了异方差分析,通过计算得残差的绝对值与解释变量的Spearman等级相关系数为−0.082,而检验的p-值为0.402,这两个数据表明,在显著性水平为0.05的条件下,残差序列不存在异方差情形(见表9)。以上结论表明,这里所建立的线性回归模型是一个合理的预测模型。

Table 9. Spearman correlation coefficient
表9. Spearman等级相关系数
5. 基于自我效能感的数学成绩的Logistic回归模型
我们将数学成绩按等级计分,127~150分记为“优”,105~126分记为“良”,90~104分记为“中”,90分以下记为“差”,从而将成绩分成四个等级,在模型中的变量名为“学业等级”,且规定变量“学业等级”取值1、2、3、4分别代表“优”、“良”、“中”、“差”。本节我们以“自我效能感得分”作为解释变量,以“学业等级”作为被解释变量,将“差”级作为参考类别,建立多项Logistic回归模型:
(2)
表10给出了观测数据中学业等级的分布情况,其中“优”、“良”、“中”、“差”占比分别为8.3%、26.9%、28.7%和36.1%。“优”级最少,“差”级最多。
三个测度拟合优度的指标在表11中给出,其中Cox and Snell R2、Nagelkerke R2和McFadden R2分别为0.535、0.580和0.298,显然都不是很高,但是处于可接受水平。从表12中可以发现拟合度的Pearson卡方检验的p-值为0.999,大于显著性水平0.05,表明模型对原始数据的似合通过检验,即被解释变量的实际类别值的与预测类别值的分布无显著差异。
表13表明在回归方程中引入变量“自我效能感得分”后,其卡方检验的p-值近似为0,在显著性水平是0.05的条件下,变量“自我效能感得分”对Logit P的贡献是显著的。
回归模型的参数估计及Wald检验的结果见表14,或以发现在三个模型中,变量“自我效能感得分”所对应的p-值均小于显著性水平0.05,因此,在三个模型中变量“自我效能感得分”的回归系数与0均有显著性差异,也即变量“自我效能感得分”与Logit Pi (i = 1, 2, 3)有显著的线性关系。三个模型的回归方程依次为:
(3)
(4)
(5)
表15给出了利用上述模型进行预测的各级别的正确率,结果表明,对于学业等级为“优”、“良”、“中”、“差”的预测正确率分别为77.8%、62.1%、22.6%及71.8%,总正确率为55.6%。尽管总正确率不是太理想,但是对于“优”、“良”、“差”预测正确率较高,因此该模型有一定的实用价值。
6. 结论
1) 学生的性别、家庭教育方式以及它们的交互对学生的数学成绩没有显著影响。
2) 学生的数学成绩与数学学习的自我效能感呈正相关,用线性回归模型对数学成绩进行预测,且具较高的拟合优度。
3) Logistic回归模型对以等级制给出的数学学业等级进行预测时,并不能对所有的类别都得到较高的预测准确率,在本文的研究中,Logistic回归模型对于“优”、“良”、“差”预测正确率较高,但是对“中”的预测正确率不高。
基金项目
江苏省教育科学“十三五”规划2017年度课题(D/2016/01/98)。
附录

Table A1. A part of the observation data of the self-efficacy in mathematics learning and academic performance in math
表A1. 数学学习的自我效能感与数学学业成绩的部分观测数据
NOTES
*通讯作者。