1. 引言
学业成绩(academic achievement)是学生课业学习掌握水平的直接反映,是评价学校教育质量高低的关键指标,并且是反映教育资源是否均衡的重要指标(梁兴丽等,2020)。学生学业成绩往往受多方面因素影响,易芳等人将学生学业成绩影响因素分为个人因素(动机、自我效能感、成就目标定向)、家庭因素(父母教养方式)和学校因素(师生关系、同伴关系) (易芳等,2017),李强等人将学生学业成绩影响因素分为个人、家庭、学校和社会四个维度(李强,卢尧选,2019),张娜等人通过对近20年我国学生数学学业成就影响因素研究文献进行统计分析发现学生数学学业成就主要受学生、教师、学校、家庭四方面影响(张娜,徐永琳,2019)。综上,可将初中生学业成绩的主要影响因素分为个人、家庭、教师和学校四个层面。在学生个体上,影响学生成绩的因素既有认知因素又有非认知因素(熊俊梅等,2011),如认知策略能够显著提升学生学习成绩(唐一鹏等,2020),学习动机、兴趣、情感、意志、性格等非认知因素也会影响学生的学业成绩(姚云,2017)。为此,本研究假设学生成绩会受到学生认知能力和非认知能力的共同影响,包括认知能力、学习态度、学习毅力、好奇心、兴趣爱好与实践等多方面影响。在家庭层面上,有研究表明家庭经济、社会、文化地位会对学生成绩具有正向影响(闫波等,2017),父母期望、父母教育方式和态度对学生学业成绩均具有影响(涂咏梅,徐彦坤,2013)。在教师层面上,教师关怀行为会正向影响学生学业成绩(雷浩等,2015),因材施教、参与式教学和引导探究等教学策略能够显著提升学生成绩(唐一鹏等,2020)。在学校层面上,影响学生学业成绩的因素涉及设备水平(马红梅等,2020)、学校纪律与风气(赵春花,2014)、家校合作(李哲等,2019)等方面。
已有关于学生学业成绩影响因素的研究存在以下不足:第一,初始影响因素和指标主要通过文献梳理后自主确立,指标个数不够全面,有相当一部分研究只选择个别影响因素进行分析讨论,容易忽视重要影响因素;第二,很少比较影响因素之间的重要程度;第三,即使使用量化方法进行变量选择,也未对模型效果进行比较检验。国内鲜有学者采用LASSO方法研究学生学业成绩影响因素,LASSO方法具有以下优点:第一,能够对初始影响因素进行客观筛选,通过训练模型的方式,对模型进行检验优化参数,客观确定最终影响因素;第二,能够通过对回归系数给予一定的约束,将不相关或者相关性不大的变量的回归系数直接压缩为0;第三,能够处理高维数据,随着科技的发展,“互联网+教育”已经成为一种新的教育模式,中国正在迈入教育大数据时代,传统指标筛选方法将很难在海量数据中选择有效变量,LASSO回归能够很好地进行变量降维处理,选择少量核心影响变量;第四,防止模型过拟合,LASSO回归加入惩罚项,使得模型的泛化能力更佳,筛选的指标预测效果更好。为全面科学地考虑并确定初中生学业成绩的主要影响因素,研究选择主客观相结合的方法进行探析。在文献梳理以及专家咨询的基础上,尝试使用统计学领域中前沿的LASSO方法进行变量选择(张兴祥等,2018),从个人、家庭、教师和学校四个方面较为全面地分析学生学业成绩影响因素。研究将重点回答以下三个问题:1) 影响初中生学业成绩的核心变量是什么?2) 这些核心变量对初中生学业成绩的影响有多大?3) 初中生学业成绩有效提升路径为何?
2. 研究设计
2.1. 数据来源
结合文献梳理情况,通过咨询8位从事基础教育和教育统计研究的专家,从中国教育追踪调查数据库(CEPS2014-2015) (王卫东,2022)中初步筛选了44个影响变量。其中,因变量是学生学业成绩,由学生语文、数学、英语期中考试成绩构成,各科满分均为150分,本文取学生三科成绩总分为学生学业成绩。特征变量包含性别、户口类型、是否独生子女、是否恋爱,自变量包括个人因素、家庭因素、教师因素和学校因素四个层面,具体情况如表1所示。其中个人因素包括认知能力、态度与品质、身心健康、兴趣爱好与实践、与同伴关系五个二级指标和认知能力等13个观测变量;家庭因素包括家庭经济状况、父母受教育程度、家庭关系、父母关心与期望、父母指导五个二级指标和家庭经济条件等9个观测变量;教师因素包括对学生关注度、教学方式、考核压力、学生尊重、教师待遇、工作态度六个二级指标和课堂关注等9个观测变量;学校因素包括学校纪律与管理、学校设备、家校合作三个二级指标和学校学习风气等9个观测变量。
Table 1. Initial variables affecting the academic performance of junior high school students
表1. 初中生学业成绩影响因素初始变量情况
一级指标 |
二级指标 |
三级指标 |
一级指标 |
二级指标 |
三级指标 |
个人因素 |
认知能力 |
认知能力 |
教师因素 |
对学生关注度 |
课堂关注 |
态度与品质 |
学习态度 |
课堂提问 |
学习毅力 |
经常表扬 |
好奇心 |
教学方式 |
互动式教学 |
身心健康 |
身体健康情况 |
教学媒体使用 |
睡眠时间 |
考核压力 |
教师压力 |
心理健康 |
学生尊重 |
学生尊重 |
自我调节能力 |
教师待遇 |
薪资 |
学业压力 |
工作态度 |
工作满意度 |
兴趣爱好与实践 |
兴趣爱好种类 |
学校因素 |
学校纪律与管理 |
学校学习风气 |
活动参与 |
班级风气 |
与同伴关系 |
与同学关系 |
学校纪律 |
朋友个数 |
管理方式满意度 |
家庭因素 |
家庭经济情况 |
家庭经济条件 |
教师流动 |
父母受教育程度 |
父母最高受教育程度 |
去年教师培训次数 |
家庭关系 |
父母婚姻状况 |
学校设备 |
学校设施情况 |
父母是否经常吵架 |
家校合作 |
家校配合 |
父母关心与期望 |
父母关心情况 |
家校互动 |
期望孩子班级成绩 |
特征变量 |
性别 |
期望孩子受教育程度 |
户口类型 |
父母指导 |
上周检查作业天数 |
是否独生子女 |
上周指导功课天数 |
是否恋爱 |
2.2. 变量选择
LASSO (Least absolute shrinkage and selection operator)是Robert Tibshirani于1996年首次提出,该方法是一种压缩估计(Tibshirani, 1996)。LASSO回归在最小二乘法的基础上加入了系数为λ惩罚函数,使得回归中较小系数能够降至零,有利于进行变量筛选。LASSO方法通过在模型估计中引入惩罚项的方式,可以获得更高的预测准确度和模型概化能力,同时也可以有效地处理过拟合和多重共线性问题(张沥今等,2020)。Hastie等人对LASSO方法进行了介绍,并和其他变量筛选方法进行了比较(Hastie et al., 2008),LASSO方法回归方程及约束条件如下:
(1)
其中,约束条件为
,
。
或
(2)
其中,
为惩罚系数,且
。
公式(1)和公式(2)等价,公式(2)更加直观地看出惩罚项系数λ。可以通过BIC、AIC准则或交叉验证来选择最优调节系数λ,从而根据λ值筛选出有效变量。如果模型拟合值为线性模型的均方误差(MSE),一般选择使MSE最小的λ值,但是此时回归系数压缩幅度较小,可能不能完全解决过拟合的问题,因此也有研究建议选择大于最小均方误差一个标准误时对应的参数λ值(张沥今等,2020)。
2.3. 研究思路
为消除量纲对LASSO回归的影响,本研究首先对所有非0~1变量进行Z-score标准化处理,然后采用R语言对因变量和40个自变量以及4个特征变量进行LASSO回归筛选影响学生学业成绩的核心变量,接着通过总样本回归和分样本回归来分析学生学业成绩影响因素,最后根据研究结果给出提高初中生学业成绩的对策建议。
3. 研究结果
3.1. LASSO变量筛选过程
本研究采用十折交叉验证法对λ进行选择,可以选择使模型均方误差最小的参数λ1或均方误差在一个标准差以内的最大的λ2。将训练集与测试集样本量按照7:3的比例进行随机抽样,即训练集4808个,测试集2060个,参考James等人的方法与代码思路(James et al., 2013;薛震,孙玉林,2020),使用R语言中的glmnet函数,通过对训练集进行十则交叉验证,考虑到λ1压缩剔除变量较少,很有可能存在模型过拟合现象,因此选择使模型均方误差在一个标准差以内的最大的λ值,λ值为0.022923。将λ值带入测试集进行LASSO回归,比较LASSO模型、空模型和最小二乘模型在测试集上预测结果的均方误差大小,发现LASSO回归的均方误差MSE为0.54,空模型的MSE为0.61,最小二乘回归的MSE为0.54。可见LASSO模型均方误差值相对较小,性能优良,将λ值带入训练集更新LASSO回归模型,通过LASSO回归剔除了25个变量,最后保留了19个影响变量,分别是特征变量中的“性别”和“户口类型”2个变量,个人因素中的“认知成绩”“学习态度”“学习毅力”“睡眠时间”“自我调节能力”“学业压力”“兴趣爱好种类”“朋友个数”8个变量,家庭因素中的“父母关心情况”“期望孩子班级成绩”“期望孩子受教育程度”“上周指导功课天数”4个变量,教师因素中的“课堂提问”“互动式教学”2个变量,学校因素中的“学校学习风气”“教师流动”“家校互动”3个变量。
3.2. 回归分析结果
对LASSO筛选后剩下的19个变量采用最小二乘法进行总样本回归,然后根据性别、户口类型变量进行分样本回归,回归结果如表2所示。
3.2.1. 特征变量
在性别上,男女生之间学业成绩影响因素存在差异。男生学业成绩受户口类型影响,同时也受到兴趣爱好种类和教师课堂提问的正向影响,而女生并不受影响;女生学业成绩受自我调节能力、父母关心情况的正向影响,而男生并不受影响。在户籍所在地上,城乡学生学业成绩影响因素存在差异。农村学生学业成绩受课堂提问、学校学习风气的正向影响,受朋友个数、上周指导功课天数、教师流动的负向影响,而城市学生并不受影响;城市学生受自我调节能力、兴趣爱好种类、互动式教学的正向影响,而农村学生并不受影响。就学业成绩来看,男生成绩不论是在农村还是在城市都比女生差,从标准化回归系数可以发现农村学生学业成绩性别差异比城市学生大。
3.2.2. 个人因素
在个人因素中,从总样本回归结果可以看出,学生认知能力、学习态度、学习毅力和兴趣爱好种类对学业成绩起到正向影响作用,睡眠时间、学业压力对学业成绩起到负向影响作用,而自我调节能力并未表现出影响作用。分样本回归结果可以看出,学生认知能力、学习态度在四个分组下对学生成绩均有正向影响,而睡眠时间、学业压力在四个分组下对学生学习成绩均有负向影响。在睡眠时间方面,有学者通过对CEPS数据进行分析发现初中生学业成绩与学生睡眠时间呈倒“U”型关系(刘娜,沈亚茹,2019),当睡眠超过8小时学生学业成绩会随睡眠时间增加而下降。本研究中出现负向影响可能是因为有64.7%的学生睡眠时间在8小时及以上。此外,女生和城市学生学业成绩受到自我调节能力的正向影响,而男生和农村学生并不受其影响;男生和城市学生学业成绩受到兴趣爱好种类的正向影响,而女生和农村学生并不受其影响。
3.2.3. 家庭因素
在家庭因素中,父母关心情况、期望孩子班级成绩和期望孩子受教育程度对学业成绩起到正向影响作用,而父母上周指导功课天数对学业成绩起到负向影响作用,但男生学业成绩并不受父母关心情况影响,城市学生学业成绩并不受父母上周指导功课天数影响。从标准化回归系数大小可以看出父母期望对学生学业成绩有较大影响,这与相关研究结论一致(赵必华,2013)。但城乡之间存在差异:对于农村学生来说,父母短期期望如期望孩子班级成绩相比长远期望对孩子的影响更大;而对于城市孩子来说,父母长远期望如期望孩子受教育程度相比短期期望对学生成绩影响更大。农村学生父母的文化水平普遍要低于城市学生,父母对学生未来长远期望与规划不足,但是非常重视教育,教育投入占比很大,关心学生在班级中的学习成绩。城市父母更加关注学生全面发展,不太在意学生一两次考试结果,更加关注学生长远发展,鼓励学生继续深造。不论是长期期望还是短期期望,学生在父母的期望下会产生很强的学习动力,学习成绩都会得到有效提升。
3.2.4. 教师因素
在教师因素上,教师课堂提问和互动式教学对学业成绩均起到正向影响作用。其中课堂提问对男生和农村学生学业成绩有正向影响,但女生和城市学生不受影响;互动式教学在三个分组中对学生学业成绩有正向影响,只是农村学生不受影响。良好的问题提出教学和互动式教学能够促进学生学业发展,问题提出教学能够实现学生学习机会的公平化、促进和反观学生的知识理解、提高学生问题解决能力、激发学生的创造力、促进学生非认知能力(张玲等,2019)。课堂互动能够调动一切积极因素,改变教师一言堂的状态,打造崭新的以“自主、合作、探究”为其文化特色的课堂(钟启泉,2010),走向以学生为中心,尊重学生基础差异。
3.2.5. 学校因素
在学校因素中,总样本回归结果表明学校学习风气和家校互动对学生学业成绩起到正向影响作用,而教师流动对学业成绩起到负向影响作用。分样本回归结果表明,学校学习风气在三个分组中对学生学业成绩有正向影响,只是城市学生不受影响;教师流动在三个分组中对学生学业成绩有负向影响,只是城市学生不受影响;家校互动在四个分组下对学生学习成绩均有正向影响。校风学习风气建设是学生学业成绩的基本保障,良好的竞争氛围、舒适的学习环境、富有特色的校园文化等都将促进学生综合素质良性发展。教师流动容易造成教学脱节,同时学生需要花时间适应老师,对适应能力较慢的学生其学业成绩会受到较大影响。良好的家校合作与互动能够充分调动家长参与学生学习、学校生活的积极性,增强家庭亲密度(李哲等,2019)。
Table 2. Regression analysis results of influencing factors on academic performance of junior high school students
表2. 初中生学业成绩影响因素回归结果
维度 |
解释变量 |
总体(n = 6868) |
男生(n = 3477) |
女生(n = 3391) |
农村(n = 4542) |
城市(n = 2326) |
特征变量 |
性别 |
−0.114*** |
|
|
−0.133*** |
−0.085*** |
户口类型 |
−0.028** |
−0.049*** |
−0.007 |
|
|
个人因素 |
认知能力 |
0.305*** |
0.341*** |
0.269*** |
0.297*** |
0.323*** |
学习态度 |
0.148*** |
0.145*** |
0.161*** |
0.131*** |
0.188*** |
学习毅力 |
0.049*** |
0.057*** |
0.038** |
0.062*** |
0.024 |
睡眠时间 |
−0.053*** |
−0.046*** |
−0.068*** |
−0.040*** |
−0.081*** |
自我调节能力 |
0.016 |
0.003 |
0.029* |
0.007 |
0.035* |
学业压力 |
−0.039*** |
−0.033** |
−0.054*** |
−0.023* |
−0.076*** |
兴趣爱好种类 |
0.024** |
0.043*** |
0.004 |
0.014 |
0.035* |
朋友个数 |
−0.033*** |
−0.029* |
−0.039** |
−0.033** |
−0.027 |
家庭因素 |
父母关心情况 |
0.028** |
0.011 |
0.052*** |
0.023* |
0.034* |
期望孩子班级成绩 |
0.189*** |
0.218*** |
0.161*** |
0.222*** |
0.134*** |
期望孩子受教育程度 |
0.145*** |
0.135*** |
0.161*** |
0.126*** |
0.189*** |
上周指导功课天数 |
−0.048*** |
−0.055*** |
−0.039** |
−0.059*** |
−0.027 |
教师因素 |
课堂提问 |
0.044*** |
0.059*** |
0.022 |
0.055*** |
0.014 |
互动式教学 |
0.037*** |
0.042*** |
0.034* |
0.015 |
0.089*** |
学校因素 |
学校学习风气 |
0.073*** |
0.075*** |
0.071*** |
0.104*** |
0.005 |
教师流动 |
−0.106*** |
−0.098*** |
−0.121*** |
−0.136*** |
−0.014 |
家校互动 |
0.053*** |
0.041*** |
0.067*** |
0.048*** |
0.057*** |
模型检验 |
调整后R2 |
0.493 |
0.523 |
0.407 |
0.485 |
0.463 |
F |
352.761 |
212.683 |
130.053 |
238.571 |
112.382 |
P |
<0.001 |
<0.001 |
<0.001 |
<0.001 |
<0.001 |
注:***、**、*分别表示回归系数在0.1%、1%、5%的显著性水平下显著。
4. 结论与建议
总体而言,学生的学业成绩既受特征变量影响,又受学生个人因素、家庭因素、教师因素、学校因素四个方面影响。从回归系数大小来看,个人因素和家庭因素对学生成绩影响较大,其中性别、学生认知能力、学习态度、期望孩子班级成绩、期望孩子受教育程度、教师流动这六个指标对学生学习成绩影响很大,其总样本回归系数绝对值均超过0.1。通过分组回归,发现四个分组下学习成绩影响因素的影响效果有所不同,但在半数影响因素上表现一致。具体结果如下:学业成绩影响因素存在性别与城乡差异;认知能力和学习态度对学业成绩有正向影响,而过多的睡眠时间与学业压力对学业成绩有负向影响;父母期望对学生成绩有较大影响,但指导功课却效果相反;教师互动式教学能够促进学生学业成绩提高;学校学习风气和家校互动对学生学业成绩有正向影响,但教师流动呈负向影响。针对总样本回归和分样本回归中各因素对初中生学业成绩的影响情况,提出以下建议。
4.1. 重视性别与城乡差异,有针对地实施干预
针对性别与城乡差异情况,提出以下建议:第一,男生应注重兴趣爱好培养,积极参加一些兴趣活动,教师关注男生的课堂发言情况,多给男生课堂提问机会。第二,女生应加强自我调节能力,遇到身心健康问题无法自我调节时应向老师、家长、朋友寻求帮助或去校内外心理健康教室寻求专业解答;女生相比男生更容易敏感、内向、胆小,父母对女生应多些关心与理解,多沟通交流。第三,农村学生要注意控制交友数量与质量,以学业为重,适量的好朋友能够促进互相学习、互相排解焦虑与压力等负面情绪,但不宜花过多精力在交友上;农村学校学生受外界干扰较多,学校需要实施严格管理,帮助学生营造良好的学习氛围,尽可能减少教师流动。第四,城市学生学习基础相对较好,应加强互动式教学,提高学生问题提出能力,培养学生创造性思维。第五,充分利用在线资源,随着我国教育信息化进程推进,部分农村地区软硬件设备不足、网络未覆盖等上网难和上网课难的问题已逐渐得到解决,农村学校可以通过互联网引入国内外优质课程、教材、教法,构建线上线下相结合的“双师课堂”等。
4.2. 强化学生认知能力培养,端正学生学习态度
第一,加强学生认知能力培养。认知能力指人脑加工、储存和提取信息的能力,主要包括注意力、记忆力、推理能力等,是人们成功完成一项活动的关键心理要素,对学生学习成绩既有直接影响又有间接影响(梁兴丽等,2020)。本研究中认知能力的标准化回归系数最大,体现认知水平高低对学生学业成绩影响起到主导作用,为此,应加强学生在注意力、记忆力、推理能力、问题解决等方面的训练。实践活动是提升初中生认知能力的一种重要方式,可以通过折纸、手工制作、创客实践活动等方式,让学生在操作中培养专注力,提升注意力与思维能力,实现问题解决。第二,端正学生学习态度。教师、家长平时可以从生涯教育方面引导学生做好学习规划,让学生从根本上意识到学习的重要性,形成明确的学习目标,变被动学习为主动学习;当发现学生学习态度不端时,可以通过反面案例进行柔性引导,不以暴力方式进行强制干预。
4.3. 父母应给予学生适度关怀,但指导功课需谨慎
初中生正处于青春期,青春期学生心理活动往往处于矛盾状态(林崇德,2018),如反抗与依赖、封闭与开放、勇敢与怯弱、高傲与自卑、否定童年与眷念童年矛盾共存,人格特点表现出情绪不稳定,缺乏承受压力、克服困难的意志力等。因此,父母应在生活和学习上给予学生适度关怀。在生活上,关注学生身心理健康,将“家长”身份转换为“朋友”身份;在学业上,家长在陪伴孩子时可以表达对学生学业成绩的期望,让孩子感受到父母在学业上的关心,但期望值不宜过高,否则就会给学生带来压力。此外,父母指导功课需谨慎,由于学历、性格、时间等多方面原因,大多数父母难以胜任指导学生功课的任务,建议变“指导者”为“服务者”,尽可能为小孩提供优质教育教学资源,同时注重培养学生自主学习能力。
4.4. 注重教师课堂问题,创新互动式教学
爱因斯坦等人认为提出一个问题往往比解决一个问题更重要(Einstein & Infeld, 1938),提出问题能够促进学生对知识的理解,锻炼学生的高阶思维。在教师课堂提问方面,学校可以成立“问题提出”教学研究团队,做好教师课堂提问的顶层设计;教师可以将“问题提出”的教学方式纳入教案,保障课堂提问的数量,注重问题的质量。关于互动式教学,一方面借助信息技术等外力来强化互动,如利用智慧教学调动学生参与积极性(李利等,2018),信息技术教学能够增加师生互动的可能性,但老师容易出现仅使用技术,不关心技术反映的问题的现象,需要引起注意;另一方面通过引入STEAM教育与创客教育来强化互动式教学,STEAM教育与创客教育广义上都可以理解为是一种基于真实情景、项目式教学的跨学科教育,本质上就是一种互动式教学,能够在互动中强化学生问题提出与解决能力,提高学生学习能力、实践能力、创新能力。
4.5. 加强家校合作,减少教师流动
2020年10月,中共中央审议通过《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,明确提出“健全学校家庭社会协同育人机制”。可见国家层面对家校社协同育人机制的重视,为此在学生学业发展上探索家校合作育人机制显得尤为重要。家校合作要体现“去中心化”“自觉的联合”“共同行动”等特征(柴江,2021),双方要在教育理念上达成共识,寻求主动合作关系,共同行动并及时调整育人策略。总之,家校合作要注重实质,而非形式。此外,学校方面要尽可能减少教师流动,教师流动既包含教师的离职也包含学校内部教师任课调整等。学校方面应建立健全奖励激励机制与评价机制,保障教师各方面待遇,给年轻教师提供学习机会,提升教师的幸福感与满意度。