社会科学前沿  >> Vol. 8 No. 2 (February 2019)

多水平模型在中学生数学考试成绩影响因素分析中的应用
Application of Multi-Level Model in the Analysis of Influencing Factors of Mathematics Examination in Middle School

DOI: 10.12677/ASS.2019.82028, PDF, HTML, XML, 下载: 448  浏览: 754  科研立项经费支持

作者: 秦 川:云南财经大学,统计与数学学院,云南 昆明

关键词: 多水平模型数学考试成绩性别家庭受教育程度Multilevel Model Mathematical Exams Gender Family Background

摘要: 教育测量与教学评价是教学活动的重要组成部分,是教学领域中进行科学管理的重要手段和提高教育质量的有效保证。教学评价中的主要内容之一是考试成绩及其影响因素的分析。目前,用于考试(测验)成绩及其影响因素分析的方法主要有描述性分析、聚类分析、主成分分析、因子分析和多元线性回归分析等。然而,在教学评价中,往往需要分析具有层次结构的数据,如不同学校或同一学校不同专业学生的考试成绩。具有层次结构的资料不适宜用上述方法分析,宜用多水平模型。本文基于某地区60所中学1653名初中二年级学生数学考试成绩的样本数据,建立了数学考试成绩及其影响因素的多水平模型。结果表明:学校、性别和家庭受教育程度对学生的数学考试成绩有显著影响。
Abstract: Education measurement and teaching evaluation is an important part of teaching activities. One of the main parts in teaching evaluation is the analysis of examination results and its influencing factors. At present, the main methods include descriptive analysis, cluster analysis, principal component analysis, factor analysis and multiple linear regression analysis. However, the data with hierarchical structure is not suitable to be analyzed by the above methods. Based on the sample data, a multi-level model is established. The results showed that school, gender and family were significantly affected by education.

文章引用: 秦川. 多水平模型在中学生数学考试成绩影响因素分析中的应用[J]. 社会科学前沿, 2019, 8(2): 191-196. https://doi.org/10.12677/ASS.2019.82028

1. 引言

教育测量与教学评价是教学活动的重要组成部分,是教学领域中进行科学管理的重要手段和提高教育质量的有效保证。学校效能的评估作为当前教育测验中的一个重要课题,其结果的好坏对学生以及学校均有着重要影响。教育测量是教学评价中收集信息的主要途径。其测量方法有观察法、谈话法、问卷法和测验法等,考试和测验是测验法中的常用形式。教学评价是根据一定的研究目的,运用科学的技术和方法,对教学活动的过程和结果进行测定、分析和比较,并给予价值判断的过程。通常,人们把考试成绩及其影响因素的分析作为教学评价中的主要内容之一。因而,进行考试成绩及其影响因素分析方法的研究具有重要的现实意义和实用价值 [1] 。

目前,用于考试成绩及其影响因素分析的方法主要有描述性分析、聚类分析、主成分分析、因子分析和多元线性回归分析等。然而,在教学评价中,往往需要分析不同学校的考试成绩,此时的数据往往因学校师资、教学条件、学生生源的不同,而存在层次结构。上述方法不适宜分析具有层次结构的数据。

多水平模型(Multilevel Models)适用于分析具有层次结构的数据,它是由Lindley和Smith与1972年提出的,但因其受传统参数估计方法和计算技术的限制,未能得到推广应用;随着其他学者对模型参数进行改进了,特别是相应软件(HLM, Mlwin)的开发,从而推动了多水平模型理论和应用的发展。本研究拟将多水平模型运用于中学学生数学考试成绩分析中,对影响学生考试成绩的因素做出正确的评价和解释。

2. 数据来源与研究方法

2.1. 数据来源与数据处理

本文采用Raudenbush, S.W., Bryk, A.S., & Congdon, R.于2017年提供的美国某地区的60所中学1653名二年级学生的数学考试成绩、性别、父母受教育程度、学校规模人数等样本数据作为主要的研究指标 [2] 。

2.2. 研究方法

对学生数学成绩影响因素的分析,首先用OLS模型进行了估计,但是由于不同地区的学校存在着师资条件、办学方式等不同,所以,学生们的考试成绩既受到自身特征的影响,也受到学校的影 。因此,在这种情况下,如果采用经典的最小二乘估计方法可能会导致有偏参数估计结果 [3] 。因此,本文利用多水平模型对学生的考试成绩进行估 。

经典模型的基本假定是单一水平和单一的随机误差项,并假定随机误差项独立、服从方差为常量的正态分布,代表不能用模型解释的残留的随机成分。

多水平模型 [4] 将单一的随机误差项分解到与数据层次结构相应的各水平上,具有多个随机误差项并估计相应的残差方差及协方差。它区别于经典模型的根本特征就在于能构建与数据层次结构相适应的复杂误差结构。分为两个水平的多水平模型形式可以设定为:

y i j = β o j + β 1 X i j + e i j (1)

β 0 j = γ 00 + μ 0 j (2)

y i j X i j 分别为第j个学校中第i个学生应变量观测值和解释变量观测值。 γ 00 β 0 j 的平均值,为固定成份, μ 0 j 为水平2上( β 0 j )的随机成分,服从正态分布。 e i j 表示水平1上的随机误差,也服从正态分布。把(2)式代入(1)式并整理,得:

y i j = ( γ 00 + β 1 X i j ) + ( μ 0 j + e i j ) (3)

在(3)式中, ( γ 00 + β 1 X i j ) 表示固定效应部分, ( μ 0 j + e i j ) 表示随机效应部分(残差项)。如果同时假定水平1上的残差与水平2上的残差相互独立,即 C o v ( μ 0 j , e 0 i j ) = 0 ,则因变量的方差为:

V a r ( y i j | γ 00 , β 1 , X i j ) = V a r ( μ 0 j + e 0 i j ) = V a r ( μ 0 j ) + V a r ( e 0 i j ) + C o v ( μ 0 j , e 0 i j ) = σ μ 0 2 + σ e 0 2

此即水平2和水平1方差之和。

同一学校中两学生(用 i 1 , i 2 表示)间的协方差为:

C o v ( μ 0 j + e i 1 j , μ 0 j + e i 2 j ) = C o v ( μ 0 j , μ 0 j ) = σ μ 0 2

在多水平的实际估计中,是否存在组内相关,可以通过组内相关(ICC)公式进行评价:

ρ = σ μ 0 2 σ μ 0 2 + σ e 0 2 (4)

ICC测量了学校间方差占总方差的比例,实际上它反映了学校内个体间相关,即水平1单位(学生)在水平2单位(学校)中的聚集性或相似性。由于模型不止一个残差项,就产生了非零的组内相关。若ICC为0,表明数据不具备层次结构,可忽略学校的存在,即转化为传统的单水平模型;反之,若存在非零的 σ μ 0 2 ,则不能忽略学校的存在。

3. 结果分析

3.1. 模型一:无解释变量(空模型)

第一层 y i j = β 0 j + e i j

第二层 β 0 j = γ 00 + μ 0 j

利用SPSS软件进行分析,结果如表1所示 [5] :

Table 1. Model test results when no explanatory variables are assumed

表1. 假设无解释变量时的模型检验结果

反映学校差异的估计值为0.337798,具有统计学意义,不同学校教学水平有差异 [6] 。根据数据还可以计算ICC值,从ICC的计算结果来看,ICC = 0.2273,说明有22.73%的总变异是由学校引起的。

3.2. 模型二:引入变量

第一层 y i j = β 0 j + β 1 j S e x i j + e i j

第二层 β 0 j = γ 00 + μ 0 j

性别也有可能对学生的数学考试成绩有影响。将性别信息纳入到模型中,其中 S e x i j 表示的是第j个学校中第i个学生的性别。当性别为女时取1,性别为男时取0。利用SPSS分析的结果如表2所示:

Table 2. Model test results after introducing gender variables

表2. 引入性别变量后的模型检验结果

对性别固定效应进行检验,P = 0.053,说明性别对数学考试成绩有影响。

3.3. 模型三:引入家庭受教育程度变量

第一层 y i j = β 0 j + β 1 j S e x i j + β 2 P E i j + e i j

第二层 β 0 j = γ 00 + μ 0 j

除了性别以外,父母受教育程度也可能对学生的考试成绩有影响 [7] ,上过大学的父母很有可能比没有上过大学的父母更会教育孩子 [8] ,因此将父母受教育信息纳入到模型中,其中 β i j 表示的是第j个学校中第i个学生的父母有没有上过大学。若没上过取1,反之取0。利用SPSS分析的结果如表3所示:

Table 3. Model test results after introducing gender and education variables

表3. 引入性别和教育变量后的模型检验结果

对固定效应进行检验,所有的P值都小于0.05,说明性别、父母教育背景对学生的考试成绩都有影响。−0.07011说明男生比女孩生成绩低,0.474390说明上过大学的父母的孩子比没有上过的父母的孩子的考试成绩高。

4. 结论

本文基于Raudenbush, S.W., Bryk, A.S., & Congdon, R.于2017年提供的1653个样本数据,通过建立学生数学考试成绩及其影响因素的多水平模型,对学生考试成绩及其影响因素之间的因果关系进行了简单的实证分析,结果显示学生考试成绩在学校和学生个体水平上均存在变异,变量分布及其相关影响因素的效应可分为2类:一是地区、学校内的效应,其中最重要的影响因素是性别和家庭教育;二是层次或水平效应,这个效应是由于学校之间的教学条件、生源质量不同所致。本研究通过建立多水平模型分析学生们的数学成绩影响因素,说明了学校之间的变异不容忽视,更好的解释了变异的来源。其次,通过多水平模型分析,结合实际情况更好地认识了变量之间的关系。

基金项目

本文得到了云南财经大学研究生创新基金项目(2018YUFEYC001)的资助。

参考文献

[1] 王艳梅. 多水平模型在大学英语考试成绩影响因素分析中的应用[D]: [硕士学位论文]. 济南: 山东大学, 2007.
[2] 陈光慧, 刘建平. 我国基本单位多水平连续性抽样调查体系改革研究[J]. 统计研究, 2014, 31(7): 50-57.
[3] 麻吉亮, 陈永福, 钱小平. 气候因素、中间投入与玉米单产增长——基于河北农户层面多水平模型的实证分析[J]. 中国农村经济, 2012(11): 11-20.
[4] 石磊, 向其凤. 鲁筠. 多水平模型及其在经济分析中的应用[J]. 数学建模及其应用, 2016, 5(1): 3-8.
[5] 谢传波, 牛中正, 丁鹏, 等. 多水平统计模型的Stata程序实现[J]. 中国卫生统计, 2014, 31(1): 169-170.
[6] 赵金辉, 魏建荣, 陈华洁, 等. 北京地区居民日均饮水量相关因素的多水平模型分析[J]. 卫生研究, 2012, 41(5): 809-813.
[7] 梁宗保, 张光珍, 邓慧华, 等. 学前儿童努力控制发展轨迹与父母养育的关系[J]. 心理学报, 2013, 45(5): 556-567.
[8] 康春花, 孙小坚, 顾士伟, 等. 多水平多维IRT模型在学业质量监测中的应用[J]. 江西师范大学学报(自然科学版), 2016, 40(2): 133-139.