1. 引言
在教育领域,同伴效应能产生积极的学习溢出效应,例如优秀同伴可提升整体班级表现,提高教育投资的回报率。其次,从经济和社会视角,研究同伴效应有助于设计干预措施,如班级分配或社区项目,以促进人力资本积累和社会流动性。深入探讨同伴效应的机制和影响,能为教育改革和社会治理提供实证依据,推动更公平有效的资源配置。
本文考察了学生同伴质量对学生学业表现和认知能力的影响,以及这种同伴效应是否因父母教育水平而异。利用中国学校内班级准随机分配机制,本文聚焦于中学阶段的同学作为同伴群体,以识别和估算同伴效应。
本文使用全国代表性样本——中国教育追踪调查(CEPS)数据,估算同伴对学生教育成果的影响、学生发展与父母教育之间的代际相关性,以及学生同伴和父母教育对学生发展的联合影响。研究发现,同学学业表现对焦点学生的学业成绩和认知能力有积极影响。同伴学业表现与学生学业成绩的正相关幅度大于与认知能力的相关幅度。父母教育与学生教育成果之间存在统计显著的代际持久性。平均而言,高教育家庭学生在学业表现和认知能力上发展水平优于低教育家庭学生。然而,本文未发现同学平均学业表现对学生学业表现和认知能力发展的同伴效应幅度,在父母教育水平间存在统计显著差异。
本文对文献有四点贡献。首先,现存文献多基于发达国家及个人主义文化,而本文是少数使用中国全国代表性数据分析同伴效应的研究。中国作为发展中国家,由于人口众多,学生获得高等教育机会有限。此外,心理学和社会科学证据表明,中国拥有强烈的家庭导向集体主义文化,与个人主义文化相比,社会比较程度更高[1]。其次,现存文献多考察社会联系较弱的同伴群体对学生发展的影响。本文利用中国中学独特环境——学生大部分时间在班级与同学共处——探讨与焦点个体有紧密社会联系的同伴质量特征的效应。第三,现存教育经济学研究多分别考察父母和同伴对学生发展的潜在影响,本文是少数提供对中国青少年认知能力发展中同伴和父母角色更深入理解的研究。第四,本文提供驱动同伴对学生教育成果积极效应的机制提示证据。对机制的更好理解有助于设计教育政策,以高效提升学生发展和强调当前教育体系公平性。例如,通过为低教育家庭学生提供更多教育服务或资源来补偿,可使所有学生发展受益。
本文其余部分组织如下:第二节描述数据和分析样本。第三节解释估算策略。第四节呈现主要结果。第五节讨论可能机制。最后,第六节总结本文。
2. 数据
2.1. 中国教育追踪调查
本研究使用的数据来源于中国教育追踪调查(CEPS)。该调查由中国人民大学国家调查研究中心(NSRC)开展。这项追踪调查目前发布了两个波次的数据:2013~2014学年的基线波次和2014~2015学年的后续波次。调查数据包括针对学生、家长、班主任、主要科目教师以及学校行政人员的五份问卷,收集了学生教育投入、家庭和学校教育环境以及学生及其父母的人口统计信息等丰富内容。
CEPS的基线样本从中国大陆31个省/市/自治区的2870个县级单位中抽取,这些单位具有常住人口。调查采用分层、多阶段概率比例抽样设计。为了避免潜在问题,如省、市、县之间的比较或涉及学校人员、学生和父母的隐私侵犯,CEPS样本中的县级单位和学校名称被有意加密并重新编码为唯一ID。这些县级和学校ID在两波次中保持不变。CEPS样本中共有30,237个观测值,来自112所学校的555个班级。估计样本包括9358个观测值,涉及8142名个体,分布在93所学校的274个班级。与CEPS样本相比,样本包含30.95%的观测值、40.80%的个体、49.37%的班级和83.04%的学校。
为简化起见,本文将父母分为两类:高学历和低学历,以父母最高学历是否接受高等教育作为阈值。高学历父母至少获得大学学位,而低学历父母未获得任何高等教育资格。
2.2. 学业表现
CEPS直接从中学收集学生的行政学业表现信息。学校提供学生在小学、初中和高中整个学习过程中最近期中考试的三门主要科目成绩:语文、数学和英语。每所学校报告学生的原始考试分数和考试满分。大多数情况下,每门主要科目的原始分数满分为150分。CEPS还为每门主要科目将分数标准化为均值70、标准差10。
在中国教育体系中,期中和期末考试可能为行政县统一的考试。在一个行政县内,有些学校可能自行出题,而非使用标准化或外部提供的试题。然而,每所学校同一年级的主要科目教学大纲相同。因此,同一年级同一学校的学生成绩具有可比性。本文使用三门主要科目的总体标准化成绩作为学生学业表现的代理变量,然后在样本层面(包括七年级、八年级和九年级学生的观测)进一步标准化为均值0、标准差1,用于控制年级和学校固定效应的估计分析,从而使焦点学生与其同伴的成绩具有可比性。
2.3. 认知技能
除了调查问卷和学校报告的学业表现外,在基线波次中,CEPS还设计了一组问题分别测试七年级和九年级学生的认知技能发展。认知测试的问题不涉及学校课程中特定死记硬背的知识。这些问题旨在衡量学生的逻辑思维和问题解决能力。认知测试问题分为三个维度:语言、图形以及计算和逻辑。语言维度的问题衡量学生的词语类比能力和中文语言及文字推理能力。图形维度的问题衡量学生分析图形模式和应用几何形状的能力。计算和逻辑相关的问题衡量学生在数学应用、自定义运算规则、序列应用、抽象模式分析、概率以及数值大小逆向思维方面的技能。
2.4. 描述性统计
样本中,23.1%的观测点至少有一位父母获得高等教育学位。样本观测点的平均考试分数为212.96,标准差为24.57。由于考试分数的可比性,高学历家庭学生的平均学业表现优于低学历家庭学生。样本所有观测点的平均认知技能为0.169。高学历家庭学生的认知技能发展平均测试分数约为低学历家庭学生的十倍。高学历家庭学生的学习努力比低学历家庭学生高出约整个样本标准差的31%。高学历家庭观测的平均教学努力略高于低学历家庭。高学历家庭学生的同伴互动和父母投入水平高于低学历家庭学生。
样本中所有学生的性别分布均衡。然而,高学历家庭样本中女孩比例略高于低学历家庭。超过90%的观测为汉族。所有学生的农业与非农业户籍比例接近一半。然而,高学历和低学历父母在登记居住地方面存在明显不平衡。只有9%的观测点来自高学历家庭具有农业户籍,而低学历家庭的这一比例约为61.4%。这一发现表明城乡教育资源不均衡,意味着在估计中控制居住地至关重要。
此外,大多数观测为本地居民且父母双全。尽管高学历家庭的本地居民和父母双全比例高于低学历家庭,然而,低学历家庭中仍有超过75%为本地居民且父母双全。摘要统计表明,学生要么是独生子女,要么有一个兄弟姐妹。高学历家庭学生更可能为家中独子。四分之一的学生在工作日住校。然而,高学历家庭的学生观测中,只有6.2%在工作日住校。平均年龄为十三岁,这表明大多数观测来自七年级。样本中大多数学生父母双双工作,且家庭收入状况中等。CEPS收集了两个风险因素的数据:1) 父亲是否经常醉酒;2) 父母是否经常争吵。摘要统计表明,约8%的家庭至少有一个风险因素。
CEPS还收集了学生班主任的特征。平均而言,66.8%的班主任为女性。班主任的平均年龄为37岁。班主任平均获得学士学位,且大多数从师范大学获得学位。平均而言,班主任有15年的教学经验。高学历和低学历父母观测的班主任质量存在系统性差距。与低学历家庭学生相比,高学历家庭学生的班主任性别更偏向女性。平均而言,高学历父母学生的班主任质量更高,表现为更多教学经验和更好职称。然而,这一发现表明,城乡地区教师质量的系统差异小于预期,因为样本中只有9%的高学历家庭居住在农村地区,这表明城乡教育资源存在较大差距。
此外,样本涵盖了班级层面的特征。平均班级规模为45名学生。平均班级中性别和户籍类型的分布均衡。城乡之间存在明显区域差距,因为不到10%的高学历家庭持有农业户籍,而高学历家庭学生的同学中24.1%持有农业户籍。城市地区的教育资源远多于农村地区。学生是否住校、家庭收入状况以及是否有至少一个风险因素的班级平均值在机制上类似于个体平均值。
3. 估计策略
在评估同伴效应对学生发展的影响时,一个主要挑战是确定焦点学生的同伴群体。现有研究表明,教育影响的关键人物是那些与焦点学生密切相关的个体[2]。在中国,学生大部分时间都在学校班级中度过。因此,本文将同伴群体定义为焦点学生的同班同学。这种定义还利用班级分配机制来解决同伴效应的内生性问题。
本文在估算纯净同伴效应时面临三个挑战:选择偏误、反射问题和共同冲击。本文参考现有文献的建议,利用CEPS数据的详细信息来应对这些问题[3] [4]。选择偏误是指个体倾向于与相似的人建立联系。在本研究中,学生可能自行选择朋友,导致同伴群体特征相似。为解决此问题,本文采用准实验方法,即通过随机分配学生到班级。在CEPS数据中,学生基于中学随机入学被分配到班级,同伴群体限于同学层面。这种方法避免了学生选择相似同伴,从而克服选择偏误。本文还进行平衡测试,以验证班级随机分配的有效性。
第二个挑战是反射问题,即个体既受同伴影响,也影响同伴。在本研究中,一名学生的学业进步可能受益于优秀同伴,但其进步也可能反过来影响他人。为应对此问题,本文区分焦点群体(接受影响的学生本人)和参考群体(提供影响的同学)。通过班级随机分配,这种策略可解决反射问题。
第三个问题是共同冲击,即某些因素可能同时影响学生及其同伴,如学校经济变化或班级教师调整。本文通过控制年级、时间和学校固定效应来处理此问题,并纳入班主任特征以捕捉教师影响。此外,参考现有文献的方法,本文控制班级平均值,以处理潜在未观测因素[5]。
本文的核心目标是考察同伴效应对学生学业和认知技能的影响。估算的有效性取决于班级随机分配的成功。在CEPS调查中,校长报告了学生分配方式。本文参考现有文献,限制样本满足三个条件:1) 七年级和九年级基线学生在入学时随机分配到班级;2) 九年级基线学生在八年级无班级重组;3) 八年级后续学生无重组且无新生。由此,工作样本包括93所学校、274个班级、8142名学生[6] [7]。
学生学业表现和认知技能的实证估计模型应服务于三个主要目的。首先,测试父母学历与其子女发展之间是否存在代际相关性。其次,考察学生同伴如何影响学生的教育结果。最后,估计同伴效应对高学历和低学历家庭学生的影响幅度是否不同。因此,本文估计以下方程:
(1)
其中,Yicst表示学生i在学校s的班级c于学年t的两种教育结果(学业表现和认知技能),PEDUics是学校s的班级c中学生i父母学历的二元变量。如数据部分所述,如果学生父母的最高学历获得高等教育资格(即大学学位或更高),则父母学历变量值为1。Peericst是学校s的班级c中学生i的“排除自身”同学平均学业表现。Xicst是控制变量集,包括学生、父母、家庭、班主任和班级特征,Λi是固定效应集,包括时间、年级和学校固定效应。εicst是误差项。系数βPEDU、βPeer和βint.是本文估计的主要关注点。系数βPEDU显示高学历和低学历父母子女发展之间的差异。该系数可视为父母学历与学生发展之间的代际相关性。正(负)父母学历系数表明存在代际教育持久性(流动性)。系数βPeer捕捉学生同学对焦点学生发展的同伴效应。系数βint.捕捉学生同学按父母学历的潜在异质效应。
4. 主要结果
本文首先估计同学学业表现对学生教育结果的同伴效应,以及父母学历与其子女发展的代际相关性。呈现了估计的同伴效应和父母与子女教育结果之间代际相关性的主要估计结果。第一列显示了控制学校、时间和年级固定效应的关注估计系数。第二列控制了学生个体特征和固定效应集。第三列添加了学生班主任特征的额外控制变量。表1的最后一列呈现了包括学生、班主任、班级群体特征完整控制集以及学校、时间和年级固定效应的估计结果。为便于解释,本文将学生学业表现、认知技能以及学生同学平均学业表现标准化为均值0、标准差1。
Table 1. Main results: Peer effect on students’ development
表1. 主要结果:影响学生发展的同伴效应
|
(1) |
(2) |
(3) |
(4) |
A. 学业表现 |
Peer |
0.244*** (0.018) |
0.236*** (0.018) |
0.234*** (0.020) |
0.234*** (0.021) |
Peer × PEDU |
−0.004 (0.035) |
0.012 (0.029) |
0.012 (0.029) |
0.011 (0.029) |
PEDU |
0.316*** (0.042) |
0.240*** (0.034) |
0.239*** (0.033) |
0.240*** (0.033) |
B. 认知技能 |
Peer |
0.092*** (0.025) |
0.086*** (0.024) |
0.083*** (0.024) |
0.064** (0.026) |
Peer × PEDU |
−0.059 (0.034) |
−0.055 (0.032) |
−0.055 (0.032) |
−0.052 (0.033) |
PEDU |
0.201*** (0.035) |
0.142*** (0.030) |
0.143*** (0.030) |
0.136*** (0.028) |
学校固定效应 |
√ |
√ |
√ |
√ |
时间与年级固定效应 |
√ |
√ |
√ |
√ |
个人控制变量 |
|
√ |
√ |
√ |
老师控制变量 |
|
|
√ |
√ |
班级控制变量 |
|
|
|
√ |
注:括号内为标准误,标准误在学校层面聚类;*:p < 0.1,**:p < 0.05,***:p < 0.01。
4.1. 学业表现
表1面板A展示了学生学业表现的估计结果。第一列显示,高学历父母子女与低学历父母子女之间存在显著差距,前者平均学业表现高出后者标准差的31.6%。同时,焦点学生的同学学业表现对其自身产生正向影响:同学平均学业表现每增加一个标准差,焦点学生学业表现则提升一个标准差的24.4%。然而,两类家庭学生的同伴影响幅度无显著差异。
第二列加入学生个体特征控制后,结果显示高学历家庭学生学业表现优于低学历家庭学生,幅度为标准差的24%,代际教育差距在1%水平上显著。同学(排除自身)平均学业表现增加一个标准差,导致焦点学生学业表现提升标准差的23.6%,正相关在1%水平上显著。高学历家庭学生的同伴影响幅度略大(标准差的1.2%),但差异不显著。
第三列进一步纳入学生个体和班主任特征控制,确认父母学历对学生学业表现的代际影响持久,在1%水平上显著,高学历家庭学生优势为标准差的23.9%。同学平均学业表现增加一个标准差,焦点学生表现平均改善一个标准差的23.4%,两类家庭学生的同伴影响幅度无显著差异。
第四列采用最保守规格,包括个体、班主任和班级控制,结果类似前述:高学历家庭学生平均优于低学历家庭学生标准差的24%,同学学业表现改善带来标准差23.4%的正向反应,同伴影响幅度差异不显著。总体而言,面板A的结果在不同控制条件下保持一致,从基本固定效应到逐步添加更多变量均如此。
4.2. 认知技能
表1的面板B展示了学生认知技能的估计结果。总体而言,同伴影响和父母教育水平对子女认知发展的持久性模式,与学生学业表现的结果相似,但估计值的大小有所不同。第一列结果显示,高学历父母子女的认知技能发展水平显著高于低学历父母子女,差距约为一个标准差的20.1%,在1%水平上显著。此外,同伴平均学业表现每增加一个标准差,焦点学生认知技能则会提升一个标准差的9.2%。高学历家庭学生的同伴影响较小,减少一个标准差的5.9%,但两类家庭间的差异不显著。
从第二列到第四列,逐步加入学生个体、班主任和班级特征作为控制变量。第二列显示,高学历与低学历家庭学生认知技能的差距为一个标准差的14.2%。同伴平均学业表现每增加一个标准差,与学生认知技能提升一个标准差的8.6%。高学历家庭的同伴影响较小,减少一个标准差的5.5%,但差异不显著。第三列结果类似:两类家庭学生认知技能差距为一个标准差的14.3%,在1%水平上显著;同伴影响导致认知技能提升一个标准差的8.3%;低学历家庭的影响较大,但差异不显著。
第四列包含最全面的控制变量,结果显示,高学历家庭学生认知技能优于低学历家庭,差距为一个标准差的13.6%,在1%水平上显著。同伴影响在5%水平上显著:对低学历家庭学生,同伴学业表现提升一个标准差,可以认知技能增加一个标准差的6.4%;对高学历家庭,则增加一个标准差的1.2%。两类家庭间的同伴影响差异不显著。与面板A相比,面板B显示,父母教育对认知技能的影响持久性小于对学业表现的影响,且同伴影响在所有规范中对认知技能的作用较小。
4.3. 同伴效应异质性的讨论
本文的核心发现之一是,同伴效应对高学历和低学历家庭学生的学业表现和认知技能发展并无显著异质性。
从理论层面来看,现有的教育经济学模型通常预期同伴效应可能存在异质性。高学历家庭往往拥有更多人力资本和社会资源(如课外辅导或家庭学习环境),这可能缓冲或放大同伴的影响。例如,高学历父母可能通过增加投入来补偿低质量同伴,从而弱化负面同伴效应;反之,低学历家庭学生更依赖学校环境,同伴效应可能更强。然而,本文结果显示,这种异质性并不显著。这可能源于中国独特的集体主义文化背景。正如引言所述,中国社会强调家庭导向和集体主义,社会比较机制更为强烈。在这种文化下,无论父母教育水平如何,学生都高度嵌入班级集体中,同伴的学业表现作为社会参照点,会普遍激发竞争和模仿行为,从而使同伴效应在不同家庭背景间趋于一致。这一发现挑战了基于西方个人主义文化的理论假设,并丰富了对发展中国家教育过程的理解:在中国情境下,同伴效应更多体现为文化驱动的“集体溢出”,而非单纯的资源依赖。
这一剖析印证了在高社会比较的环境中,同伴效应促进了教育公平,因为低学历家庭学生同样受益于优秀同伴,而非被家庭背景进一步边缘化。这为政策设计提供了启示,如通过混合班级分配来放大集体主义文化的积极作用,推动社会流动性。
5. 机制分析
上节发现,学生同学的学业表现与其自身学业表现和认知技能发展存在显著正相关。本节进一步探讨其他学生外部学业表现影响焦点学生发展的可能渠道。具体而言,本文分析驱动同伴效应的两种渠道:学生自身学习努力程度、以及学生父母的投入。
在中国,高等教育机会有限,学生的学历取决于其在群体中的排名。同伴学业表现提升可能威胁焦点学生的未来教育机会,从而产生同伴压力。从学生视角看,这一压力的潜在机制在于激发其自身学习努力。学生可能通过更努力学习来应对,从而提升自身学业表现。
第二种机制涉及父母投入。现有研究表明,父母投入是学生发展的重要因素[8]-[10]。这一机制的核心是,父母可能响应同伴压力,增加对子女的教育投入。尽管父母难以获取同学学业细节,但他们可通过学生自述和学校家长会了解子女表现及班级整体水平。因此,学生可能通过更多父母投入,对同伴学业表现提升做出反应,实现更高学业表现和认知技能。
6. 总结
本文利用一项全国代表性调查,考察了同伴效应对学生学业表现和认知技能发展的影响,以及父母学历与子女发展的代际关联。通过将焦点学生的同伴群体限定为准随机分配的同学,本文有效解决了估计纯净同伴效应的核心挑战。结果显示,学生同伴的学业表现与焦点学生的学业表现和认知技能存在因果关系。研究发现,同学平均学业表现的提升显著改善焦点学生的学业表现和认知技能,且对学业表现的影响大于对认知技能的影响。同时,学生教育成果显示出代际持久性:高学历家庭学生在考试中表现更优,并拥有更高认知技能水平。然而,本文未观察到父母学历与同学学业表现对学生学业和认知发展的显著交互作用。此外,本文分析了驱动同伴效应的两种机制:焦点学生的学习努力、以及父母投入。本文探讨了同伴压力引发的学生自身学习努力增加和父母投入增多,是驱动同学学业表现对学生教育成果正向影响的可靠渠道。