1. 引言
自上世纪六十年代起,教育回报率成为一个热门研究话题,众多学者基于人力资本理论使用不同方法对教育回报率进行了估算。国内外关于教育回报率性别差异的研究普遍认为,无论是发达国家还是发展中国家,女性的教育收益率均高于男性 [1]。
Arias Omar和Mcmahon Walter·W (2001)研究美国教育收益变化时发现女性在各级教育阶段的年收入平均增长率都显著高于男性 [2]。Luis-Eduardo Vila和Jose-Gines Mora (1998)发现无论在公共部门还是私人部门,女性的教育收益率都高于男性教育收益率 [3]。西班牙学者Arrazola等(2006)在控制Mincerian基本方程最小二乘估计中出现的偏差的情况下,得出相同结论 [4]。韩国学者Lee J和Ihm J (2020)在检验了男女群体在教育上的投资回报率(ROI)之间的差异后得出结论,除研究生教育外,无论教育阶段如何,女性的教育回报率始终显著高于男性,且这些性别差异在年轻一代比老一代更大 [5]。George P和Anthony PH (2018)基于139个国家从1950年到2014年的1120项数据估算出私立学校一年的全球平均回报率是9%,其中女性教育回报率比男性约高两个百分点 [6]。
国内教育回报率的性别差异也基本与国外学者结论一致。国内大部分研究表明,女性的教育回报率显著高于男性(赖德胜,1998;陈纯槿、胡咏梅,2014;刘泽云、刘佳璇,2020等) [7] [8] [9],陈良焜和鞠高升(2004)通过对1996~2000年统计数据的分析,对中国教育明瑟收益率的性别差异进行了统计性检验,证实了女性高于男性 [10],结果见表1:

Table 1. Rate of return on male and female education, 1996~2000
表1. 1996年~2000年男女教育回报率
由表1可知,女性教育回报率始终显著大幅高于男性,结论与其他学者相同,但由于选择的样本数据、控制变量以及测度的年份等的不同,使得教育回报率测算结果存在一定差异。Jamison等人计算出1985年女性教育收益率高于男性1.1个百分点。Hauser SM和Xie Y (2005)得出1986年男女教育回报率的差距为2个百分点,1988为2.3个百分点 [11],于学军(2004)估算1994年男女教育回报率的差距为3.2个百分点 [12],赖德胜(1998)根据1995年采集的数据得出女性收益率仅高出男性0.85个百分点[7],Seth M·Hauserand和Yu Xie使用1995年全国抽样调查数据算出女性收益率高出男性3.7个百分点。陈晓宇和陈良焜计(2003)算出1996男女教育回报率的差距为1.46个百分点 [13],2001年达到4.8个百分点 [14]。候风云(2005)根据来自2002年的数据算出来为0.483个百分点 [15]。Emily Hannum (2013)等对2002年的CULS和CALS的数据进行计算,男女教育回报率的差距在4%到6%之间 [16]。侯玉娜(2017)基于中国家庭追踪调查(CFPS) 2010年的数据,估算出男性教育回报率为10.3%,女性为14.4% [17],男女教育回报率的差距也在上述区间。
虽然国内外研究得出相对一致的结论,大都认为女性教育回报率普遍高于男性,但上述研究仍有两点值得完善:一是以上文献大多研究的是高等教育回报率,而我国2019年高等教育毛入学率为51.6% [18],其他层次教育水平的教育回报率有待研究。二是未考虑样本自选择问题,已有研究较多地使用了传统OLS、工具变量法和Heckman两步法等估计教育回报率,而这些方法无法很好地解决内生性问题,会使模型估计结果有一定偏误。因此,本文使用2015年中国综合社会调查(CGSS2015)数据,通过反事实因果推断分析框架中的倾向得分匹配法(propensity score matching, PSM)对教育回报率进行估计,以期尽可能减少样本自选择问题,缩小模型估计误差。
2. 数据与方法
2.1. 数据来源与样本描述
本文使用的数据全部来源于2015年中国综合社会调查(CGSS2015),该调查由中国人民大学中国调查与数据中心与香港科技大学社会科学部共同执行的一项全国性调查项目。该项目自2003年起对中国各省、市、县的2700多个县,10,000多户家庭进行连续性截面调查,揭示中国人的态度、行为模式和社会结构,是目前学术界公认的具有科学研究价值的权威数据。本文使用CGSS2015数据理由如下:第一,本文使用的PSM研究方法需要的数据量较大,该数据总样本量10,968个,符合数据要求。第二,数据中有各个教育阶段和与收入紧密相关的变量,契合研究内容。第三,该数据采用分层四阶段概率抽样方法,样本具备较好的代表性。本文研究使用STATA16软件对数据库进行处理,将样本限定为男性18至60岁、女性18至55岁的人口,剔除了在校生、收入为零及相关信息缺失的观测值,最终得到有效样本4679个。具体描述统计见表2。
注:数据来源:CGSS2015。
2.2. 理论模型与变量设置
2.2.1. 模型设定
本文基于Rubin (1974)提出的“鲁宾因果模型”,采用倾向得分匹配法(PSM)对不同教育阶段的教育回报率进行估计。PSM不仅能够解决由样本自选择造成的有偏估计问题,而且在处理变量内生问题时,没有函数形式、参数及误差项分布等条件限制,也不需要解释变量外生以识别因果效应。因此本文建立如下模型估计不同教育阶段的教育回报率:
(1)
(1)式中,
代表劳动力个体的收入水平,
为劳动力个体i可观察的个体及家庭特征变量向量;D为劳动力个体i的教育水平向量,代表不同阶段的教育水平,Di为劳动力i是否接受过某阶段教育,Di = 1代表接受过,Di = 0代表未接受过;
为劳动力个体i的教育回报率;
为随机分布项。
2.2.2. 变量设置
被解释变量是劳动力个体的年收入,用劳动力个体年收入的对数lnY来衡量,核心解释变量(处理变量)为教育变量向量,包括小学学历、初中学历、高中学历、大专学历和大学学历(本科及以上) 5个二分类变量。鉴于我国义务教育普及情况良好,小学到高中学历对照组为本阶段教育学历之前的样本,高中以后学历的对照组为前一阶段学历水平。即在高中学历分组中,若劳动力个体学历为高中,则该变量赋值为1,若劳动力个体学历为高中之前则赋值为0;在专科学历分组中,若劳动力历个体学历为专科,则该变量赋值为1,若劳动力个体学历为高中则赋值为0,以此类推。同时对受教育年限作如下转换:根据问卷中对学历的划分,将“没有受过任何教育”“私塾、扫盲班”认定受教育年限为0年;“小学”为6年;“初中”为9年;“职业高中”、“普通高中”、“中专”、“技校”统一为12年;“大学专科”为15年;大学本科为16年;“研究生及以上”为19年,其中辍学的按该学历层级的一半取值,方便后续计算工龄。
PSM是基于匹配变量的拟合值进行分组配对的,因此,匹配量X应选择家庭背景、个人特征以及尽可能与教育和收入都相关的变量作为匹配变量,以满足条件独立假定,此外,匹配完成后配对数据要满足共同支撑假设和平衡性假定。参考已有研究的做法,本文选择父亲受教育水平、母亲受教育水平、户口、籍贯、家庭规模作为家庭背景特征向量,性别、工龄、工作经验、健康水平、婚姻、政治面貌、普通话水平、民族和宗教信仰等个人特征向量作为匹配变量。具体见表3。
3. 研究结果与分析
3.1. 教育回报率的估计
表4~6给出了各教育阶段教育回报率在最近邻居匹配、半径匹配和核匹配三种方法计算下的估计结果。模型(1)~(3)分别代表全样本以及男、女子样本。

Table 4. Rate of return of education at different educational levels (nearest neighbor matching)
表4. 不同教育层次教育回报率(最近邻居匹配)
注:***、**和*分别表示在1%、5%和10%统计水平上显著。

Table 5. Rate of return of education at different educational levels (radius matching)
表5. 不同教育层次教育回报率(半径匹配)
注:***、**和*分别表示在1%、5%和10%统计水平上显著。

Table 6. Rate of return of education at different educational levels (kernel matching)
表6. 不同教育层次教育回报率(核匹配)
注:***、**和*分别表示在1%、5%和10%统计水平上显著。
表4~6分别使用了最近邻居匹配、半径匹配和核匹配三种方法,可以看到三种匹配的结果教育收益率都非常接近,且三个样本的大多数分组在这三种方法的t检验结果都在1%到5%的水平下显著,说明结果是稳健的。
总体而言,教育回报率与学历呈正相关,即学历越高,教育回报率越高,这一结论与其他学者研究结论相同。且相较于前一教育水平,受教育水平层次越高,教育回报率均提高得越多。
全样本中,除初中学历外,其他层次教育的教育回报率结果在3中匹配方法中统计上均较为显著。初中学历教育回报率在统计上不显著可能原因是,相对于未达初中学历的样本来说,初中学历在社会上也并无任何竞争力,都只能从事较为简单的体力劳动。
男性子样本在高中学历之前的教育回报率在最近邻匹配和半径匹配中均不显著,但男性高中学历教育回报率在核匹配方法中在1%的统计水平上显著,大专及以上学历在3种匹配方法中统计上均较为显著。其中教育回报率不显著的原因与全样本类似,高中学历相对于初中学历差别也不大。但是在核匹配中高中学历教育回报率十分显著,这仍需要进一步的研究。
女性样本除初中教育回报率不显著外,其他层次教育的教育回报率在3中匹配方法中统计上均较为显著。女性初中教育回报率不显著的原因大致与前述理由相同。
3.2. 共同支撑假设
PSM匹配效果如何首先需要检测模型是否满足共同支撑假设。如果对照组和处理组的匹配变量的重叠区间太窄,处于重叠区域外的样本无法实现有效匹配,从而导致过多的样本损失,会影响处理效应的可靠性。图1是男女子样本处理组和对照组在各教育阶段匹配后的密度函数图。可以看出,匹配后男性、女性小学和初中学历的处理组和对照组的倾向得分区间具有相当大范围的重叠,但在密度分布上重合度不算太好,拟合效果不佳;匹配后男性、女性高中学历及之后的处理组和对照组的倾向得分区间具有相当大范围的重叠,且密度分布重合度较高,表明大多数观察值在共同取值范围内且拟合效果较为理想,进行倾向得分匹配仅会损失少量样本,共同支撑条件得到满足。
3.3. 平衡性假定检验
PSM匹配后还需要使得处理组和对照组在各个维度上的变量特征上没有显著的差异。若完成匹配后的变量之间还存在显著差异,则难以减小因为样本个体异质性产生的偏差而得到净效应。本文参考陈强教授的做法,比较匹配前后处理组与对照组之间匹配变量的标准化偏差,标准化偏差减小表明两组差异减小;考察匹配后处理组与对照组之间匹配变量的均值是否存在差异,用p值检验判断差异是否显著。结果见表7。

Table 7. Balance hypothesis test results (university group)
表7. 平衡性假定检验结果(以大学学历分组为例)
首先看标准化偏差(%bias)是否减小。匹配后,10个分组样本中处理组与对照组各匹配变量的标准化偏差均大幅减小,匹配后偏差大都低于10%,除个别外基本上都低于25%,满足Rubin [19] 对样本匹配的要求,大幅降低了教育回报率的估计总偏误,证明匹配效果较好。
其次用t检验对处理组与对照组的匹配变量均值进行差异显著性检验。结果表明,匹配后绝大部分变量的均值没有显著差异,说明成功匹配的样本除学历变量外可看作一个人,即满足反事实分析框架。
总体而言,男女子样本在匹配后显著降低了配对个体之间变量的差异,大幅度降低了样本内生性带来的自选择偏误,满足了平衡性假定要求,样本匹配效果良好。
3.4. 男性和女性教育收益率差异的比较
基于倾向得分值,本文对样本进行匹配并分别计算出男性和女性在各教育阶段的教育回报率,即表4~6中ATT值。由表4~6可知,这三种匹配方法得到的结果无明显差异,与已有文献中匹配方法对匹配结果影响不大的结论相一致。本文男女子样本在各教育阶段的控制组和对照组样本量均比较充足,满足PSM对数据量的要求。其中核匹配效率最高,使用该匹配方法完全可以保证匹配的质量,且方差较小,估计效果较好。因此,本文主要讨论核匹配法的估计结果,同时,由于男女子样本在小学和初中学历分组中匹配效果不佳,所以,本文主要讨论高中及之后学历的教育回报率。
从表6可知,个体在不同教育阶段的教育回报率不同,男女样本在相同教育阶段获得的教育回报率也不同。整体上对教育收益率进行比较,可以发现:从各阶段教育的教育回报率来看,全样本和男女子样本的教育回报率都随着教育层次的提升而增加,且各个教育阶段的教育回报率男性均略高于女性0.3个百分点左右。
男性小学学历的教育回报率为9.49%,高于女性的9.25%,不同以往研究的是,拥有小学学历的男性教育回报率略高于女性,但男性小学教育回报率在统计上不显著。男性初中学历的教育回报率10.05%,仍高于女性的9.67%,两者均高于小学学历的教育回报率,但在统计上都并不显著。因此,此两项结论有待进一步研究。
男性高中学历的教育回报率为10.39%,高于女性的10.10%,两者教育回报率均高于受教育水平未达高中的样本。说明在完成义务阶段教育后,无论男女接受高中教育将会获得更高的教育回报。不同与以往研究的是,高中教育阶段男性教育回报率略高于女性0.29个百分点。
男性大专学历的教育收益率为10.83%,高于女性的10.60%,两者教育回报率均高于受教育水平为高中的样本。说明在完成高中阶段教育后,接受大专教育的个体将会获得更高的教育回报。同样不同与以往研究的是,大专学历的男性教育回报率略高于女性0.23个百分点。
男性大学学历的教育收益率为11.15%,高于女性的10.84%,两者教育回报率均高于受教育水平为高中的样本。表明在完成高中阶段教育后,接受大学教育的个体将会获得更高的教育回报,且回报率高于接受大专学历。同样不同与以往研究的是,大学学历的男性教育回报率仍略高于女性0.31个百分点。
综上所述,我国男性在各个教育阶段的教育回报率均要略高于女性。
4. 结论与展望
已有关于教育收益率性别差异的国内外研究均认为女性的教育收益率相对更高,但这一结论对样本的内生性问题的处理并不理想。为了尽量消除内生性问题,本文基于准实验研究的倾向得分匹配法研究我国男性和女性在不同教育阶段的教育回报率,本文研究结论如下:
一是教育回报率与学历呈正相关,无论全样本还是男女子样本,学历越高,教育回报率越高。全样本模型结果显示,小学学历的教育回报率为9.42%,后持续增长至大学学历的11%;男性子样本中,教育回报率从小学学历的9.49%一路增加到大学学历的11.15%;女性子样本中,教育回报率从小学学历的9.24%持续增长至大学学历的10.84%。
二是不同于主流研究结论,本文计算出男性教育回报率在各个教育阶段均略高于女性。小学学历的男性教育回报率约比女性高出0.25个百分点,初中学历的男性教育回报率约比女性高出0.38个百分点,高中学历的男性教育回报率约比女性高出0.29个百分点;大专学历的男性教育回报率约比女性高出0.23个百分点;大学学历的男性教育回报率约比女性高出0.31个百分点。
本研究还有很多不足,文中只研究了不同教育阶段教育回报率的性别差异,尚未进一步研究不同收入、地域和行业等的差异,具有较大的研究空间。此外,本研究中小学和初中阶段的回报率在统计上并不显著,仍有待进一步的研究和完善。总体而言,本文基于准实验研究的倾向得分匹配法研究我国男性和女性在不同教育阶段的教育回报率,得出的结论不同与以往女性教育回报率高于男性的主流观点,主要在于PSM模型较好地消除了由于自选择带来的内生性问题,经过多种匹配方法结果并无差异证明其结果的稳定性。且本文结论与郑洁等对欧洲十五国教育收益率的研究综述所总结的结论相符合。欧洲十五国中有十三个国家对性别教育收益率进行了分析,其中,只有奥地利和英国的女性教育收益率高于男性,而大多数国家都得到了与之相反的结论或国内无一致性结论 [20]。鹿立 [21]、赵力涛 [22]、候风云 [23] 等的实证研究也证实了此观点。因此,本文结论具有一定的可靠性,对教育回报率性别差异的异质性研究具有一定的启发和借鉴意义。