1. 引言
居民收入水平的影响因素研究是经济学和社会学长期关注的重要问题之一,对促进社会公平和经济社会发展具有重要意义,在经济学中,著名的明瑟方程就研究了这一重要问题。改革开放以来,居民的生活水平大幅提高,人们一般认为人力资本的投入可以明显提升居民个人生活水平,尤其是教育的投入,教育对收入的影响具有很大的现实意义。客观认识这一问题可以使人们提升人们对教育的重视程度,从而有助于人们做出更为理性的决策和合理的规划,同时教育具有较强的政策意义,收入的增长是较少贫困的重要组成部分,认识到教育的政策意义有助于增加居民收入,减少贫困,促进社会公平。
关于教育对收入的影响,许多研究者对其进行探讨分析。学者董良采用明瑟方程和“布劳–邓肯”模型研究了教育对个人收入的影响,经过深入的探讨,发现接受教育水平越高,收入越高 [1];谢周亮使用2005年中国综合社会调查数据,采用基于回归方程的因素分解法,对造成个人收入差异的因素及其影响程度进行比较分析,结果显示,个人教育回报随着家庭教育背景的提高而提高,并且母亲的教育背景对个人收入的正面影响相对较大 [2];曹麦基于扩展的明瑟收入方程,采用2013年中国综合社会调查数据分析学校教育和家庭教育对个体总收入的影响,结果显示,学校教育和家庭教育均对个体收入有显著的正向作用 [3];徐秋艳和张秋炜利用中国家庭追踪调查2012年和2016年的数据,讨论了家庭受教育水平和健康水平与收入水平的关系,他们发现,受教育水平高的家庭更有可能拥有更高的收入 [4];张津琛、储宁、孙东宁利用2015年中国综合社会调查数据指出教育对居民个人收入具有正向的影响,将教育看作是一种预测人未来生产率的信号,个人的受教育年限越长,收入水平也就越高 [5];李秀玉、蔡玉洁利用2015年中国综合社会调查数据强调了质量可比的教育对居民个人的收入具有正向的影响 [6]。
综上所述,大多数研究者都强调了教育对居民收入的影响,他们可能更偏向于从个人的受教育年限的角度进行分析,本文则试图从教育的多个方面进行剖析,如个人的受教育程度、配偶或同居伴侣的受教育程度、父亲的受教育程度、母亲的受教育程度、教育和培训支出等方面,利用2017年中国综合社会调查数据分析教育对居民收入的影响。
2. 数据来源与统计方法
2.1. 数据来源
中国综合社会调查是在全国范围内进行调查,样本量很大,数以万计,是我国最早的全国性、综合性社会调查,是研究中国社会最主要的数据来源,非常具有权威性。中国人民大学2017年进行的“中国综合社会调查”是一项全国范围内的大型随机抽样调查,调查问卷数量多且问卷内容充实,利用该调查数据进行研究得出的结论可以推论全国,提供了大量详实且微观的数据。利用stata对数据进行处理之后,关于年收入的有效样本数据达到了11,900,基本上可以代表中国居民的真实情况。
2.2. 统计方法
本文采用统计分析软件stata16.0进行分析,对居民受教育程度、配偶或同居伴侣受教育程度、父亲的受教育程度、母亲的受教育程度和教育培训支出进行嵌套式多元回归分析,分析这些变量对因变量居民收入的影响。
2.3. 变量说明与描述
本文从教育入手分析对居民收入的影响,并且从教育的多个方面进行研究,因此选取居民的受教育程度、配偶或同居伴侣的受教育程度、父亲的受教育程度、母亲的受教育程度以及教育培训支出作为自变量,居民年收入作为因变量,由于本文研究的是教育对收入的影响,将年龄、性别、家庭收入等作为控制变量。因为居民的受教育程度、配偶或同居伴侣的受教育程度、父亲的受教育程度、母亲的受教育程度四个变量属于类别变量,因此采取tab的命令对其进行描述,教育培训支出和居民年收入属于连续变量,因此采取sum的命令对其进行描述。
从表1可以看出,居民2016年的收入平均水平达到了4万元,标准差显示大部分居民年收入值与均值具有较大的差异,说明居民收入差距相对来说较大,通过表格中的最大值和最小值也可以显示出来,这也从侧面说明居民的年收入的分配不均匀,需要对年收入值取自然对数;第二行的教育培训支出的均值到达了27,000元,标准差较小,说明教育培训支出与平均值相比差距较小,但是从最大值最小值来看,居民教育培训支出的差距还是比较大的。
从表2可以看出,最高受教育程度一栏的样本量达到了12,582人,样本数据充足,并且可以看出目前在读高中以下年级的人占大多数,所占比例高达62.44%,其中目前受教育程度是初中的人数最多,达到了3500人,占比27.9%;高中阶段受教育程度是普通高中的人数最多,有1470人,占比11.68%,并且和读其他高中相比差距较大;大学以上阶段大约占比20%,相对来说较为均衡,但是在大学阶段,最高受教育程度是大学本科的人数最多,占比最大。
从配偶或同居伴侣最高受教育程度这一栏可以看出,大部分人的学历集中于高中以下阶段,占样本总数的65.7%,但是其中大部分人数还是接受过小学和初中的教育,没有受过教育的人占比较小,接受过私塾和扫盲班教育的人数少之又少;高中阶段人们的受教育情况则主要集中于普通高中,接受普通高中教育人数占比12.06%;大学阶段接受普通本科教育的人数最多,占比5.8%。
从父亲最高教育程度一栏可以看出大部分人学历集中于高中以下阶段,高中学历一下人群占样本比例达到了85.96%,其中没有接受过教育的人数最多,占比最大;高中阶段接受普通高中教育的人数最多,占比较大;大学阶段接受大学本科教育的人数相对来说较多,占比1.95。
从母亲最高教育程度一栏中可以看出绝大部分人接受过高中以下的教育,高中以下学历人数达到了91.98,其中58.45%的人没有接受过教育,是接受过私塾、小学初中教育人数的一半;高中和大学阶段大部分人数接受过普通高中和本科教育。
总体来看,大多数人接受过比较系统的教育,经历了从小学、初中、普通高中和大学本科的教育,但是相对于父亲母亲接受的教育程度来说,居民自己和配偶的教育程度相对较高,父亲母亲大部分人甚至都没有接受过教育,这也从侧面反映了随着社会的发展,人们也越来越注重教育的作用,追求高学历的人群越来越多,没有接受过教育的人越来越少。
Table 2. Describes the statistical results
表2. 描述统计结果
3. 模型分析
3.1. 模型解释
本文探讨分析教育对各方面对居民收入的影响,选取居民目前的受教育程度、配偶或同居伴侣的受教育程度、父亲的受教育程度、母亲的受教育程度以及教育培训支出作为自变量,居民年收入作为因变量,分析多个自变量对一个因变量的影响,因此选取多元回归中的嵌套模型,根据变量构建以下四个模型:
模型1:y(yincom) = a + b1*x1(edulevel)
模型2:y(yincom) = a + b1*x1(edulevel) + b2*x2(peduclevel)
模型3:y(yincom) = a + b1*x1(edulevel) + b2*x2(peduclevel) + b3*x3(feduclevel)
模型4:y(yincom) = a + b1*x1(edulevel) + b2*x2(peduclevel) + b3*x3(feduclevel) + b4*x4(meduclevel)
模型5:y(yincom) = a + b1*x1(edulevel) + b2*x2(peduclevel) + b3*x3(feduclevel) + b4*x4(meduclevel) + b5*x5(educmoney)
“yincom”为因变量居民年收入,“edulevel”为居民目前的最高受教育程度,“peducleve”表示配偶或同居伴侣的最高受教育程度,“feducleve”表示父亲的最高教育程度,“meduclevel”表示母亲的最高教育程度,“educmoney”表示教育培训指出。
3.2. 模型分析
3.2.1. 模型1结果分析
在模型1中,居民年收入为因变量,居民的最高受教育程度为自变量。此模型为基准模型。
从图1中可以看出,模型1是显著的,p值 = 0.0000 < 0.05,R-squared是0.2808,表明其解释力度为0.2808,这个模型解释了28.08%的收入受到居民受到的最高教育程度的影响,自变量居民的最高受教育程度的p值 < 0.05,说明自变量对因变量的影响是显著的。根据上图可以得出模型1的公式,即y = 8.799824 + 0.2157*x1,也就意味着居民的受教育程度上升一个水平,居民收入会增加0.2156922元。
3.2.2. 模型2结果分析
模型2中加入新的自变量配偶或同居伴侣的最高受教育程度,在图2中可以看出模型的p值 < 0.05,R-squared的值为0.3156,较模型一R方值变大,这说明R方解释力度变大,31.56%的收入影响来源于居民受教育程度和配偶的受教育水平;除此之外,两个自变量的p值都 < 0.05,说明自变量对因变量的影响是显著的,利用T检验(图3)也可以得出加入新的变量之后,模型的效果更好。同样可以得出模型2的公式:y = 8.702983 + 0.1786742*x1 + 0.071886*x2。意味着这两个自变量和因变量之间呈现正相关关系。
3.2.3. 模型3结果分析
模型3中加入了新的自变量父亲的受教育程度,从中可以看出整个模型是显著的,R-squared的值上升,这说明自变量对因变量的解释力度变大;三个自变量的p值均 < 0.05,也说明三个自变量对因变量的影响是显著的,并且呈现正相关的关系(图4)。模型3的公式可表示为y = 8.66824 + 0.1704935*x1 + 0.0608742*x2 + 0.0428005*x3。
3.2.4. 模型4结果分析
模型4中加入了新的变量母亲的最高受教育程度,可以看出整个模型是显著的,各个自变量对因变量的影响也是显著的,p值均 < 0.05,并且系数都为正,这说明四个字自变量和因变量之间呈正相关关系,R-squared的值上升,这说明自变量对因变量的解释力度进一步变大(图5)。模型4的公式可表示为y = 8.665019 + 0.1672155*x1 + 0.0564421*x2 + 0.0284888*x3 + 0.0388127*x4。
3.2.5. 模型5结果分析
模型5中加入新的新的变量教育培训支出,图中显示整个模型是显著的,R-squared的值没有明显上升,说明教育培训支出对居民收入的影响没有很大的解释力度,并且教育培训支出的p值 > 0.05,这说明教育培训支出对居民收入的没有影响,因此在后续的分析中就不考虑教育培训支出对居民收入的影响(图6)。
为检验各个自变量是否存在共线性问题,因此进行VIF检验操作。
由图7中可以看出VIF的均值为1.85,并没有明显大于1,因此自变量的选择不存在共线性问题。
从表3的结果中,也可以看到,通过嵌套模型的不停增加,除教育培训指出这个变量之外,其他变量都对居民收入都有影响,解释力度在不断变大。
Standard errors in parentheses. ***p < 0.01, **p < 0.05, *p < 0.1.
4. 结论
通过以上研究分析,可以得出居民年收入会受到受教育程度的影响,并且居民自己的受教育程度、配偶或同居伴侣的受教育程度,父亲母亲的受教育程度与居民的收入呈现正相关关系。我们可以这样进行解释,居民自己的受教育程度高,学识水平高,更容易找到薪资高的工作,这直接会对居民收入产生影响;配偶或同居伴侣的受教育程度高,很大程度会找到高薪工作,这样就为居民自己减轻压力负担,居民自身的收入就会保持较高的水平;同样,父亲母亲的受教育程度高,具备优越家庭的学习氛围,重视对子女的学习教育,直接对子女产生影响,在一定程度上会提高子女的学习素质,从另一方面也说明家境殷实,为后代奠定了财富基础,那么居民个人会遗传父母的财富,居民自身的能力会保持在相对高的水平,也会对居民收入产生正向的影响。从分析来看,我们可以知道居民自身受教育的程度会对居民收入产生直接的正向影响,配偶或同居伴侣、父母的受教育程度对居民收入会产生间接的正向影响。根据分析结果来看,教育培训支出没有发生影响,可能教育支出和收入没有直接的相关关系。我们试图这样进行解释,随着教育培训支出的上升,个人的受教育水平可能会提高,但是另一方面教育支出的扩大可能会导致当下收入的减少,这也说明教育培训支出与收入之间没有直接的联系,因此在模型中教育培训支出不会影响居民收入。
教育是对中华民族伟大复兴具有决定性意义的事业,不管是我们国家还是家庭都应该重视教育的发展,提升受教育水平一方面有助于提升我们自己的认知水平,扩展认识世界的角度,另一方面也有利于家庭水平的提高,有利于国家的发展。因此我们要注重教育水平的提升,进一步强化义务教育,提高全民的文化教育水平,让大部分人集中聚焦于高中阶段的教育水平,扫除文盲;同时随着互联网的普及,相关教育部门可以整合优秀的中高等学校的教育资源,集中优秀师资探索开展“慕课”“翻转课堂”等多种形式的网络教育,让那些没有能力上优秀学校的人也可以得到优质的辅导,从而提升教育水平。在家庭教育中,父母也需要不断的加强学习,提升个人学识和素质,做好家庭教育,重视对孩子学习能力的培养。