1. 引言
近些年来,中国人口出生率持续下降,出生的新生儿持续减少,2022年首次出现人口负增长,政府和百姓对此无不深感忧虑。为了摆脱几千年来贫穷落后的困苦局面,十一届三中全会确立了改革开放国策,从此中国经济发展步入快车道,人们增加了收入,提高了生活水平。然而,随着经济的发展,诸多社会问题也伴随产生,结婚率下降、离婚率上升,新生儿、儿童及青少年占比下降,老年人占比上升。当今社会在适婚年轻群体中,不婚不育思潮、畏婚畏育情绪、难婚难育困境大范围存在,导致越来越多的微观家庭和个人将面临后继无人风险。发展经济,脱贫致富,改善生活固然是千百年来人们梦寐以求的夙愿。然而,若是若干代人奋斗形成的财富无人继承,对微观个人和家庭将意味着几代人艰辛奋斗的意义大打折扣。子孙后代渐进萎缩对民族而言则存衰败之忧,对国家而言未来安全将难有保障。从古至今,可以说,人口繁衍生生不息是隐藏在经济发展生活富足之下更深层的奋斗初衷,是中华民族不同于西方等其他民族最深沉的民族情感,是世世代代心心念念最殷切的心愿,否则便背离发展初心,深入反思发展模式和调整政策举措就势在必行。为此,本文理论与实证分析我国人口出生率下降的影响因素及影响程度,进而相应提出对策建议以遏止人口下降趋势就具重要的理论与现实意义。
2. 文献综述
我国人口发展正经历历史性转折,不仅牵动着政府与百姓的心,也引发学界广泛关注。本文从经济因素、文化教育、政策干预等维度分别梳理国内外人口出生率影响因素问题的相关研究,具体如下:一是经济因素对人口出生率的影响。这类研究相对丰富,涉及收入、物价、就业、房价、金融、人力资本等因素。Becker (1960)提出的“新家庭经济学”理论认为,随着收入增长,带来子女“质量替代数量”效应[1]。闫超、霍子蓬(2024)实证发现,物价上升对出生率存在较为显著的负向影响[2]。就业形态也会影响生育意愿。张车伟等(2023)分析认为,平台经济从业者的生育意愿较传统就业者低23.6% [3]。Uber (2024)对美国零工经济的比较研究结论相似[4]。Balbo等(2024)提出经济不安全感传导机制,认为非正规就业通过降低婚姻稳定性间接抑制生育[5]。孙博伟等(2025)研究认为,出口部门女性劳动力参与会影响其婚育决策增加女性未婚人口从而降低人口出生率[6]。住房是近些年来普通家庭压力最大消费品。陈卫(2018)发现中国城镇家庭面临“房价–生育率悖论”,住房支出占比每增加10%,生育意愿下降18% [7]。韩国学者Lee (2023)也有相似发现,指出首尔都市圈房价收入比与生育率显著负相关[8]。王旺、王宇伟(2024)从金融视角,发现金融发展对人口出生率的影响先促进后抑制且存在区域异质性[9]。钟晓龙、王自锋(2022)从人力资本视角,认为人力资本提高会通过降低生育意愿、延缓生育进度从而降低人口出生率[10]。二是教育程度、文化观念及社会结构变迁对人口出生率的影响。教育对人口出生率影响的研究结论差异明显。张冲、万新月(2019)认为,人均受教育年限对人口出生率的影响呈“U”型关系,高等教育普及率对本区域和周边地区人口出生率均有显著正向影响[11]。郑真真(2023)则指出,中国女性高等教育毛入学率已达59.6%,但家庭劳动性别比仍维持在2.3:1,这种矛盾导致生育萎缩现象[12]。王广州(2025)研究发现,一线城市职业女性因受教育程度较高年限较长,平均推迟初育年龄至30.2岁,较农村地区高4.3岁[13]。生育文化的代际嬗变是形成低生育率的重要深层原因。风笑天(2016)追踪发现,我国“90后”群体普遍将子女视为“情感消费品”而非养老保障,这种观念转变使理想子女数降至1.7个[14]。韩国学者Kim (2023)的跨国比较研究显示,儒家文化圈国家的个体化进程较西方快1.8倍,加速了生育观念转变[15]。社交媒体扩散了这种生育文化氛围,李静(2024)的文本挖掘显示,“恐育”话题在微博的讨论热度三年增长470% [16]。人口老龄化加深是近年来人口结构演变最鲜明的特征。陶祥兴等(2019)研究浙江省人口出生率影响因素发现,人口老龄化对人口出生率产生负向影响[17]。三是政策干预的影响研究。Bongaarts (2001)构建的政策效应模型预测,每增加1% GDP的生育投入可提升总和生育率0.15% [18]。严成樑(2018)研究认为,在特定参数环境下延迟退休与人口出生率之间呈现倒U型关系或单调递减关系,应充分考虑延迟退休通过隔代教养渠道对人口出生率的负向影响[19]。许坤等(2022)分析认为,生育政策和生育成本社会化转移有利于提高人口出生率[20]。李萌萌等(2023)类似认为,婴幼儿养育成本的提高显著抑制人口出生率,通过提升“幼有所育”公共服务水平可显著缓解[21]。Gauthier (2024)在跨国研究中发现,中国婴儿津贴支持覆盖率仅37%,远低于OECD国家79%的平均水平[22]。不过,地方创新实践提供了新思路。贺丹(2025)发现,杭州“生育积分制”将住房优惠与生育挂钩,使试点区生育率回升12% [23],这与德国“Elterngeld Plus”政策(Duvander, 2023)的设计理念不谋而合[24]。杨菊华(2024)特别强调,流动人口的“政策盲区”亟需关注,其享受生育保险的比例不足城镇户籍人口的1/3 [25]。孙思栋、高文书(2025)研究发现生育支持政策对提高人口出生率具有积极作用,可以对冲延迟退休政策对人口出生率的负面影响[26]。
综上所述,上述研究对理论理解人口出生率的影响因素以及把握这些因素的影响程度有一定意义,但由于人口出生率影响因素比较复杂,现有关于人口出生率影响因素的研究纳入因素大多不足,难以形成立体综合的认知。本文将综合纳入结婚离婚状况、收入水平、社会保障、住房教育医疗支出、教育覆盖程度、环境污染及计生政策等诸因素,在理论分析基础上进行实证研究,以期挖掘影响中国人口出生率的重要因素及其影响程度,为政府精准施策促使人口出生率回弹提供决策参考。
3. 中国人口出生率的演变现状及其影响因素的理论分析
3.1. 演变现状
新中国成立以来,我国人口出生率演变经历过几个阶段:第一阶段是1950~1961年,属于建国初期,期间人口出生率在1954年最高达到38%,1961年最低降至18.1%;第二阶段是1962~1980年,1962年人口出生率迅速反弹到37.2%,1963年最高达到43.6%,1966~1976年人口出生率持续下降,1979年最低降至17.8%;第三阶段是1980~1993年,属于改革开放发展初期,“一孩政策”落地实施,人口出生率基本在18.1%~23.3%区间平稳波动;第四个阶段是1994~至今,人口出生率从1994年跌破18%后只有2011~2014年短暂微弹,其他年份基本逐年下滑,2017年后呈加速下滑态势,2020年跌破10%,2023年最低降至6.4%,出生人口下降趋势令人怵心,如何遏止是政府和社会都不容回避的重大问题(如图1)。
Figure 1. Trend chart of China’s birth rate from 1950 to 2024
图1. 1950~2024年中国人口出生率趋势图
3.2. 理论分析
近些年来,中国人口出生数量减少,人口出生率持续下降。究竟是什么原因导致了人口出生率持续下降?这是人们普遍关心的问题。然而,造成人口出生率持续下降的原因是复杂的、多元的,需要综合考虑分析。
首先,最直接相关因素就是结婚和离婚状况。一般而言,结婚数量多,会提高人口出生率;离婚数量多,则会降低人口出生率。1995~2023年期间,中国结婚率从7.71%降至5.45%,粗离婚率从0.88%升至2.56%。理论上,结婚率下降和离婚率上升均会因婚育夫妇数量下降而导致人口出生率下降。
其次,间接影响因素就多种多样,通过影响人们生活质量、生活方式与身心健康进而影响生育意愿、生育观念、生育年龄及生育能力,最终传导到人口出生率水平。其中,增加人们生活压力影响人们生活质量的因素包括住房、教育及医疗成本等。近些年来,普通百姓普遍感到婚房购买压力、培养孩子的教育成本压力及看病医疗成本压力较大,削弱了适婚男女青年的结婚意愿和已婚青年男女的生育意愿,是适婚青年男女不婚不育思想、畏婚畏育情绪、难婚难育困境的重要经济原因。理论上,这些方面经济压力越大,人口出生率就越低。
第三,影响人们婚恋条件、抚养条件进而影响人们的结婚和生养意愿的因素,包括城镇化和受教育程度上升等。其中城镇化的推进,造成家庭结构从过去几世同堂的家庭结构异变成五湖四海分处的小家庭结构,严重影响了青年男女的抚养条件,进而抑制生育意愿;高等教育普及化在提升人们认知水平的同时,也延迟了青年人的婚恋年龄,婚恋距离也从传统同乡配婚转变到异乡配婚,增加了婚恋难度,改变了婚恋观念,降低了结婚比率,进而降低人口出生率。理论上,城镇化程度、教育普及率提升将抑制人口出生率水平。
第四,影响人们身心健康进而影响人们生育能力的因素包括人们身心健康状况、环境污染等,后者由于污染物质会侵害人们身体健康进而弱化生育能力降低人口出生率。理论上,健康状况越差、环境污染越严重,将抑制人口出生率水平。
第五,除了上述不利因素外,也还存在一些有利因素,如收入水平提高和社会保障改善,有助于提升人们的婚恋经济能力和生育意愿。理论上,人们收入水平越高,社会保障越完善,将提升人口出生率水平。
最后就是国家的生育政策,理论上,限制性生育政策会抑制人们的生育数量;鼓励性生育政策会增加人们的生育数量。大体上,1979~2012年严格实施独生子女政策,2013~2020年逐步推进二孩政策,2021年后推出三孩政策。前期长达33年的一孩政策影响深远,理论上预期负面影响尚未逆转。
基于上述理论分析,可以构建如下基础多元回归模型:
(1)
其中,y表示被解释变量,α0表示常数项,
分别表示回归系数,
分别表示上述理论分析中提及的解释变量,ε代表残差项。
4. 中国人口出生率影响因素的实证分析
4.1. 数据来源及说明
对应上述理论分析的影响因素,本文分别选取人口出生率(pr,%,被解释变量),反映人口出生水平;结婚对数增长率(rmarr, %)1和粗离婚率(vdivorce, %)2分别反映结婚和离婚状况;房价(lnhouseprice,取自然对数)、各类学校教育经费学杂费(lneducost,取自然对数)、人均现金卫生支出(lnmedcost,取自然对数)等指标分别反映人们在住房、教育及医疗等日常生活方面承受的经济压力;选取城镇人口增长率(vurban, %)3反映城镇化水平的指标;选取普通高等学校招生数(lnedu,取自然对数)反映人们受教育状况的指标;选取乡镇卫生院诊疗人次数(lnpatient,取自然对数)反映人们健康状况的指标;选取二氧化硫排放量(lnso2,取自然对数)反映环境污染状况的指标;选取居民人均可支配收入(lnincome,取自然对数)和城镇职工基本养老保险基金支出(lnpension,取自然对数)分别反映人们收入水平和社会保障水平的指标;上述指标结合数据获得情况,时段选取1995~2023年;最后是计生政策(policy)指标,作为虚拟变量纳入回归方程,根据计生政策调整历程,分别取值为1 (1995~2012年)、2 (1996~2020年)和3 (2021~2023年)。上述变量数据主要来源于中国历年统计年鉴、中国环境年鉴等或经加工计算得到,个别缺失数据运用统计方法估算得到。
4.2. 数据的相关性分析
表1是运用stata统计软件,对所有变量数据求解相关系数的输出结果。根据表1可知,如果按照绝对值0.8来评判,整体而言,rmarry、lnpatient、lnso2等解释变量与其他解释变量之间的相关性相对较低,预期回归分析所产生的多重共线性影响相对较弱;vdivorce、lnincome、lnpension、lnhouseprice、lneducost、lnmedcost、vurban、lnedu、policy等其他变量之间存在较高的相关性,预期回归分析将受多重共线性影响彼此的显著性,特别是lnincome、lnpension、lnhouseprice、lneducost、lnmedcost等五个收入成本类变量与其他变量高相关性的频次多、程度深。再从相关系数看,初步判断,解释变量中只有rmarry、vurban、lnso2等与被解释变量pr正相关,而其他解释变量与pr负相关。这些变量间相关性数据信息有助于后文计量分析过程的理解、验证及变量筛选的审慎处理。
Table 1. Correlation coefficient matrix between variables
表1. 变量间的相关系数矩阵
变量 |
pr |
rmarry |
vdivorce |
lnincome |
lnpension |
lnhouseprice |
lneducost |
lnmedcost |
vurban |
lnedu |
lnpatient |
lnso2 |
policy |
pr |
1 |
0.0759 |
−0.5044 |
−0.7664 |
−0.7799 |
−0.7727 |
−0.8077 |
−0.8133 |
0.8152 |
−0.7959 |
−0.4344 |
0.7851 |
−0.7422 |
rmarry |
0.0759 |
1 |
−0.292 |
−0.2268 |
−0.2541 |
−0.2525 |
−0.1442 |
−0.2209 |
0.1455 |
−0.0319 |
−0.4151 |
0.4281 |
−0.369 |
vdivorce |
−0.5044 |
−0.292 |
1 |
0.9102 |
0.9091 |
0.9079 |
0.8636 |
0.8796 |
−0.6566 |
0.7887 |
0.7172 |
−0.6013 |
0.6606 |
lnincome |
−0.7664 |
−0.2268 |
0.9102 |
1 |
0.9978 |
0.9961 |
0.9796 |
0.9903 |
−0.8284 |
0.914 |
0.7287 |
−0.7464 |
0.8191 |
lnpension |
−0.7799 |
−0.2541 |
0.9091 |
0.9978 |
1 |
0.9945 |
0.979 |
0.9937 |
−0.8291 |
0.9131 |
0.726 |
−0.7682 |
0.8261 |
lnhouseprice |
−0.7727 |
−0.2525 |
0.9079 |
0.9961 |
0.9945 |
1 |
0.9673 |
0.9827 |
−0.8419 |
0.8934 |
0.7537 |
−0.7781 |
0.8316 |
lneducost |
−0.8077 |
−0.1442 |
0.8636 |
0.9796 |
0.979 |
0.9673 |
1 |
0.9897 |
−0.8144 |
0.974 |
0.5861 |
−0.6756 |
0.7426 |
lnmedcost |
−0.8133 |
−0.2209 |
0.8796 |
0.9903 |
0.9937 |
0.9827 |
0.9897 |
1 |
−0.8193 |
0.9386 |
0.6667 |
−0.7507 |
0.8064 |
vurban |
0.8152 |
0.1455 |
−0.6566 |
−0.8284 |
−0.8291 |
−0.8419 |
−0.8144 |
−0.8193 |
1 |
−0.7796 |
−0.6172 |
0.7617 |
−0.7987 |
lnedu |
−0.7959 |
−0.0319 |
0.7887 |
0.914 |
0.9131 |
0.8934 |
0.974 |
0.9386 |
−0.7796 |
1 |
0.4053 |
−0.5465 |
0.6166 |
lnpatient |
−0.4344 |
−0.4151 |
0.7172 |
0.7287 |
0.726 |
0.7537 |
0.5861 |
0.6667 |
−0.6172 |
0.4053 |
1 |
−0.7861 |
0.8354 |
lnso2 |
0.7851 |
0.4281 |
−0.6013 |
−0.7464 |
−0.7682 |
−0.7781 |
−0.6756 |
−0.7507 |
0.7617 |
−0.5465 |
−0.7861 |
1 |
−0.8831 |
policy |
−0.7422 |
−0.369 |
0.6606 |
0.8191 |
0.8261 |
0.8316 |
0.7426 |
0.8064 |
−0.7987 |
0.6166 |
0.8354 |
−0.8831 |
1 |
4.3. 数据的ADF检验
由于所有数据都是时间序列,因此需要进行单位根检验。运用stata统计软件,对所有变量先依据AIC/BIC统计值筛选最佳滞后项4,再对所有变量进行绘图以判断是否存在时间趋势5,然后再进行ADF检验6,如果发现原始变量非平稳,则进一步对其一阶差分进行检验,若一阶差分为I(0),则原始变量为I(1)。检验结果见表2。根据表2可知,所有原始变量都是非平稳时间序列,而其一阶差分都是平稳序列I(0),因而所有选取的原始变量都是单整时间序列I(1)。因此,原始被解释变量与解释变量之间可能存在协整关系。
Table 2. ADF test results for all variables and their first-order differences
表2. 所有变量及其一阶差分的ADF检验结果
变量 |
AIC/BIC确定滞后项 |
常数项 |
趋势项 |
t统计值 |
p统计值 |
ADF检验结果 |
pr |
lag(1) |
有 |
有 |
−0.932 |
0.9526 |
I(1) |
d.pr |
lag(0) |
有 |
无 |
−5.565 |
0.0000 |
I(0) |
rmarry |
lag(2) |
无 |
无 |
−1.511 |
0.5281 |
I(1) |
d.rmarry |
lag(1) |
无 |
无 |
−3.721 |
0.0039 |
I(0) |
vdivorce |
lag(4) |
有 |
无 |
−1.722 |
0.7409 |
I(1) |
d.vdivorce |
lag(1) |
无 |
无 |
−4.350 |
0.0004 |
I(0) |
lnincome |
lag(1) |
有 |
有 |
−1.217 |
0.9070 |
I(1) |
d.lnincome |
lag(0) |
有 |
无 |
−3.009 |
0.0341 |
I(0) |
lnpension |
lag(2) |
有 |
有 |
−1.215 |
0.9074 |
I(1) |
d.lnpension |
lag(0) |
有 |
无 |
−2.585 |
0.0962 |
I(0) |
lnhouseprice |
lag(2) |
有 |
有 |
−2.264 |
0.4539 |
I(1) |
d.lnhouseprice |
lag(0) |
有 |
无 |
−5.854 |
0.0000 |
I(0) |
lneducost |
lag(3) |
有 |
有 |
−2.573 |
0.2923 |
I(1) |
d.lneducost |
lag(1) |
有 |
无 |
−4.443 |
0.0019 |
I(0) |
Lnmedcost |
lag(1) |
有 |
有 |
−2.937 |
0.1505 |
I(1) |
d.lnmedcost |
lag(0) |
有 |
无 |
−5.032 |
0.0000 |
I(0) |
vurban |
lag(1) |
有 |
有 |
−2.598 |
0.2809 |
I(1) |
d.vurban |
lag(0) |
无 |
无 |
−9.304 |
0.0000 |
I(0) |
lnedu |
lag(1) |
有 |
有 |
−2.377 |
0.3919 |
I(1) |
d.lnedu |
lag(1) |
有 |
有 |
−3.755 |
0.0190 |
I(0) |
lnpatient |
lag(1) |
有 |
有 |
−2.222 |
0.4774 |
I(1) |
d.lnpatient |
lag(0) |
无 |
无 |
−3.454 |
0.0092 |
I(0) |
lnso2 |
lag(2) |
有 |
有 |
−0.949 |
0.9506 |
I(1) |
d.lnso2 |
lag(0) |
无 |
无 |
−3.229 |
0.0184 |
I(0) |
policy |
lag(1) |
有 |
有 |
−1.565 |
0.8059 |
I(1) |
d.policy |
lag(0) |
无 |
无 |
−5.417 |
0.0000 |
I(0) |
4.4. 数据的向前向后逐步协整回归结果
虽然ADF检验结果显示,所有变量都是单整序列,可能存在协整关系,然而由于诸多解释变量之间存在较强的相关性,因而一次性纳入所有解释变量势必造成彼此影响从而影响回归系数的显著性。一方面,本研究希望弄清楚所有解释变量与人口出生率之间的相关关系和相关程度,另一方面一次性纳入所有解释变量会出现解释变量之间彼此冲突进而影响系数显著性难以得到有效结果。
为化解此矛盾,本研究采取如下解决办法:首先,同时采用向前逐步回归和向后逐步回归法,前者从空模型开始逐步引入最显著的解释变量,后者从全模型开始逐步剔除最不显著的解释变量,再依据BIC准则选择BIC值小的逐步回归结果,并对残差项进行ADF检验,如果是平稳序列I(0),就接受该轮逐步回归结果,第一轮逐步回归结果筛选出了lnedu、lnso2、vdivorce等解释变量;其次,将第一轮逐步回归结果中的解释变量取出,进行第二轮逐步回归,操作方法和第一轮相同,残差项也经检验平稳,结果筛选出了vurban、lnmedcost、lnincome、lnhouseprice等解释变量;再进行第三轮逐步回归,但是发现,如果将剩下的解释变量lneducost、lnpatient、rmarry、lnpention、policy进行逐步回归后,虽然回归系数显著,但其残差项非平稳,因而该逐步回归结果不可接受,需要调整逐步回归模型。接下来尝试将之前取出的解释变量挑选一个重新纳入第三轮逐步回归,结果发现将lnso2重新纳入逐步回归模型,可以使除lnpatient、rmarry外的剩余解释变量系数显著,且残差项经ADF检验属于平稳序列I(0);最后,依据上述方法进行第四轮逐步回归,再次发现只有纳入lnso2效果最佳,可以将lnpatient、rmarry选入回归模型中且系数显著残差平稳,后两轮纳入lnso2变量也与变量间的相关性分析发现相印证。依据上述方法,四轮逐步回归结果见表3。
表3显示,第一轮向前逐步回归中,虽然vurban最先纳入模型中,但随着其他变量的纳入而变得不显著,第一轮向后逐步回归结果中没有纳入vurban变量,依据BIC值准则,选择BIC值更小的向后逐步回归结果。第二轮、第三轮与第四轮向前向后回归结果纳入变量虽然顺序相异,但覆盖变量一致,因而其他的统计指标值也基本相同。第三轮和第四轮回归分析中,虽然lnso2多次纳入辅助其他变量协整回归,但以其第一轮结果为分析基准。四轮向前向后回归后的残差项也都经ADF检验属平稳序列I(0),因而上述四轮结果可以采信。
Table 3. Four wheels forward and backward stepwise regression results
表3. 四轮向前和向后逐步回归结果
第一轮向前逐步回归结果 |
第一轮向后逐步回归结果 |
解释变量 |
系数 |
t统计值 |
p统计值 |
解释变量 |
系数 |
t统计值 |
p统计值 |
vurban |
2.230464 |
0.1 |
0.921 |
vdivorce |
1.990919 |
7.16 |
0.000 |
lnedu |
−3.230157 |
−8.73 |
0.000 |
lnso2 |
2.157454 |
10.24 |
0.000 |
lnso2 |
2.139219 |
7.61 |
0.000 |
lnedu |
−3.25275 |
−11.27 |
0.000 |
vdivorce |
1.986797 |
6.93 |
0.000 |
常数项 |
13.08888 |
5.45 |
0.000 |
常数项 |
13.01114 |
5.06 |
0.000 |
— |
— |
— |
— |
F统计值 = 89.54 |
Prob > F = 0.0000 |
F统计值 = 124.3 |
Prob > F = 0.0000 |
ADJ R2 = 0.9267 |
Root MSE = 0.72893 |
ADJ R2 = 0.9296 |
Root MSE = 0.71436 |
AIC = 68.47245 |
BIC = 75.30893 |
AIC = 66.48474 |
BIC = 71.95392 |
残差,lag(0),t = −5.337,p = 0.0000,结果I(0) |
残差,lag(0),t = −5.337,p = 0.0000,结果I(0) |
第二轮向前逐步回归结果 |
第二轮向后逐步回归结果 |
解释变量 |
系数 |
t统计值 |
p统计值 |
解释变量 |
系数 |
t统计值 |
p统计值 |
vurban |
101.9727 |
3.48 |
0.002 |
lnincome |
13.3047 |
3.68 |
0.001 |
lnmedcost |
−9.963571 |
−5.61 |
0.000 |
vurban |
101.9727 |
3.48 |
0.002 |
lnincome |
13.3047 |
3.68 |
0.001 |
lnhouseprice |
−6.893877 |
−1.79 |
0.086 |
lnhouseprice |
−6.893877 |
−1.79 |
0.086 |
lnmedcost |
−9.963571 |
−5.61 |
0.000 |
常数项 |
4.634687 |
0.53 |
0.600 |
常数项 |
4.634687 |
0.53 |
0.600 |
F统计值 = 38.88 |
Prob > F = 0.0000 |
F统计值 = 38.88 |
Prob > F = 0.0000 |
ADJ R2 = 0.8663 |
Root MSE = 1.0635 |
ADJ R2 = 0.8440 |
Root MSE = 1.0635 |
AIC = 90.38233 |
BIC = 97.21881 |
AIC = 90.38233 |
BIC = 97.21881 |
残差,lag(0),t = −3.739,p = 0.0000,结果I(0) |
残差,lag(0),t = −3.739,p = 0.0000,结果I(0) |
第三轮向前逐步回归结果 |
第三轮向后逐步回归结果 |
解释变量 |
系数 |
t统计值 |
p统计值 |
解释变量 |
系数 |
t统计值 |
p统计值 |
lneducost |
−7.370502 |
−9.23 |
0.000 |
lneducost |
−7.370502 |
−9.23 |
0.000 |
lnso2 |
2.863922 |
7.16 |
0.000 |
policy |
−1.092032 |
−2.06 |
0.051 |
lnpension |
6.097209 |
7.81 |
0.000 |
lnpension |
6.097209 |
7.81 |
0.000 |
policy |
−1.092032 |
−2.06 |
0.051 |
lnso2 |
2.863922 |
7.16 |
0.000 |
常数项 |
61.97129 |
8.94 |
0.000 |
常数项 |
−171.875 |
−4.93 |
0.000 |
F统计值 = 83.13 |
Prob > F = 0.0000 |
F统计值 = 83.13 |
Prob > F = 0.0000 |
ADJ R2 = 0.9215 |
Root MSE = 0.87032 |
ADJ R2 = 0.9215 |
Root MSE = 0.87032 |
AIC = 70.48486 |
BIC = 77.32134 |
AIC = 70.48486 |
BIC = 77.32134 |
残差,lag(0),t = −5.621,p = 0.0000,结果I(0) |
残差,lag(0),t = −5.621,p = 0.0000,结果I(0) |
第四轮向前逐步回归结果 |
第四轮向后逐步回归结果 |
解释变量 |
系数 |
t统计值 |
p统计值 |
解释变量 |
系数 |
t统计值 |
p统计值 |
lnso2 |
4.102329 |
7.75 |
0.000 |
lnpatient |
6.048983 |
2.66 |
0.000 |
lnpatient |
6.048983 |
2.66 |
0.000 |
rmarry |
10.8557 |
2.57 |
0.017 |
rmarry |
10.8557 |
2.57 |
0.017 |
lnso2 |
4.102329 |
7.75 |
0.000 |
常数项 |
−142.0135 |
−2.85 |
0.009 |
常数项 |
−171.875 |
−4.93 |
0.000 |
F统计值 = 27.22 |
Prob > F = 0.0000 |
F统计值 = 27.22 |
Prob > F = 0.0000 |
ADJ R2 = 0.7375 |
Root MSE = 0.87032 |
ADJ R2 = 0.7375 |
Root MSE = 0.87032 |
AIC = 70.48486 |
BIC = 1.3798 |
AIC = 70.48486 |
BIC = 1.3798 |
残差,lag(0),t = −3.401,p = 0.0000,结果I(0) |
残差,lag(0),t = −3.401,p = 0.0000,结果I(0) |
4.5. 逐步回归结果的分析
表4是各解释变量对人口出生率的边际影响与平均影响估算结果。根据数据类型的不同,分别解释如下:
首先是第一类,采用变化百分率、千分率或自然有理数数据,包括pr、rmarry、vdivorce、vurban、policy等解释变量。由于数据的单位不同,其中pr和vdivorce直接采用统计年鉴中的数据,单位是%;rmarry和vurban的数据是采用推算得到的自然有理数数据、policy数据是正整数。因此,在依据系数值计算边际影响时需区别对待。其中,ramrry的边际影响和平均影响的含义是,结婚对数每增长1%,人口出生率将提升0.011%,考察期间,结婚对数年平均下降0.61个百分点,从而人口出生率年平均受影响0.006%;vdivorce的边际影响和平均影响的含义是,粗离婚率每提高1%,反而使人口出生率提高1.99%,考察期间,粗离婚率年平均提高0.06%,据此推算对人口出生率年平均影响达到0.119%,这与理论预期相悖,原因可能是离婚夫妇生育意愿相对较低,剩下的已婚夫妇生育意愿及离婚后再婚的生育意愿相对较高进而反向推高了人口出生率水平;vurban的边际影响和平均影响的含义是,城镇人口每年增长1%,人口出生率将增长1.02%,考察期间,城镇人口增长率年均达到3.53个百分点,从而人口出生率年平均提升3.6%,这与理论分析以及公众对城镇化拉低人口出生率水平的直觉认识不一致,原因可能是研究中使用的是城镇人口增长率指标,那么随着城镇化水平的持续提高,在城镇增量人口中,会有越来越多的家庭隔辈成员同城团聚,进而促进了人口出生率的提升;policy是虚拟变量,可能主要是受早期一孩政策的影响,以及多孩政策效应偏弱,整体上平均抑制人口出生率达−1.092%。
其次是其他解释变量,采用自然对数数据,其系数值的边际含义是解释变量每变化1%,人口出生率的变动幅度是对应系数值/100,单位相应是%。因此,lnincome的边际影响和平均影响的含义是,人均可支配收入每增长1%,将促使人口出生率提高0.133%,考察期间,人均可支配收入年平均提高11.16个百分点,从而人口出生率年平均正向影响1.485%;lnpension的边际影响和平均影响的含义是,城镇职工基本养老保险基金支出每增长1%,将促使人口出生率提高0.061%,考察期间城镇职工基本养老保险基金支出年平均提高17.24个百分点,从而人口出生率年平均正向影响1.051%;lnhouseprice的边际影响和平均影响的含义是,住房价格每增长1%,将促使人口出生率下降0.069%,考察期间,住房价格年平均上升7.2个百分点,从而人口出生率年平均负向影响0.501%;lneducost的边际影响和平均影响的含义是,学校教育经费学杂费每增长1%,将促使人口出生率下降0.074%,考察期间学校教育经费学杂费年平均上升15.71个百分点,从而对人口出生率年平均负向影响1.158%;lnmedcost的边际影响和平均影响的含义是,人均现金卫生支出每增长1%,将促使人口出生率下降0.1%,考察期间人均现金卫生支出年平均上升11.71个百分点,从而对人口出生率年平均负向影响1.167%;lnedu的边际影响和平均影响的含义是,普通高等学校招生数每增长1%,将促使人口出生率下降0.033%,考察期间普通高等学校招生数年平均上升9.3个百分点,从而对人口出生率年平均负向影响0.303%;lnpatient的边际影响和平均影响的含义是,乡镇卫生院诊疗人次数每增长1%,将促使人口出生率提高0.06%,考察期间,乡镇卫生院诊疗人次数年平均提高1.17个百分点,从而人口出生率年平均正向影响0.071%,这与理论预期不一致,原因可能与该指标的双重意义相关,一方面该指标反映了人们健康受疾病影响的人数上升,另一方面也反映出医疗保健条件不断优化,即医疗保健条件的改善有利于人口出生率提升;lnso2的边际影响和平均影响的含义是,so2排放每增长1%,将促使人口出生率提高0.022%,考察期间so2年平均减少6.7个百分点,从而人口出生率年平均负向影响0.145%,其回归系数和边际影响与理论预期不一致,原因可能也与该指标的双重意义相关,一方面so2的排放不利于人们身心健康应与人口出生率负相关,但另一侧面该指标也与工业经济、就业及收入正相关,结果实际效应为正相关关系。
Table 4. The marginal and average effects of each explanatory variable
表4. 各解释变量对人口出生率的边际影响与平均影响
解释变量 |
系数 |
边际影响(%) |
年平均变化幅度 |
平均影响(%) |
rmarry |
10.8557 |
0.011 |
−0.61% |
−0.006 |
vdivorce |
1.990919 |
1.990 |
0.06% |
0.119 |
lnincome |
13.3047 |
0.133 |
11.16% |
1.485 |
lnpension |
6.097209 |
0.061 |
17.24% |
1.051 |
lnhouseprice |
−6.893877 |
−0.069 |
7.27% |
−0.501 |
lneducost |
−7.370502 |
−0.074 |
15.71% |
−1.158 |
lnmedcost |
−9.963571 |
−0.100 |
11.71% |
−1.167 |
vurban |
101.9727 |
1.020 |
3.53% |
3.600 |
lnedu |
−3.25275 |
−0.033 |
9.30% |
−0.303 |
lnpatient |
6.048983 |
0.060 |
1.17% |
0.071 |
lnso2 |
2.157454 |
0.022 |
−6.70% |
−0.145 |
policy |
−1.092032 |
−1.092 |
5. 结论与展望
本文利用12个变量的单整时间序列数据,运用向前和向后逐步协整回归分析方法,尝试挖掘中国人口出生率的影响因素,计量分析结果表明,提高人们的可支配收入,增加基本养老保险基金支出,提升城镇化质量,改善医疗保健条件等因素有利于正向提高人口出生率水平;结婚对数下降拉低了人口出生率;住房、教育、医疗成本显著地抑制了人们的生育意愿,降低了人口出生率水平,其中医疗和教育支出压力年均抑制人口出生率均在1%以上;计划生育限制政策整体上抑制了人口出生率水平,近年来的生育放宽政策成效不明显;粗离婚率、环境污染指标可能存在正反双重效应,使得回归结果与理论预期不一致。
为遏止人口出生率持续下降,促使人口出生率稳健回弹,提出如下政策建议:① 优化收入分配制度,切实提高普通中低收入群体的分配份额,提升人们的可支配收入水平,增强其经济能力和婚育意愿,从而提高人口出生率;② 完善国家社会保障体系,提高人们的基本生活保障程度,增强人们的安全感,从而改善人们的婚育能力和意愿,提高人口出生率;③ 全方位调节住房、教育、医疗价格体系,降低人们的住房、教育、医疗支出压力,赋予人们更大更足的休养生息空间,促进人口出生率回弹;④ 加快调整生育限制政策,及早对冲“一孩政策”几十年来的累积性负向影响;⑤ 坚持教育强国国策毋庸置疑,但教育程度与人口出生率负相关局面也需引起政府关切,可以考虑压缩学历学制年限,如小学六年制压缩为五年制,改善高校毕业生就业并提高其收入水平,放宽户籍限制等;⑥ 加强社会舆论疏导,引导适婚青年树立正确婚恋观念,加强正面婚育典型教育等,提高结婚率,降低离婚率,促使人口出生率回升。
本文的研究不足有:一是环境变量仅选取so2指标可能并未反映环境对人口出生率的影响全貌,其他环境介质(如废水、固废、土壤污染等)的影响也值得后续研究;二是反映城镇化和人们身心健康水平的指标数据有待优化;三是粗离婚率的回归系数与理论预期不一致的深层原因及影响机制有待进一步研究廓清;四是其他本文未纳入分析的影响因素,如食品安全、转基因、婚外情、科技产品辐射、西方婚恋文化渗透等是否影响人们的生育能力、生育意愿、生育观念进而影响人口出生率水平,也值得另行深入研究。
基金项目
中华女子学院中央高校基本科研业务费课题经费支持。
NOTES
1研究过程中,最先采用了结婚率指标,但在数据单位根检验时,发现是平稳序列,而被解释变量数据和其他解释变量数据是I (1),不适合进行协整回归分析,所以就调整采用结婚对数增长率数据。
2粗离婚率是指在一定时期内(通常为年度)某地区离婚数与总人口之比,通常以千分率(%)表示。
粗离婚率 = (年度离婚数/年平均人口数) × 1000%。其中,分子为离婚对数,分母为年平均人口数。
3研究过程中,最先采用了城镇化率数据,但因发现该数据是二阶平稳序列I (2),不适合与其他单整序列数据I (1)进行协整回归分析,故换用城市人口增长率数据替代。
4用“varsoc变量,maxlag(8)”命令。
5用“tsline变量”命令。
6用“dfuller变量,trend lags (滞后项) regress”命令。