1. 引言
2023年1月,国家统计局公布上一年度人口相关数据 [1] :截至2022年末,我国人口总数为141,175万人,比上一年减少85万人,全年出生人口为956万人,出生率已低于7‰,出现21世纪以来首次负增长。2023年8月,中国工程院院士乔杰在医药创新和科技前沿论坛上表示:预计2023年我国出生人口数约为700万~800多万。如上述预测可靠,则我国低生育率情况有进一步加剧的风险。
《中国生育报告2019》提到:住房、教育、医疗的高成本是抑制生育行为的“三座大山” [2] 。其中住房因素一直是讨论的焦点,已成为影响居民生育意愿的重要因素。若能找到住房因素对生育意愿的影响关系,相关部门及时调控和引导房地产市场,有效缓解居民焦虑,降低住房对生育意愿的影响,让育龄人群做到想生、敢生,生育率将从根本上得到提高。
2. 文献综述
目前,国内外众多学者针对住房因素对生育意愿的影响情况开展了广泛的研究,得到一些研究成果:首先住房对有“先安居,后乐业”想法的人们能产生显著影响,即为了能“先安居”,人们会通过推迟或降低生育意愿,减少与生育有关的日常支出,称之为住房对生育意愿的“挤出效应” [3] ;其次,李名言等人 [4] 的研究得出,生育子女数量会随着居民住房面积同向变化;最后,普通一套住房可能无法满足多胎的生育意愿,房屋数量会影响生育数量。
从研究方法上来看,大多数采用回归类模型,例如胡静 [5] 曾用OLS模型,分析得到受教育水平和家庭可支配收入对家庭理想子女数量具有正向影响;朱相发 [6] 采用二分类Logistic模型,综合分析住房因素对居民生育的影响情况;周建军等人 [7] 通过Probit模型研究出:具有多套住房产权受访者的生育意愿高于只有一套住房产权者;刘子琼等人 [8] 运用有序Logit回归模型,研究住房消费对生育意愿的影响;国外学者Rada Golub等 [9] 运用Logistic回归模型得出住房因素对生育意愿有显著影响。
基于上述文献来看,关于住房因素对生育意愿的影响研究已初具规模。本文将住房因素进行量化,考虑核心解释变量为分类数据且被解释变量为有序类型的数据,因此运用有序Logit回归模型探讨每一个变量对生育意愿的影响情况,分析不同收入群体住房因素对生育意愿的影响情况,并将回归结果与稳健性检验的结果进行比较,排除虚假回归的情况,结合实际分析住房因素对生育意愿的影响情况,向相关部门给予建议。
3. 研究设计
3.1. 数据来源
本文的数据来源是中国综合社会调查2021年问卷(以下简称为CGSS2021),这是我国社会领域的重要数据,其研究范围广泛、研究内容具有重要意义,生育意愿、住房问题也是问卷调查内容之一,因此符合本文的研究需要。
3.2. 模型假设
结合CGSS2021的问卷内容以及相关文献,我们对住房因素进行合并、量化。由于无法对“住房价格”进行简单的赋值,并且各地区房价存在显著差异,因此本文不涉及对该变量的进一步研究。最终将住房因素划分成“住房建筑面积”“房屋产权情况”和“拥有房产数量”共3个变量。逐个探讨每个住房因素的变量对受访者理想子女数的影响,并做出如下假设:
假设H1:住房建筑面积对理想子女数的影响显著;
假设H2:房屋产权情况对理想子女数的影响显著;
假设H3:拥有房产数量对理想子女数的影响显著。
3.3. 变量选取与测量
被解释变量:理想生育子女数量。用问卷中“如果没有政策限制的话,您希望有几个孩子?”来测量。
核心解释变量:“住房建筑面积”“房屋产权情况”和“拥有房产数量”。“住房建筑面积”用“您现在住的这座住房的套内建筑面积”的回答;“房屋产权情况”用问卷中“您现在这座房子的产权(部分或全部产权)属于谁?”的回答;“拥有房产数量”用问卷中“目前您总共拥有几处房产(包括与他人共同拥有)”的回答。
控制变量:本文选取“受访者全年总收入”“受访者受教育年限”“受访者年龄”“受访者民族”“受访者婚姻状况”“受访者党员身份”和“受访者性别”共7个,代表受访者人口特征的变量作为控制变量,其中“受访者年龄”根据问卷中“您的出生日期是什么?”加工而得(2021~出生日期年份)。
3.4. 数据清洗
对CGSS2021中的8148条原始数据从四个方面对数据进行清洗,保证分析结果具有可信性、准确性。同时考虑到生育会受到年龄的限制,只保留18~50岁之间的样本。对清洗后得到的样本按照表1的赋值规则对需要赋值的变量进行赋值。具体清洗情况过程如图1所示:

Table 1. Data variable selection and assignment rules
表1. 数据变量选取及赋值规则
3.5. 模型设定
为简便变量的表示,本文用children表示被解释变量理想子女数;用area、property和house分别表示“住房建筑面积”“房屋产权情况”和“拥有房产数量”;使用
分别表示“受访者全年总收入”“受访者受教育年限”“受访者年龄”“受访者民族”“受访者婚姻状况”“受访者党员身份”和“受访者性别”共7个控制变量,并将控制变量的线性组合表示为
,随机误差项为
,建立如下有序Logit回归模型:
(1)
(2)
其中,
表示被解释变量理想子女数小于0、1、2个孩子的概率;β1、β2、β3分别为“拥有房屋数量”“房屋产权情况”和“住房建筑面积”3个核心解释变量的系数;
表示在
情况下模型的回归常数项。
3.6. 不同水平收入群体的划分
根据已有文献表明,住房因素对收入不同群体的生育意愿影响具有差异性。本文参考国家统计局统计资料管理中心规定的年收入分组标准,将受访者全年总收入进行排序,处于前20% (10万及以上)的样本划分为高收入人群,后20% (2万及以下)的样本划分为低收入人群,其余样本划分为中等收入人群(2万~10万)。
4. 实证分析
4.1. 描述性统计
4.1.1. 控制变量统计
根据统计结果,“受访者全年总收入”均值为83,375.95元;“受访者受教育年限”均值为7.12,即受访者的文化程度平均为“初中学历”;“受访者年龄”均值为36.68,说明受访者平均年龄为育龄人群;“受访者民族”均值为0.12,说明受访者民族集中在“汉族”;“受访者婚姻状况”均值为0.86,其中已婚人群占比为69.6%;“受访者党员身份”均值为0.12,非党员身份占比88.2%;“受访者性别”中男性和女性占比分别为44.5%,55.5%,差异不大;“受访者理想子女数”为1~2个占比85.1%;愿意生育男孩和女孩的数量分别为0.84和0.94,说明大部分受访者已经摒弃“重男轻女”的思想。
4.1.2. 不同收入群体的差异
我们针对不同收入群体之间的住房因素以及生育意愿是否有显著差异进行检验。低/中等/高收入群体的理想子女数均值分别为1.83、1.77、1.71 (p = 0.009),低收入水平群体的理想子女数均值高于其他收入水平群体;低/中等/高收入群体的“住房建筑面积”均值分别为57.66、97.82、110.07 (p < 0.001),高收入水平群体“住房建筑面积”显著高于其他收入群体;低/中等/高收入人群的“拥有房产数量”均值分别为1.10、1.19、1.58 (p < 0.001),高收入水平群体“拥有房产数量”均值显著高于其他收入群体。即在1%水平下,不同收入水平群体之间的理想子女数、“住房建筑面积”和“拥有房产数量”的均值存在显著差异。
4.2. 模型结果

Table 2. Ordinal logistic regression modeling results
表2. 有序Logit回归模型结果
模型一只引入控制变量作为基准模型,其结果作为其他模型回归结果的参考。结果显示,在α = 5%的情况下,“受访者年龄”“受访者民族”和“受访者婚姻状况”与理想子女数量呈现显著的正向关系,而“受访者性别”与理想子女数量为显著负相关。“受访者全年总收入”和“受访者党员身份”对理想子女数没有影响。
模型二到模型四中,分别在基准模型的基础上引入三个核心解释变量。在α = 1%的水平下,模型二所引入的变量area对理想子女数具有正向显著影响;模型三所引入的变量property对被解释变量无明显影响;模型四所引入的变量house对理想子女数量有正向关系。
根据模型二至模型四的结果得出area和house对被解释变量均有显著影响,故模型五同时引入这两个核心解释变量,探究在二者的共同作用下对被解释变量的影响情况,发现在α = 1%时,变量area和house均对被解释变量有显著影响。模型六将所有核心解释变量同时引入模型。结果显示,住房建筑面积越大,拥有房产数量越多,理想的子女数量越多。而“房屋产权情况”始终对理想子女数量无显著影响。具体模型回归结果见表2。

Table 3. Regression results of different income groups
表3. 不同收入群体的回归结果
随后,为研究住房因素对每一类收入群体理想子女数的影响,分别对各群体建立有序Logit回归模型,分别分析核心解释变量的影响情况,回归结果详见表3。在α = 1%时,“拥有房屋数量”对低/中等/高收入群体的理想子女数均存在正向影响,即“拥有房屋数量”增加时,每一类群体的理想子女数均会增加,特别是对低/中等收入人群的影响最大;“住房建筑面积”只对中等收入群体存在显著正向影响,即住房面积增加对中等收入家庭理想子女数的影响高于其他收入群体;在α = 10%下,“房屋产权情况”对中等收入群体具有显著负向影响。
4.3. 稳健性检验
由于研究对象样本获取的不全面性和控制变量选择的不确定性,为评估上述模型结果的可靠性以及核心解释变量对被解释变量影响的稳定性,本文不同于以往研究的单一检验方法,从以下三个角度,分别对模型进行稳健性检验,结果详见表4。
4.3.1. 改变计量模型
最小二乘法常用于拟合实验数据和求解最佳估计。通过找到一个函数或模型,使预测值与实际观测值之间的误差平方和达到最小。根据本文的研究内容,建立如下OLS回归模型:
(3)
(4)
其中,γ0为回归截距;γ1、γ2、γ3分别为“住房建筑面积”“房屋产权情况”和“拥有房屋数量”的回归系数,μ为控制变量的线性组合,ε为随机误差项。

Table 4. Robustness test of the regression results
表4. 稳健性检验回归结果
由表4可知,在α = 1%下,“住房建筑面积”和“拥有房产数量”回归效果显著。而“房屋产权情况”的回归系数不显著。
4.3.2. 分样本回归
变量“受访者党员身份”在有序Logit回归模型中,始终呈现出回归趋势不明显的特征,剔除该变量不会对模型总体回归效果产生显著改变,因此本文将该变量作为分样本回归的依据。由回归结果可知,在α = 5%下,“住房建筑面积”和“拥有房产数量”对被解释变量的影响是稳定且显著的,回归系数不同可解释为变量对不同群体的影响强度不同。综上所述,从分样本回归来看“住房建筑面积”和“拥有房产数量”这两个核心变量对生育意愿的影响呈现出稳定的态势。
4.3.3. 更换样本
为验证三个核心变量对生育意愿的影响具有一定广泛性,证明模型结果具有稳定性。本文将CGSS2021年的数据更换为CGSS2018年的数据,按照相同的清洗、筛选和赋值方法后,得到有效样本量4250份。回归结果显示,“住房建筑面积”和“拥有房产数量”分别在1%和5%的水平上显著,而“房屋产权情况”却对理想子女数无显著影响。可见更换数据后,得到了与2021年数据基本相同的结论,一定程度上说明有序Logit回归模型通过了稳健性检验。
综合三种稳健性检验结果,本文认为有序Logit回归模型的结果存在较高的可信度,可以用于探讨住房因素对居民生育意愿的影响。
5. 结论及政策建议
根据已通过稳健性检验的有序Logit回归结果来看:在α = 1%的水平下,“住房建筑面积”对生育意愿起显著影响,接受假设H1。其在有序Logit回归的优势比(OR值)为1.364,意味着赋值后的住房建筑面积每增加一个单位时,其理想子女数增加幅度为1.364倍。“住房建筑面积”仅对中等收入群体存在显著影响,对其他收入群体的生育意愿无显著影响。若增加中等收入人群的住房建筑面积,使其具备更好的生育环境,生育压力下降,理想子女数量会有明显增加。
“拥有产权情况”对生育意愿的影响情况不显著,拒绝假设H2。这与已有的刘姝辰 [10] 关于家庭拥有住房产权对居民的理想孩子数量具有显著正向影响的结论不一致。但在中等收入群体有序Logit回归中发现,在α = 10%的水平下,“拥有产权情况”存在显著影响。在结合稳健性检验的结果分析后,本文认为出现此情况可能是:中等收入群体比较庞大,使得该群体表现出较强的差异性,出现了回归的偶然情况。因此需要从改变property变量的构建方式或样本收集范围以及问卷的抽样设计等方面进行优化调整,未来需要进一步探讨研究。
“拥有房产数量”与理想子女数始终呈现正相关关系,接受假设H3。相对高收入人群而言,对低/中等收入人群的影响更为显著。根据有序Logit回归模型在低/中等/高收入群体的优势比(OR值)分别为1.859、1.786、1.587,即“拥有房产数量”每增加一个单位时,低/中等收入群体的受访者理想子女数分别增加1.859和1.786倍。
本文对政府、银行和相应监管部门提出如下建议:
1) 各级各地政府应从宏观上适当调控房地产政策,适应我国房地产市场供求关系变化的新形势,基于不同城市的特点,制定出能解决居民刚性住房需求的政策,对有生育意愿的相关人群给予住房上面的优惠政策,通过共有产权房的发展,使无房人群或者经济困难的人群能尽快“安居”,从而提高生育意愿。
2) 在保证运行的前提下,商业银行对首套住房贷款以及存量贷款,可以采取适当降低贷款利率的方式,减少住房对居民生育的“挤出效应”,使人们增加对生育方面的支出。
3) 住房监管部门严格把关,监督房屋工程质量,监督开发商账户使用。使开发商做到资金专款专用,按约交付期房,维护消费者尤其是中低收入人群的合法权益,从而促进房地产行业健康、平稳地发展,提高居民的生育率。
基金项目
2023年北京市大学生创新创业训练计划项目“低生育率的影响因素调查”(X202310009138)。