基于多元回归分析我国就业人数及质量的研究
Research on the Number and Quality of Employment in China Based on Multiple Regression Analysis
摘要: 高校毕业生屡创新高,就业问题一直被国家政府格外关注。本文选取了1998年~2023年的数据构建经济学模型,并对我国就业人数的主要影响因素进行多元回归分析,运用软件Eviews12进行分析,选取全国总人口数、国内生产总值、居民消费水平、居民平均工资水平、财政支出及是否有虚拟变量新冠疫情等数据来解读我国就业人数。本文通过多元回归分析发现,全国人口总数与就业人数显著正相关,居民平均薪资水平与就业人数显著负相关,居民平均消费水平对就业人数具有正向促进作用,而疫情对就业人数具有显著负面影响。
Abstract: College graduates have repeatedly reached new highs, and the issue of employment has always been of particular concern to the national government. This paper selects the data from 1998 to 2023 to build an economic model, and conducts a multiple regression analysis on the main influencing factors of China’s employment, uses the software Eviews12 to analyze, and selects the total population, gross domestic product, residents’ consumption level, average residents’ wage level, fiscal expenditure and whether there is a dummy variable COVID-19 to interpret China’s employment. Through multiple regression analysis, this paper finds that the total population of the country is significantly positively correlated with the number of employed people, the average salary level of residents is significantly negatively correlated with the number of employed people, the average consumption level of residents has a positive role in promoting the number of employed people, and the epidemic has a significant negative impact on the number of employed people.
文章引用:李羿飞. 基于多元回归分析我国就业人数及质量的研究[J]. 统计学与应用, 2025, 14(5): 110-122. https://doi.org/10.12677/sa.2025.145130

1. 研究背景

1.1. 引言

就业是民生之本,关系到社会的稳定与经济的持续发展。通过以往的经验可以看出,提升就业水平直接推动了人们生活质量的提高[1]。我国人口基数庞大,经济发展不均衡,导致就业问题仍然复杂且长期受到广泛关注。特别是近年来,高校毕业生数量的快速增长,加剧了就业市场的竞争和压力。2020年我国高校毕业生人数达到875万,比2009年增加了40万;2021年毕业生人数增至909万,再增长35万;2022年更是首次突破千万大关,达到1076万,同比增加167万人,创下新高。这一现象客观反映了两个问题:一方面,高等教育体系发展迅速,另一方面,随之而来的就业压力也日益加剧。

尤其在经历过新冠疫情背景下,经济下滑,大学生就业面临更大挑战。为了缓解就业压力,政府采取了一系列政策支持措施,包括对企业的扶持、对基层就业的关注、创新就业形式以及优化招聘流程等。然而,尽管在2020年高校毕业生的就业成功率达到90%,但2021年和2022年大学生的就业率分别降至56.9%和23.6%,创下历年新低。虽然疫情是影响就业的主要因素,但部分毕业生选择继续深造或创业,仍然没有改变整体的就业形势。进入2024年,尽管国内疫情得到有效控制,外部因素的不确定性依然影响着各行各业,就业形势依然严峻,2024年被称为“大学生最难就业季”。在此背景下,如何在结构性就业矛盾下,促进高质量的大学生就业,成为亟待解决的问题。大学生的就业状况不仅与人口总数、居民工资水平、消费水平以及财政支出等宏观经济因素密切相关,也受到疫情等突发事件的深刻影响。本研究旨在探讨这些因素对就业的影响,并寻求缓解就业压力的有效路径。

1.2. 背景

近年来,随着我国经济的快速发展和产业结构的不断调整,就业市场呈现出显著的多样化趋势。一方面,高新技术产业、数字经济和现代服务业的蓬勃发展,为劳动力市场提供了丰富的就业机会,尤其是在信息技术、人工智能、电子商务等新兴行业中,年轻人才的需求不断增加。另一方面,传统产业在转型升级过程中,也在推动产业结构优化的同时,对劳动力市场产生了新的影响。这些转型不仅要求劳动力具备更高的技能水平,还对就业质量提出了更高的要求,尤其是在薪资待遇、职业稳定性和社会保障等方面。

与此同时,随着我国人口结构的变化,特别是老龄化加剧和人口出生率下降,劳动力市场的供需关系发生了深刻变化。年轻劳动力的相对减少使得部分行业出现了用工短缺,而高技能、高学历人才的需求持续增长。此外,随着教育水平的普遍提升,尤其是高校毕业生的数量持续攀升,大学生的就业问题愈加突出。新冠疫情的突袭加剧了这一矛盾,不仅显著影响了部分行业的就业岗位需求,还对整体就业市场造成了深远影响。如何解决就业与就业质量之间的矛盾,成为社会关注的焦点。

在这样的背景下,分析和研究我国的就业情况显得尤为重要。通过深入探讨就业市场的动态变化,能够为政策制定者提供更为精准的依据,帮助他们制定更加切合实际的就业政策,推动经济高质量发展。同时,了解就业市场的趋势,有助于为相关企业和求职者提供有效的指导,促进劳动力市场的平衡和健康发展。特别是如何在疫情背景下,提高大学生及其他群体的就业质量,已成为经济社会发展的重要课题。

1.3. 目的和意义

1) 社会政策制定的重要参考

本研究通过对就业人数和质量的多元回归分析,能够为政府制定就业政策提供科学依据,特别是在疫情影响下促进就业公平和提高就业质量方面。

2) 经济学理论的实证研究

此研究将为理解就业市场的经济学理论提供实证支持,特别是在分析劳动力市场供需、工资水平、疫情等因素对就业的影响方面。

3) 对劳动力市场的深入理解

通过详细分析就业人数和质量的变化,本研究有助于深入理解劳动力市场的动态变化,为劳动力市场的有效管理和优化提供理论和实践指导。

4) 对社会和谐与经济可持续发展的推动

高质量就业是社会稳定和经济持续健康发展的基石。本研究将为提高就业质量和促进经济与社会协调发展提供重要参考和支持。

2. 研究假设

结合上述分析,以及变量的实际含义与研究背景,提出以下研究假设:

假设1 (H1)国内生产总值(GDP)与就业人口总数正相关。随着GDP的增长,经济活动增加会带动更多就业岗位的创造[2]

假设2 (H2)全国人口总数与就业人口总数正相关。较大的总人口数通常伴随更大的劳动力供应和就业需求。

假设3 (H3)居民平均薪资水平与就业人口总数负相关。较高的薪资水平可能增加企业用工成本,导致就业机会减少。

假设4 (H4)居民平均消费水平与就业人口总数正相关。消费水平的提高能刺激经济增长,从而增加就业需求。

假设5 (H5)政府财政支出与就业人口总数正相关。财政支出的增加可通过政府投资、基础设施建设等措施间接提高就业人数。

假设6 (H6)新冠疫情对就业人口总数具有负面影响。疫情带来的经济停滞、企业裁员等现象将直接减少就业机会。

3. 数据搜集与模型构建

我们通过上述分析,结合变量,选取数据年份为1998年~2023年共计26个样本量,进行多元线性回归模型[3],结果如下:

Y t = β 0 + β 1 X1+ β 2 X2+ β 3 X3+ β 4 X4+ β 5 X5+ β 6 X6+ ε t

Y——就业人口总数;

X1——国内生产总值GDP;

X2——全国人口总数;

X3——居民平均薪资;

X4——居民平均消费水平;

X5——全国人口总数;

X6——虚拟变量,是否有新冠疫情,有为1,没有为0;

β 0 ——为回归模型的截距项;

β 1 - β 4 ——表示各解释变量的回归系数;

ε t ——是随机误差项。

通过《国家统计年鉴》收集数据如下1

Table 1. Data table of dependent and explanatory variables

1. 被解释变量与解释变量数据表

指标

就业人员 (万人)

国内生产总值(亿元)

年末总人口 (万人)

居民人均 可支配工资性收入(元)

居民人均消费支出(元)

财政支出 (亿元)

疫情影响 虚拟变量

year

Y

X1

X2

X3

X4

X5

X6

1998年

70637

85195.5

124761

1740

2516

10798.18

0

1999年

71394

90564.4

125786

1901

2658

13187.67

0

2000年

72085

100280.1

126743

2040

2914

15886.5

0

2001年

72797

110863.1

127627

2255

3139

18902.58

0

2002年

73280

121717.4

128453

2698

3548

22053.15

0

2003年

73736

137422

129227

3061

3889

24649.95

0

2004年

74264

161840.2

129988

3452

4395

28486.89

0

2005年

74647

187318.9

130756

3859

5035

33930.28

0

2006年

74978

219438.5

131448

4426

5634

40422.73

0

2007年

75321

270092.3

132129

5222

6592

49781.35

0

2008年

75564

319244.6

132802

5841

7548

62592.66

0

2009年

75828

348517.7

133450

6481

8377

76299.93

0

2010年

76105

412119.3

134091

7320

9378

89874.16

0

2011年

76196

487940.2

134916

8313

10820

109247.8

0

2012年

76254

538580

135922

9379

12054

125953

0

2013年

76301

592963.2

136726

10411

13220

140212.1

0

续表

2014年

76349

643563.1

137646

11421

14491

151785.6

0

2015年

76320

688858.2

138326

12459

15712

175877.8

0

2016年

76245

746395.1

139232

13455

17111

187755.2

0

2017年

76058

832035.9

140011

14620

18322

203085.5

0

2018年

75782

919281.1

140541

15829

19853

220904.1

0

2019年

75447

986515.2

141008

17186

21559

238858.4

1

2020年

75064

1013567

141212

17917

21210

245679

1

2021年

74652

1149237

141260

19629

24100

245673

1

2022年

73351

1204724

141175

20590

24538

260552.1

1

2023年

74041

1260582

140967

22053

26796

274622.9

1

数据来源:《国家统计年鉴》。

4. 上机操作核心实证结果截图

4.1. 描述性统计和散点图

1可以看出:

就业人口总数(Y)的平均值为74719.08万人,且数据的标准差为1629.61,表明就业人口总数具有一定的波动性。国内生产总值(X1)的均值为524186.8亿元,标准差为386143.9,反映出该变量的较大波动,可能受到宏观经济波动和政策调整的影响。全国人口总数(X2)的平均值为134469.3万人,标准差相对较小,表明全国人口数量相对稳定。居民平均薪资(X3)和居民平均消费水平(X4)的数据差异较大,均值分别为9367.62元和11746.5元,标准差较高,显示出各地区薪资和消费水平存在显著差异。此外,政府财政支出(X5)的均值为117964.3亿元,标准差为92060.3表明财政支出也存在较大的波动性。X6为虚拟变量,最大值和最小值符合虚拟变量的定义。

Figure 1. Descriptive statistical results

1. 描述性统计结果

所有变量与Y的散点图如2所示:

Figure 2. Scatter plot of all variables and Y

2. 所有变量与Y的散点图

4.2. 基础回归

利用EVIEWS软件,首先进行OLS回归估计,可以得到:

Figure 3. Basic regression chart

3. 基础回归图

根据图3多元线性回归可得回归方程为:

Y = −0.003138 * X1 + 0.890621 * X2 − 0.904267 * X3 + 0.744117 * X4 − 0.029185 * X5 − 40224.36

图3的数据分析得:回归的R2为0.969658,修正的R2为0.962073。显示出模型的拟合能力良好。R2越趋近1,模型拟合能力越高。F统计量为127.8306。显著性水平取0.05,表明整体拟合是显著的,模拟效果良好。

但X1和X6的P值大于0.05,未通过T检验,初步判定模型存在多重共线性问题。

4.3. 多重共线的检验和修正

采用方差膨胀系数(variance inflation factor)也就是VIF来衡量多元线性回归模型中多重共线性的严重程度。

本回归多重共线检验结果如下:

Figure 4. VIF test

4. VIF检验

图4采用VIF方法进行多重共线检验,在结果中关注系数表,当VIF值大于等于10时,我们认为变量间存在严重的共线性,当VIF值小于10时,我们认为数据基本符合多元线性分析的假设,即不存在多重共线性问题。

图2我们可以看出X1~X5都大于10,只有X6小于10,即表明存在严重的多重共线性,所以采用逐步回归的办法,避免多重共线的问题。同时,由于X1 (国内生产总值GDP)的VIF值很高,表明它与其他变量之间存在高度相关性。在这种情况下,保留X1可能会导致模型估计的不稳定性,因此选择剔除X1。此外,虽然X6 (疫情影响虚拟变量)的VIF值小于10,但在基础回归中,X6可能没有通过t检验,即它对模型的贡献不显著,因此也剔除。

通过逐步回归,回归模型结果如下:

Figure 5. Stepwise regression plot after removing X1 and X6

5. 剔除X1和X6后的逐步回归图

5可知:

分析后剔除了X1和X6后的模型R2为0.969143,修正的R2为0.994658,判定系数比较高,F统计量的值为164.8880,其P值为0.0000表明模型设定比较显著。再看T检验:P值小于0.05的即为显著,认为解释变量与被解释变量有关,X2,X3,X4,X5都满足,表示显著性极其高。

公式结果为

Y = −41273.71 + 0.899855 * X2 − 1.035221 * X3 + 0.690212 * X4 − 0.028993 * X5。

4.4. 异方差的检验和修正

4.4.1. 异方差的检验

本文采用Breusch-Pagan-Godfrey/WHITE/Harvey三种检验法对模型进行异方差检验,来判断是否存在异方差性。

(1) 怀特检验

通过WHITE检验对图6回归进行异方差检验,结果可以发现:在显著性水平位5%下,Obs*R-squared的值为24.29926,对应P值为0.0285 < 0.05,证明模型存在异方差。需要进行修正。

Figure 6. White test chart

6. 怀特检验图

(2) BP检验

采用Breusch-Pagan-Godfrey检验对图7回归进行异方差检验,结果可以发现:在显著性水平位5%下,Obs*R-squared的值为17.54429,对应P值为0.0015 < 0.05,所以模型存在异方差。需要进行修正。

Figure 7. BP inspection chart

7. BP检验图

(3) 哈维检验

采用第三种异方差Harvey检验对图8回归进行异方差检验,结果可以发现:在显著性水平位5%下,Obs*R-squared的值为10.09767,对应P值为0.0388 < 0.05,所以三种异方差检验方法都证明模型存在异方差。需要进行修正。

Figure 8. Harvey test chart

8. 哈维检验图

4.4.2. 异方差的修正

我们采用加权最小二乘法WLS进行修正,结果如图9所示:

Figure 9. Weighted Least Squares (WLS) modified regression results

9. 加权最小二乘法(WLS)修正回归结果图

模型的R2提升至0.972889,调整后的R2为0.967725,表明模型对解释变量的拟合程度显著增强。所有解释变量(X2、X3、X5和X4)的回归系数均通过了5%显著性水平检验,且显著性p值均小于0.05,表明这些变量对就业人口总数具有显著影响。F-statistic的P值为0.0000,进一步验证了模型整体的显著性。修正异方差问题后,模型更具稳健性,可更准确反映就业人数的影响因素。

5. 实证的回归结果和经济意义解读

5.1. 经济意义解读

根据上述加权最小二乘法的回归结果,本研究解释变量对我国就业人口总数的经济影响具有较强的实际意义和逻辑性。

各变量及结果分析解读如下:

全国人口总数(X2)的回归系数为0.900679,表明每增加1万人口,就业人口总数平均增加0.9万人。这一结果符合实际经济规律,因为人口规模是劳动力供给的重要基础,大规模的人口数量为各类经济活动提供了充足的劳动力资源,从而促进就业的增长。此外,随着我国人口基数的不断增加,劳动参与率的变化也直接影响着就业总量,这一变量的显著性验证了人口总数作为就业的基础的重要性。

居民平均薪资(X3)对就业人口总数的回归系数为−1.015758,表明居民平均薪资每增加1元,就业人数平均减少约1.02万人。这可能反映了企业用工成本的上升会导致一定的就业压力。薪资水平的提高虽然有助于提升劳动者的生活质量,但也可能因劳动力成本上升而抑制部分企业的招聘需求,尤其是在劳动密集型产业中,这一现象尤为显著。这也提示我国政府在推动薪资增长的同时,需关注企业用工成本的合理性,以避免薪资上升对就业市场的不利影响。

居民平均消费水平(X4)的回归系数为0.702287,显示消费水平的提升对就业具有促进作用。消费是拉动经济增长的重要动力,消费需求的扩大可以刺激生产与服务供给,从而带动就业的增加。我国近年来推行的“扩大内需”政策和消费驱动型经济转型显著影响了就业市场的供需结构。

政府财政支出(X5)的回归系数为−0.028855,表明财政支出增加对就业人口总数的影响为负。这一现象可能与财政支出结构的分配不均或资源利用效率有关。例如,如果财政支出更多投向资本密集型行业或非生产性领域,而非直接用于刺激就业的政策,则可能对整体就业产生抑制作用。

结合宏观经济视角,我们可以进一步深入解读上述回归结果的经济意义:

(1) GDP增长率与就业的关系

GDP增长率与就业人数增长率呈现显著的正相关关系。这与我们的回归结果中全国人口总数(X2)对就业人口总数(Y)的正向影响相呼应(但由于X1——GDP与其他几个变量高度相关,因此剔除,不代表就业人数变化与GDP增长无关)。经济增长带动了更多的就业机会,这表明在宏观经济层面,保持GDP的稳定增长对于促进就业至关重要。

(2) 财政支出结构对就业的影响

不同财政支出结构会通过不同传导途径影响就业规模与就业结构。我们的回归结果显示政府财政支出(X5)对就业人口总数的影响为负,这可能与财政支出结构偏向有关。如果财政支出更多投向非生产性领域,可能会对就业产生抑制作用。因此,调整财政支出方向和结构,特别是增加对就业促进型政策的支持,对于提高财政支出的就业带动力具有重要意义。

(3) 消费水平对就业的拉动作用

居民平均消费水平(X4)对就业人口总数具有显著的正向促进作用。这与搜索结果中提到的消费持续修复、投资平稳增长,市场需求稳步扩大,对就业形势总体稳定有积极影响的观点相一致。消费作为拉动经济增长的重要动力,其增长可以刺激生产与服务供给,从而带动就业的增加。

(4) 薪资水平对就业的影响

居民平均薪资(X3)对就业人口总数的负向影响可能反映了企业用工成本的上升会导致一定的就业压力。这与宏观经济中劳动力成本上升可能抑制企业招聘需求的现象相符合。政府可能需要通过税收减免、社会保险费用分担等手段,降低企业用工成本,以平衡薪资增长与用工成本之间的关系[4]

(5) 宏观经济政策对就业的促进作用

高质量充分就业作为经济社会发展优先目标的重要性,并提出要促进财政、货币、产业、价格、就业等政策协同发力,提高发展的就业带动力。这表明宏观经济政策的制定和实施需要更加关注就业效应,通过政策协同来促进就业市场的稳定和发展。

综上所述,从宏观经济视角来看,上述回归结果揭示了各解释变量对我国就业人口总数的关键影响,并为理解我国就业市场的动态变化提供了重要依据。这些结果既符合我国当前的就业市场的实际情况,又能为优化我国就业政策提供方向性重要指导。

5.2. 统计意义解读

(1) 拟合优度

加权最小二乘法的回归结果显示,R2为0.972889,调整后的R2为0.967725,表明解释变量可以解释就业人口总数约97%的变异。说明模型对我国就业人口数量的变化具有较强的解释力。

(2) 方差齐性检验(F检验)

通过对模型的异方差性进行检验,White检验的结果表明原模型存在异方差问题,但加权最小二乘法(WLS)有效解决了该问题。F检验的显著性水平(p = 0.0000)进一步验证了修正后模型的整体显著性,说明方差齐性问题已得到有效处理,模型具备稳健性。

(3) T检验

由加权最小二乘法的回归可以看出各变量的T统计值均较大,且对应的P值均小于0.05,说明X2、X3、X4、X5对就业人口总数均具有显著的统计影响。这表明模型中选取的解释变量均对就业人口数量起重要作用。

6. 对策建议

基于上述回归分析结果以及我国就业市场的实际情况,提出以下三点针对性的政策建议,以缓解就业压力、提高就业质量,并促进就业市场的可持续发展:

1) 优化人口结构,提升劳动力供给质量

研究表明,全国人口总数对就业人口总数具有显著的正向影响,说明人口规模仍是支撑就业的重要基础。然而,随着我国人口出生率下降和老龄化问题的加剧,劳动力供给压力逐步显现。为应对这一挑战,应加快完善人口政策,如实施鼓励生育的政策措施,同时注重提高劳动力质量,推动职业教育与高等教育的深度融合,培养更多适应新兴产业需求的高素质劳动者。通过提升人口红利的质量,有助于促进就业的稳定增长[5]

2) 平衡薪资增长与用工成本,优化企业用工环境

研究发现,居民平均薪资的提高对就业人数存在负向影响,这可能反映了用工成本上升抑制企业招聘意愿。对此,政府应通过税收减免、社会保险费用分担等手段,降低企业用工成本,尤其是对劳动密集型企业和中小企业的支持力度。同时,应推动劳动力市场改革,建立更加灵活的用工机制,为企业提供更大的用工自主权,避免因过快的薪资上涨对就业产生消极影响,从而实现劳动力市场的双赢。

3) 激发消费需求,扩大内需促进就业

居民平均消费水平对就业人口总数具有显著的正向促进作用,表明消费对就业具有重要的拉动效应。因此,应加大力度扩大内需,通过提高居民收入、完善社会保障体系等措施激发消费潜力,尤其是在城乡消费差距较大的地区,加快建设消费基础设施,鼓励地方特色消费产业发展。同时,应进一步推动服务业升级和多元化发展,通过消费增长带动新岗位的创造,从而在经济内循环中促进就业。

参考文献

[1] 方昕. 基于计量经济学模型的分析——以X省就业情况研究为例[J]. 商业2.0, 2024(30): 81-83.
[2] 付雯雯. 经济增长和对外贸易与就业增长的相关性分析[J]. 老字号品牌营销, 2024(13): 36-38.
[3] 王若蕾. 基于多元统计分析地区私营企业和个体就业人数研究[J]. 现代营销(下旬刊), 2020(7): 193-195.
[4] 樊美玉. 企业所得税优惠对小微企业吸纳就业人数影响研究[D]: [硕士学位论文]. 淮南: 安徽理工大学, 2018.
[5] 林小纳, 卓敏华. 基于国内生产总值与就业人口关系的分析[J]. 安徽农学通报, 2017, 23(10): 12-16.