基于多元线性回归的国考进面分数影响因素研究
Research on the Influencing Factors of the National Civil Service Examination’s Passing Score Based on Multiple Linear Regression
摘要: 近几年,在国外经济环境大变动、国内宏观经济增速趋缓与产业结构深度调整的背景下,高校毕业生就业压力显著增强。在“就业难”的压力下,市场化就业岗位增速滞后于人才供给增速,推动大量学生转向体制内岗位以寻求职业稳定性。公务员职业凭借薪酬保障性、福利体系完善性及社会认同度优势,已形成应届生与往届生共同聚焦的“核心就业赛道”国家公务员考试作为我国最具影响力的公共部门选拔机制,其竞争烈度呈指数级攀升。本文通过对2024年度国家公务员考试不同岗位的进面分数进行统计和整理,利用多元线性模型进行线性回归,主要采纳招录人数、岗位所在地、人均收入(万元)、岗位机构层级、学历、政治面貌等12个因素,分析其对公务员考试进面分数的影响,构建相关模型。并通过异方差测试和多重共线性测试来验证模型的可行性,为报考公务员考试的考生和辅导职业规划的公考培训机构提供一定的帮助。
Abstract: In recent years, under the background of great changes in foreign economic environment, slowing down of domestic macroeconomic growth and deep adjustment of industrial structure, the employment pressure of college graduates has increased significantly. Under the pressure of “difficult employment”, the growth rate of market-oriented employment positions lags behind the growth rate of talent supply, prompting a large number of students to turn to positions within the system to seek career stability. With the advantages of salary security, welfare system perfection and social recognition, the civil servant profession has formed the “core employment track”, which is the focus of both new graduates and former graduates. As the most influential selection mechanism for the public sector in China, the competition intensity of the national civil servant examination is rising exponentially. By collecting and organizing the entry scores of different posts in the National Civil Service examination in 2024, this paper uses a multiple linear model to conduct linear regression, and mainly adopts 12 factors, such as the number of recruits, the location of the post, per capita income (10,000 yuan), the level of the post organization, educational background and political outlook, to analyze their impact on the entry scores of the civil service examination. Construct the relevant model. The feasibility of the model is verified by heteroscedasticity test and multicollinearity test, which can provide some help for the candidates who apply for the civil service examination and the public examination training institutions that guide the career planning.
文章引用:刘志念. 基于多元线性回归的国考进面分数影响因素研究[J]. 建模与仿真, 2025, 14(4): 838-847. https://doi.org/10.12677/mos.2025.144334

1. 引言

近几年来,我国经济由高速发展转向高质量发展,在这个转型期阵痛期中,大众的就业倾向开始发生深刻变化,原有的“下海创业”社会热潮逐渐向寻求体制内安稳的思潮。尽管一些高薪职位依然能够带来短期可观的经济收益,但其在风险抵御能力与社会保障层面的不足,促使求职者重新审视职业选择的价值取向。在这个经济转型时代背景下,公务员岗位因其稳定的职业前景、完善的福利体系及较高的社会认同度,逐渐成为高校毕业生职业规划的首选方向。相较于高流动性和高压力的市场化岗位,体制内工作的长期稳定性更契合社会风险意识增强后的择业需求。基于此,针对公务员考试笔试入围分数线的研究,不仅有助于应届毕业生制定科学的职业发展路径,更能为就业辅导机构提供数据支撑,实现岗位推荐策略的精准化与个性化。这种研究既能反映社会需求的结构性变化,也为优化人力资源配置提供实证依据[1]

过往其他研究公务员考试主要是从相关的录取制度方面研究[2],或者研究公务员考试热背后的原因[3],几乎没有从公务员录取分数着手研究,而这种研究缺乏确凿的数据,对考生的指导意义较弱,无法有效地对考生报考岗位进行指导。公务员考试辅导机构也亟需相关数据模型进行指导[4]

本文拟对2024年国家公务员考试进面分数进行研究分析,数据来源于2024年内国家各部委公布的招录数据和通过公开渠道发布的相关城市数据,通过采用OLS回归对国考进面分数进行分析,构建回归模型,本并对模型进行White检验和VIF检验,来确保模型的可行性以及准确性[5]

2. 多元线性回归

在现实世界中,变量之间大多为不确定关系,两个变量之间的非确定性关系也称为相关关系。在数理统计中,研究变量间各种相关关系的分析方法称为回归分析,常见的回归分析有一元线性回归和多元线性回归。考虑到影响国家公务员考试进面分数的因素有很多,所以采用多元线性回归分析[6]

设有k个自变量 X 1 , X 2 , X 3 ,, X k 所对应的每个观测值分别为 X i1 , X i2 , X i3 ,, X in ,以及因变量y对应的观测值 y i 满足关系式:

Y i = β 0 + i β j x ij + ε i ,i=1,2,,n;j=1,2,,k

其中 β 0 β j 为未知待估计的参数, ε i 为无法观测且满足一定条件的误差项。

3. 国考进面分数影响因素分析

3.1. 国考进面影响因素

公务员考试热逐渐升温,不同岗位的进入公务员岗位的面试分数影响大不一样,一些考生在国考中考试分数较高,但因为报名热门岗位,但是名落孙山,了解不同岗位的进面分数的影响因素有助于考生选择更适合自己的岗位,同时也有利于教育辅导机构向学员更好地推荐相应的岗位,提高服务的精准度和针对性。本文根据《中央机关及其直属机构2024年度考试录用公务员公告》所提供岗位信息,结合2024年各省市公布的录取公务员名单,将影响公务员考试进面分数的因素归纳为以下几个方面,分别是招考人数、过审人数、人均收入(万元)、房价(万元)、机构层级、学历、政治面貌、基层最低工作年限、城市等级、是否限制户籍、是否限制性别、是否限制应届[7]

根据这些信息作为自变量,来与因变量进面分数进行回归性分析,进而得出影响公务员进面分数的因素以及其中最为重要的因素,来对考生选择岗位作出参考。

3.2. 多元线性回归模型的建立

基于以上对于影响进面分数主要因素的分析,我们便可以对其各种影响因素做多元线性回归模型分析。我们可以把影响进面分数的各个变量分为定量指标和定性指标,对于其值会在一定范围内变化的变量称为定量指标,对于其范围在几个不同类型之间的变量称为定性指标。对于这两种指标的分类见下表1

Table 1. Overview of 13 indicators

1. 13个指标的总体情况介绍

变量类型

变量名称

说明

定量指标

最低进面分数

反映该岗位的进入面试的最低分数

招考人数

反映岗位招生人数

过审人数

反映岗位报考人员过审人数

人均收入(万元)

反映岗位所在地2023年人均收入

房价(万元)

反映岗位所在地2023年房价

定性指标

机构层级

分为四类:中央、省级(副省级)、市(地)级、县(区)级及以下

学历

分为四类:博士研究生、硕士研究生、本科生、大专

政治面貌

分为三类:中共党员、共青团员、不限

基层工作最低年限

分为四类:一年、二年、三年、五年以上、不限

城市等级

分为三类:一线城市、二线城市、三线城市及以下

是否限制户籍

分为两类:是、否

是否限制性别

分为三类:男性、女性、不限

是否限制应届

分为三类:2024届、非2024届应届毕业生、不限

首先,对于定量指标,我们记最低进面分数为因变量y,记招考人数为x1,过审人数为x2,人均收入(万元)为x3,房价(万元) x4

在研究定性指标时,我们为了研究上述8个指标是否会对国考进面分数造成比较大的影响,我们记机构层级为x5,学历为x6,政治面貌为x7,基层工作最低年限x8,城市等级x9,是否限制户籍x10,是否限制性别x11,是否限制应届x12。由于这些变量没有具体的数据,我们引入虚拟变量。分别设置机构层级为中央、学历为博士研究生,基层最低工作年限为一年、城市等级为一线城市、是否限制户籍为是,是否限制性别为男性、是否限制应届为2024届的变量为对照组,其余的变量为虚拟变量。即当样本是虚拟变量时,我们对其回归系数取1,当其为对照组时,我们取其回归系数为0。在加入控制变量后,我们就能够对定性指标作回归性分析。

首先我们假设以上的十二个变量与进面分数都服从多元线性回归模型:

y= β 0 + β 1 x 1 + β 2 x 2 ++ β 12 x 12 + ε i

首先我们对影响进面分数的定量指标即岗位招考人数、岗位过审人数、人均收入(万元)、房价(万元)作描述性统计,利用SPSS软件,所得结果如下表2

Table 2. Descriptive statistics

2. 描述性统计结果

名称

最低进面分数

招考人数

过审人数

人均收入(万元)

房价(万元)

样本量

16,169

16,169

16,169

16,169

16,169

最小值

90

1

0

1.623

0.17

最大值

144.7

27

4579

8.483

6.379

平均值

121.427

2.077

148.557

4.202

1.317

标准差

8.759

1.283

232.363

1.698

1.373

中位数

122.4

2

74

3.586

0.811

峰度

0.381

26.659

49.559

0.209

5.303

偏度

−0.601

3.102

5.336

1.113

2.506

变异系数

7.21%

61.76%

156.41%

40.40%

104.30%

从描述性统计的结果我们可以看出,与进面分数各种有关指标的最大值、最小值、平均值和标准差等数据,如2024年国考最低进面分数的均值大概为121.43分,报考人数最多的岗位有4579人报名等相关信息。查看岗位信息表,发现进面分数最高的岗位为国家税务总局青岛市市北区税务局一级行政执法员(七),有助于对数据进行进一步的分析。

对于定性指标,我们使用SPSS软件分别对岗位机构层级、岗位最低学历要求、岗位政治面貌、岗位基层最低工作年限、岗位城市级别、岗位户籍等进行描述性统计。分别设置机构层级为中央、岗位最低学历要求为博士、政治面貌为不限、最低工作年限为一年、城市等级为一线城市、不限制户籍、不限制性别和限制应届毕业生为A型的变量为对照组,其余的变量为虚拟变量。各个变量的描述性统计结果如下表3~9 [8]

要想分析出对于进面分数影响的重要变量,还需要进行多元线性回归分析。因此我们对此模型进行方差分析。假设原假设:

Table 3. Descriptive statistical results of job organization level

3. 岗位机构层级的描述性统计结果

机构层级

频数

百分比(%)

累积百分比(%)

中央

396

2.45

2.45

省(副省)级

736

4.55

7.00

市(地)级

3542

21.91

28.91

县(区)级及以下

11,495

71.09

100.00

合计

16,169

100.00

100.00

Table 4. Descriptive statistical results of the minimum qualifications required for the job

4. 岗位最低学历要求的描述性统计结果

学历

频数

百分比(%)

累积百分比(%)

大专

44

0.27

0.27

本科

14,043

86.85

87.12

硕士

2066

12.78

99.90

博士

16

0.10

100.00

合计

16,169

100.00

100.00

Table 5. Descriptive statistical results of job political status

5. 岗位政治面貌的描述性统计结果

政治面貌

频数

百分比(%)

累积百分比(%)

政治面貌不限

14,636

90.52

90.52

共青团员

481

2.97

93.49

中共党员

1052

6.51

100.00

合计

16,169

100.00

100.00

Table 6. Descriptive statistical results of minimum years of grass-roots work

6. 岗位基层工作最低年限的描述性统计结果

基层工作最低年限

频数

百分比(%)

累积百分比(%)

工作一年

31

0.19

0.19

工作二年

2017

12.47

12.66

工作三年

252

1.56

14.22

工作五年以上

32

0.20

14.42

工作时间无限制

13,837

85.58

100.00

合计

16,169

100.00

100.00

Table 7. Descriptive statistical results of job city level [9]

7. 岗位城市级别的描述性统计结果[9]

城市级别

频数

百分比(%)

累积百分比(%)

一线城市

1368

8.46

8.46

二线城市

2960

18.31

26.77

三线城市及以下

11,841

73.23

100.00

合计

16,169

100.00

100.00

Table 8. Descriptive statistical results of whether the job registration is restricted or not

8. 岗位报考是否限制户籍的描述性统计结果

是否限制报考人户籍

频数

百分比(%)

累积百分比(%)

不限制户籍

15,571

96.3

96.3

限制户籍

598

3.7

100

合计

16,169

100

100

Table 9. Descriptive statistical results of whether the position is restricted to recent graduates

9. 岗位是否限制应届的描述性统计结果

是否限制应届

频数

百分比(%)

累积百分比

不限

5971

36.93

36.93

应届毕业生

10,198

63.08

100.00

合计

16,169

100.00

100.00

H 0 : β 0 = β 1 == β 12 =0

其中多元线性回归的回归方法采用最小二乘估计法,利用其去寻求对每一个自变量的回归系数,其中最小二乘法原理记:

Q( β 0 , β 1 ,, β 12 )= i=1 n [ y i ( β 0 + β 1 x i1 ++ β 12 x i12 ) ] 2

在我们设置原假设的基础上使用OLS进行回归方程的显著性检验,方差分析结果见表10

Table 10. ANOVA results

10. 方差分析结果

平方和

df

均方

F

p值

回归

506758.584

13

38981.43

858.21

0

残差

733793.298

16,155

45.42

总计

1240551.883

16,168

利用SPSS对影响进面分数的定量变量和定性变量进行回归分析,首先对12个自变量前的回归系数进行联合显著性检验,其P值等于0.00,小于0.05,所以根据P < 0.05可以得出在95%的置信水平下拒绝原假设。

其中对于多元线性回归的拟合优度的求解需要先计算回归平方和,误差平方和以及总体平方和,计算公式如下:

SSR= i=1 n ( y ^ i y ¯ ) 2

SSE= i=1 n ( y i y ¯ i ) 2

SST= i=1 n ( y i y ¯ ) 2

由方差分析结果,我们得到回归平方和SSR = 506758.5841,残差平方和SSE = 733793.298,总离差平方和SST = 1240551.883。根据:

R 2 =1 SSE SST

R adjusted 2 =1 SSE/ ( nk1 ) SST/ ( n1 )

将计算的数据代入公式,可得 R adjusted 2 = 0.546,同时,我们对于进面分数的研究所做的回归模型的变量是解释型回归,我们对于拟合优度的要求并不是很高。

Table 11. Regression analysis results based on OLS

11. 基于OLS的回归分析结果

回归系数Coef

标准误差Std.Err

t

p

常数

98.246

2.752

35.694

0.000**

中央【参照项】

-

-

-

-

县(区)级及以下

6.238

0.543

11.497

0.000**

市(地)级

3.947

0.532

7.415

0.000**

省(副省)级

−3.671

0.51

−7.205

0.000**

博士【参照项】

-

-

-

-

大专

1.499

2.161

0.694

0.488

本科

5.661

1.71

3.311

0.001**

硕士

6.788

1.702

3.988

0.000**

不限政治面貌【参照项】

-

-

-

-

中共党员

0.775

0.262

2.952

0.003**

共青团员

−2.761

0.387

−7.136

0.000**

工作一年【参照项】

-

-

-

-

工作三年

−1.369

2.097

−0.653

0.514

工作二年

−0.165

2.047

−0.081

0.936

工作五年以上

−12.372

2.691

−4.598

0.000**

工作时间无限制

2.224

2.106

1.056

0.291

续表

一线城市【参照项】

-

-

-

-

三线城市及以下

2.381

0.497

4.794

0.000**

二线城市

4.75

0.442

10.739

0.000**

不限制户籍【参照项】

-

-

-

-

限制户籍

−3.443

0.301

−11.448

0.000**

不限性别【参照项】

-

-

-

-

女性

2.034

0.134

15.143

0.000**

男性

−1.931

0.151

−12.804

0.000**

限制应届毕业【参照项】

-

-

-

-

不限应届

3.421

0.236

14.509

0.000**

过审人数

0.013

0.001

19.097

0.000**

招考人数

−0.997

0.047

−21.373

0.000**

人均收入(万元)

1.601

0.066

24.23

0.000**

房价(万元)

0.037

0.123

0.304

0.000**

通过表11的回归分析结果可以看出,大专、工作期限二年、三年和工作时间无限制的P值均大于0.05,对进面分数是无显著性影响的,接下来不考虑这三项因素。

3.3. 异方差检验

由于在构建回归模型时,如果遗漏了影响因变量的重要解释变量,这些未被捕捉到的因素可能会以误差项的形式表现出来。同时解释变量之间可能存在复杂的交互效应或非线性关系,这些未被建模的部分也会体现在误差项中,从而引发异方差。异方差会导致OLS估计量的方差不再最小,参数估计失去“有效性”,影响置信区间和显著性判断的准确性。

异方差检验常见的有三种方法:残差图观察法:通过绘制整体的残差图以及残差与某个具体变量的散点图来观察是否存在异方差性。这种方法虽然直观,但结果不够严谨。BP检验法:将残差平方和作为被解释变量,解释变量不变。如果回归系数不显著,则说明残差平方和与解释变量之间不存在关系,即不存在异方差性。White检验法:比较经典假设下的普通标准差和异方差情况下的稳健标准差大小。原假设是模型同方差,备择假设是异方差。

而White检验法相较于BP检验法的检验能力更强,对大样本效果更好,检验范围更广,故本文采用。利用SPSS软件,本文对OLS模型进行White检验得到,得表12

Table 12. White heteroscedasticity test

12. White异方差检验

χ2

p

4012.841

0.0958

P值结果大于0.05,那么在95%的置信区间下,我们可以认为本文所构造的模型并不存在异方差异,所以对于原有的假设我们无法拒绝。

3.4. 多重共线性检验

在OLS模型中,当解释变量之间存在高度相关性时,回归系数的估计值会变得极不稳定,微小的数据波动可能导致系数数值发生显著变化,而参数估计的不稳定性会直接影响模型的预测精度,故需要对模型进行多重共线性检验。常见的多重线性检验包括:相关系数检验法、方差膨胀因子(VIF)检验法、辅助回归模型检验法和逐步回归法。本文采用VIF检验法。其方差膨胀因子的计算公式如下:

VI F K = 1 1 R 1K/M 2

VIF值越大,表明该变量与其他变量的线性相关性越强,共线性问题越显著。利用SPSS软件,对所有影响进面分数的12个自变量进行计算,得表13

Table 13. Independent variable VIF test results

13. 自变量VIF检验结果

VIF

容忍度

过审人数

1.169

0.855

招考人数

1.121

0.892

人均收入(万元)

3.229

0.309

房价(万元)

4.019

0.249

机构层级

1.396

0.716

学历

1.267

0.789

政治面貌

1.145

0.873

基层工作最低年限

2.482

0.403

城市等级

1.458

0.686

是否限制户籍

1.048

0.954

性别

1.277

0.783

是否应届

1.338

0.748

通过表13分析可得,所有的影响进面分数的自变量的VIF都小于5,模型不存在显著共线性,其中人均收入(万元)和房价(万元)的VIF值较高,有一定的相关性,符合一般大众认知规律。

4. 构建回归模型

对于影响进面分数所建立的多元线性回归模型,最终得出我们的假设模型的拟合优度是0.546,由于该模型的类型属于解释型模型。由此我们本文的线性回归模型:

最低进面分数 = 98.246 + 6.238*县(区)级及以下 + 3.947*市(地)级 − 3.671*省(副省)级 + 5.661*本科 + 6.788*硕士 + 0.775*中共党员 − 2.761*共青团员 − 12.372*工作时间五年以上 + 2.381*三线城市及以下 + 4.750*二线城市 − 3.443*限制户籍 + 2.034*女性 − 1.931*男性 + 3.421*不限应届+ 0.013*过审人数 − 0.997*招考人数 + 1.601*人均收入(万元) + 0.037*房价(万元)

5. 总结

本文通过整合国家部委公布的招考数据和各岗位的不同实际情况,分析影响国家公务员考试进面分数的主要因素,选取多元线性回归模型进行研究,计算出对进面分数影响最大的自变量,通过模型异方差测验和多元共线性测验来验证模型的正确性,最终构建我国公务员考试的进面分数与12个影响因素之间的回归模型。

本文也存在一些不足之处:首先,由于数据获取方面的限制,本文选用的仅仅是国家公务员考试数据,更广大的地方省考公务员数据和事业单位考试数据并未纳入分析。其次,本文所列变量并不能涵盖所有进面分数的影响因素。比如不同岗位对不同专业各有要求,这也是影响公务员进面分数的重要影响因素,但因为专业数据获取和整理不易,本文并没有对此进行进一步分析。因此,未来的研究可以进一步探讨岗位要求的专业和其他因素的对进面分数的影响[10]

参考文献

[1] 陆惠君, 黎欣雨. 大学生“考公热”现象的成因及引导路径探讨[J]. 广西青年干部学院学报, 2019, 29(2): 9-11.
[2] 邓悦. 中国公务员考试录用制度研究[D]: [硕士学位论文]. 沈阳: 辽宁大学, 2023.
[3] 王孟聪. 理性选择视角下高校毕业生公考热现象研究[D]: [硕士学位论文]. 长春: 长春工业大学, 2024.
[4] 高晓丽. 基于FAHP-SWOT综合分析的JBC公考培训机构竞争战略研究[D]: [硕士学位论文]. 重庆: 重庆师范大学, 2023.
[5] 吴景豪, 刘晔, 唐红林. 广东省公务员考试被录取应届生的梯次迁移模式及影响机制[J]. 热带地理, 2025, 45(2): 250-263.
[6] 黄炎璐. 基于多元线性回归分析的广西农产品跨境电商发展影响因素实证研究[J]. 桂林航天工业学院学报, 2021, 26(4): 470-476.
[7] 韦小超. 上海高校毕业生留沪就业意愿及其影响因素分析[D]: [硕士学位论文]. 上海: 华东政法大学, 2018.
[8] 李清源. S市税务系统公务员录用问题研究[D]: [硕士学位论文]. 苏州: 苏州大学, 2023.
[9] 张琦, 吴克明. 大学生就业地区选择分析——基于教育收益的视角[J]. 中国高校科技, 2017(Z1): 73-75.
[10] 吴亚琴. 高校毕业生公务员考试热的现象透析及对策研究[D]: [硕士学位论文]. 合肥: 安徽大学, 2023.