1. 引言
近年来,中国硕士研究生的招收量持续扩大,伴随着扩招趋势,高校正承受着更多的压力,这使得他们必须提高并更新他们的研究生管理和服务水平。因此,如何在研究生规模不断扩大的背景下,提高教育水平和质量,还有待进一步的研究[1]。所以,对研究生招生规模进行科学、合理地预测,对于保障研究生教育的整体质量具有重要意义[2]。它能够为教育单位把控教育资源的分配提供依据。马彩红等人借由制度变迁理论,运用制度变迁理论深挖自改革开放至今中国研究生招生体系的变化历程,揭示了这一过程中的内部逻辑并找出其中的关键特性与法则、探讨了可能出现的问题,对未来的招生体制改革趋势进行了合理的预测[3]。曹有容等人采用描述性统计及GM(1,1)灰色模型对广西高等医学院校研究生培养整体情况及发展趋势进行了预测分析。得出随着广西高等医学院校研究生招生规模不断扩大,保持招生规模稳步增长的同时进一步优化学科专业结构,加强相关紧缺医学专业研究生的培养力度是研究生教育的重中之重[4]。谭军等人采用了Logistic预测模型,并用遗传算法求得其待定系数,求得了模拟值与实际招生数拟合最好的模型,对湖北省过去二十年的硕士研究生录取情况进行了深入的分析和预测,得出要想确保湖北省研究生教育的可持续增长,要增强对于提升研究生教育价值的重要性意识,积极改进其教学环境,同时,要转变关于中央政府、部门及省级单位举办研究生教育的传统思维,强化地域教育管理机构的作用,并对当地研究生教育的构成做出适当的调整,减少过分强调行业学院或省政府所属大学的情况,发挥本地研究生教育的整体优势[5]。汪瑾璇等人为了进一步提高招生管理效率,通过研究高校研究生招生管理落实现状分析、工作中存在的问题、加强高校研究生招生工作管理的对策,提出三点招生管理强化途径:(1) 提高招生管理人员综合素质;(2) 完善招生管理制度;(3) 优化招生管理的培训指导[6]。李红霞等人使用了人工神经网络模型来解决黑龙江省的研究生招生历史数据中存在的信息分散和众多潜在的影响因素的问题,研究中利用这个模型对每年的人数变化进行了深入的探索和系统的分析,并建立了一个有效的预测模型成功地预估了未来的三年内可能出现的招生人数的变化趋势[7]。许多要素会影响某一区域的研究生招生数量,如国家的教育方针、地方的教育法律和当地的社会经济状况等等。所以,用一种方法来预估特定区域的研究生招生量是不可靠的。为了通过合理的预测来控制研究生的招生规模,以此作为调整教育资源的重要参考依据,有助于确保整个研究生教育的质量得到有效保护,我们考虑到ARIMA模型对于短期预测的高精确度,本篇论文将其应用到了研究生教育规模的预测中,并通过中国历年的研究生招生数据作为实际案例进行验证。基于预测的结果,我们进一步探讨了中国的研究生招生数目发展轨迹及当前研究生教育的情况,从而提出了一系列有助于实现研究生教育规模与品质平衡提升的相关意见。
自改革开放开始至今,硕士生录取政策已根据政治、经济状况变化和国民深层改革进程持续调整。近些年,由于硕士生更积极地制定未来计划,我们认为“所有历史都与现在息息相关”,过去的经验塑造着当前乃至未来的走向。基于此,本文利用时间序列模型精确预测过往数据并以此作为基准,对1984至2023年的中国研究生招录规模展开预测分析,旨在揭示其历史演进过程,探索发展的法则,发现潜在问题,同时考虑目前的形势和需求,推测研究生录取政策的发展趋势和路线,并给出有实际指导意义的改良方案,为我们优化中国的研究生录取制度提供了有益的参考意见。
2. ARIMA模型介绍
我们都知道,在获得观察值序列后首先我们要对其进行平稳性检验,当观察值序列是平稳序列时我们才可以对其进行下一步的预测分析。但是实际生活中绝大部分序列都是非平稳的(如本文数据得到的原始序列),所以我们一般会对非平稳序列采取差分运算使其显示出平稳序列的性质。而对差分后的平稳序列我们一般可以使用求和自回归移动平均模型来进行拟合预测,简记为ARIMA(p,d,q)模型:
(1)
(1)式中,
;
,为平稳可逆ARMA(p,q)模型的自回归系数多项式,
为平稳可逆ARMA(p,q)模型的移动平均系数多项式。
求和自回归移动平均模型的来由:d阶差分后的序列:
(2)
(2)式中,
,表示差分后序列等于原序列的若干序列值的加权和,对差分序列又可以拟合自回归移动平均ARMA模型,这就是求和自回归移动平均模型的来由。简记为:
(3)
(3)式中,
为零均值白噪声序列。ARIMA本质上是结合了差分运算和ARMA模型,而ARMA模型的分析方法已经十分成熟,因此,我们运用适当的差分运算对非平稳的序列进行处理后再进行的拟合分析(ARIMA模型)也是十分简便可靠的。
3. 实证分析与结果
为了预测我国未来五年的研究生招生人数,我们采用了1984年至2023年的相关数据(数据均来源于《中国统计年鉴》),并使用Eviews10统计分析软件建立了一个合适的模型。
从1984年至2023年间的中国研究生招生数据时序图(见图1)可以观察到,整体上,中国研究生招生人数呈现出指数级增长,初步判断该时间序列并不稳定。
Figure 1. Time series chart of China’s graduate enrollment data from 1984 to 2023
图1. 1984~2023年中国研究生招生人数数据的时序图
1) 自相关图检验法
中国的研究生人数序列的自相关系数不是很快地趋于零,即缓慢下降,再次判断该序列不是一个平稳序列(如图2)。
2) 单位根检验
通过以上分析该序列很明显不是平稳序列,我们又对其做了单位根检验(含常数项)结果仍然显示它不是一个平稳序列(见图3)。
接下来,我们将对原序列进行一阶差分平稳化处理,再对差分后的序列进行检验。本文通过eviews10软件对该序列进行一阶差分处理。由图4可以看出一阶差分后的序列似乎总是在一个常数附近波动,但是在后面几年有较大波动,根据之前的经验,一般来说一阶差分后的序列大多就平稳了,而且,图示法一般具有较大主观影响,所以本文进一步对一阶差分后的数据进行更为详细的单位根检验来确定其平稳性。
Figure 2. Autocorrelation chart of graduate enrollment in China from 1984 to 2023
图2. 1984~2023年中国研究生招生人数的自相关图
Figure 3. Unit root test (0th order, including constant terms)
图3. 单位根检验(0阶、含常数项)
Figure 4. Time series after first-order differencing
图4. 一阶差分后的时序图
如图5所示,一阶差分后,从实验结果得出:1阶、含常数项和趋势项形式下的P小于0.05,说明一阶差分后的序列是平稳的时间序列。
Figure 5. Unit root test (1st order, including constant and trend terms)
图5. 单位根检验(1阶、含常数项和趋势项)
由图5直观的展现出,P值等于0.0003 < 0.05,t统计量值为−5.511746,这个值比1%、5%、10%显著水平下的都小,拒绝原假设,时间序列平稳。
单位根检验过后,进一步对经过一阶差分处理后的中国研究生招生数据进行了纯随机检验所得到图6。检验结果显示各阶延迟下的P值都小于显著性水平0.05,所以可以得到一阶差分后的序列为一个平稳的非白噪声序列,进一步证明了此时序列的平稳性。
Figure 6. Autocorrelation diagram after first-order differencing
图6. 一阶差分后的自相关图
3) 模型的识别与定阶
由一阶差分后的自相关图(图6)显示,延迟1阶、2阶、3阶的自相关系数大于两倍的标准误差。偏自相关图显示延迟1阶和3阶的偏自相关系数大于两倍标准差。根据ACF和PACF的特性选择建立模型,建立ARIMA(0,1,3)模型,见图7。
综合图7中的数据信息,本文最终选择ARIMA(0,1,3)作为1984~2023年中国研究生招生人数的预测模型,此时模型是一阶、含常数项和趋势项的形式,此时的单位根检验的P值也更小,进一步说明了模型的可靠性。
Figure 7. Parameter estimation diagram of model ARIMA(0,1,3)
图7. 模型ARIMA(0,1,3)的参数估计图
4) 模型检验
确定了匹配的模型后,此阶段会对已创建的模型实施重要性的评估,其重点在于检查模型对于数据抽取的完整度、参数的重要性测试及模型架构的最优化程度。检测的结果以图表形式展示于如(图8)。可以从结果看出ACF和PACF都没有显著异于零,Q统计量的P值几乎都大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分,整个模型比较精简,模型较优。
Figure 8. Residual test of model ARIMA(0,1,3)
图8. 模型ARIMA(0,1,3)的残差检验
从模型的拟合图(图9)可以进一步看出该模型的拟合效果较好可以用于对中国研究生的招生人数进行下一步预测分析。
Figure 9. The fitting effect of the model ARIMA(0,1,3)
图9. 模型ARIMA(0,1,3)的拟合效果图
5) 招生人数预测
首先,本文对1984~2023年研究生招生人数样本内预测图做分析,发现拟合效果较好,如图10所示。
Figure 10. Sample level prediction of graduate enrollment from 1984 to 2023
图10. 1984~2023年研究生招生人数样本内预测图
如图10所示,我们得到该模型的偏差率和方差比率占比较小,协方差比率占比很大而且三者的和等于1。可以看出该预测模型较好,可以进一步对数据进行分析预测。
最后,将序列的真实值和预测值组成一个数组(图11),做出两者的时序图对其进行比较可以看出实际值序列和预测模型序列的拟合程度很好,预测值与真实值的差异较小。
Figure 11. Fit between actual values and prediction models
图11. 实际值与预测模型拟合图
6) 预测结果分析
由预测结果和原值的比较结果可以看出模型预测结果较好(见表1),相对误差较小,成功预测了我国未来五年的研究生招生人数(见表2)。未来5年我国研究生招生人数的上涨速度将继续增大,我国相关教育部门将迎来新的挑战。
Table 1. Comparison of predicted and actual values
表1. 预测值与实际值的结果比较
年份 |
2020 |
2021 |
2022 |
2023 |
实际值 |
110.655 |
117.652 |
124.2479 |
130.2 |
预测值 |
105.050 |
115.774 |
125.998 |
132.911 |
Table 2. Forecast of graduate enrollment in China in the next five years
表2. 未来五年中国研究生招生人数预测值
年份 |
2024 |
2025 |
2026 |
2027 |
2028 |
预测值 |
130.8577 |
134.1466 |
137.43552 |
140.72440 |
144.01327 |
4. 结论
随着我国研究生招生规模的不断扩招,研究生的招生质量和研究生的教育培养方面也迎来了巨大的挑战。本文运用统计学与时间序列的理论方法作为基础,结合研究生招生的实际情况,运用时间序列方法ARIMA模型对近几年研究生人数做预测研究,得到结论如下:
依据1984~2023年间中国研究生招生人数数据,利用Eviews软件对数据平稳分析处理,取差分使得数据成为平稳序列,然后根据ACF和PACF进行模型识别,通过模型检验与优化,最终建立ARIMA(0,1,3)模型,预测2024~2028年未来5年的研究生招生人数,可以较好的反应研究生人数的趋势,但是该模型是在不考虑就业等的影响因素的情况下对未来趋势做预测,由于研究生人数受各种外界情况的影响,例如,如果研究生就业形势不太好的情况下,会导致研究生人数下降,此时预测误差会较大,所以该模型仅用来进行短期预测,如果模型被用来预测长期研究生人数,就需要进一步加强对模型的研究,提高模型预测的精度,使得预测更为精准,预测更接近实际值。从总体上看,在过去的几年里,考研报名人数连续增长,主要受到多方面因素的影响。一方面,随着高等教育的普及,本科生数量增加,加上经济下行的影响,许多考生认为继续深造可以提高自己的就业竞争力。另一方面,一些考生希望通过考研来提升自己的学校层次,以应对就业压力。然而,随着考研热度的上升,考研的难度也在不断增加。越来越多的考生意识到,花费大量的时间和经济成本去获取一个硕士学位,并不一定能够带来显著的就业优势。特别是在经济不景气的情况下,许多考生开始重新评估考研的性价比,认为与其花费大量的时间和金钱去考研,不如及早进入职场积累工作经验。此外,研究生培养的质量把控越来越严格,考试难度增加,使得“混”毕业变得越来越难。一些考生在权衡利弊后,可能会选择不考研或者推迟考研计划。这也提醒了广大考生,考研有风险,读研需谨慎。在做出决定前,应充分考虑自己的研究兴趣、能力以及未来的职业规划。总的来说,2024年考研报名人数的下降反映了考生对考研的理性看待,以及对研究生教育投资回报的重新评估。这也预示着“考研热”可能开始降温,考生和家长会更加理性地考虑是否继续深造。
NOTES
*通讯作者。