1. 引言
随着我国经济的不断发展,我国国内生产总值和各地区的地区生产总值呈现良好的发展态势。通过对我国国内生产总值的趋势变化分析以及相关预测,可以很好地把握未来经济发展的趋势和动向,帮助更好地应对风险和挑战。同时,针对地区经济发展,考虑到经济发展的多元性和复杂性,对可能存在的影响因素进行实证分析,可以更加全面地了解经济发展的内在机制和规律,为未来经济发展提供有益的参考。
通过查阅文献发现,在理论研究方面,部分学者认为,出生率与经济增长有着特定的关系。David和Licandrogoldaracena (1999),Bouncekkine等(2002)研究发现,在短期内出生率的提高会在未来几十年带来一定的劳动力人口,对经济增长起到促进作用,带来“人口红利”[1] [2];同时,冉征等(2021)设计了地区技术复杂度(ECI)指标,对各地级市(直辖市)的创新能力进行测算,并研究创新能力提升对于地区经济高质量发展的影响[3]。
在实证研究方面,通过魏玮和郑延平(2013)、孙晓华和柴玲玲(2012)的回归分析,以相关多样化水平和无关多样化水平与失业率之间的关系为桥梁,得出失业率的上升不利于地区经济稳定[4] [5];任达(2015)等人利用SPSS软件对居民收入占GDP比重等方面的数据加以分析,得到各地区的综合得分,为各地区经济发展综合评价提供参考[6];路春城、武嘉盟(2019)通过选取2000~2014年我国31个省份(直辖市及自治区)的面板数据进行实证分析,发现地方税收竞争对我国地方经济发展起到促进作用,经济发展水平越高,地区促进效应越强[7];通过张其仔等人(2012)对2002~2007年中国省级面板数据的构建,运用联立方程模型的方法都可以看出外商直接投资、出口贸易以及交通基础设施的发展等都直接或间接地对地区经济增长有稳定的正面影响[8]。
综上,目前已有较多学者探讨影响地区经济发展的因素,基于前人的研究,本文将融合以上各因素,探讨在多因素影响下地区经济发展的情况。
2. 数据来源、模型建立和样本选择
2.1. 数据来源
为保证数据的准确性,本文针对多元回归模型,选取2013~2019年我国31个省份及地区的地区生产总值作为研究样本,获取相关的地区出生率、城镇失业人口数量、人均可支配收入、国内三种专利申请数量、税收收入、货物出口额。数据均来源于《中国统计年鉴》。相应的经济指标解释如下。
① 地区出生率(rate):在一定时期内(通常为一年),各省份的出生人数与同期内平均人数(或期中人数)之比,用千分率表示。计算公式为
出生率 = 年出生人数/年平均人数 * 1000%
② 城镇失业人口数(unemployment):有非农业户口,在一定的劳动年龄内(16周岁至退休年龄),有劳动能力,无业而要求就业,并在当地劳动保障部门进行失业登记的人员。
③ 人均可支配收入(income):居民可用于最终消费支出和储蓄的总和,即居民可用于自由支配的收入。既包括现金收入,也包括实物收入。
④ 国内三种专利申请数量(application):各省份向专利局依据专利法申请对该项发明创造享有专有权的数量。
⑤ 税收收入(tax):各省份按照预定标准,向经济组织和居民无偿地征收实物或货币所取得的一种财政收入。
⑥ 货物出口额(export):在各省份海关注册登记的有进出口经营权的企业实际出口额。
对于解释变量和被解释变量的定义如表1所示:
Table 1. Variable definition table
表1. 变量定义表
变量性质 |
名称 |
符号 |
变量单位 |
被解释变量 |
地区生产总值 |
r_gdp |
亿元 |
解释变量 |
地区出生率 |
rate |
% |
城镇失业人口数 |
unemployment |
万人 |
人均可支配收入 |
income |
元 |
国内三种专利申请数量 |
application |
件 |
税收收入 |
tax |
亿元 |
货物出口额 |
export |
亿美元 |
2.2. 模型建立
在国民经济核算体系中,地区生产总值(地区GDP)受到多种经济因素影响,通过检索相关文献与查阅数据资料,本文筛选出6项与地区GDP相关的核心经济指标来进行分析与研究。首先将所有样本进行整合处理,按照截面数据的处理方式对数据进行多元线性回归模型的建立,以研究各因素对地区GDP的影响。多元回归方程如下:
i为对应省份(
),t对应年份(
),
是被解释变量地区生产总值,
是常数项,
是地区出生率,
是城镇失业人口数,
是人均可支配收入,
是国内三种专利申请数量,
税收收入,
是货物出口额,
误差项。
2.3. 样本选择
由于部分省份在某些年份的贫困人口数量数据存在缺失,为保证数据的完整性和结果的可靠性。经过Python爬取各省份统计年鉴对部分缺失数据进行补全处理,最终获得2013~2019年31个省份的217个有效样本数据。
3. 实证分析
3.1. 模型拟合
本文以Stata软件为统计分析工具,将所有样本进行整合处理,再将统计数据导入软件,按照截面数据的处理方式对数据进行多元线性回归模型的建立,以研究各因素对地区GDP的影响。多元回归方程如下:
i为对应省份(
),t对应年份(
),
是被解释变量地区生产总值,
是常数项,
是地区出生率,
是城镇失业人口数,
是人均可支配收入,
是国内三种专利申请数量,
税收收入,
是货物出口额,
误差项。
3.2. 共线性检验
本文以Stata软件为统计分析工具,将统计数据导入软件,并基于多元回归模型进行OLS最小二乘法进行拟合估计,计算得到初步回归结果,并根据相关数据根据VIF方差膨胀因子进行共线性分析检验如表2。
Table 2. VIF variance expansion factor test
表2. VIF方差膨胀因子检验
lnrate |
lnunemployment |
lnincome |
lnapplication |
lntax |
lnexport |
1.79 |
4.76 |
3.73 |
8.65 |
12.12 |
4.31 |
同时输出相关系数矩阵的散点图,如图1。
Figure 1. Correlation coefficient scatter plot
图1. 相关系数散点图
由表2可知,税收收入(lntax)的VIF大于10,同时参考图1发现变量之间的相关性较为显著,认为该模型存在共线性,应该消除解释变量之间的相关性问题,从而得到最优模型。
3.3. 回归模型的修正与选择
通过STATE软件,剔除相关性较大的两个变量lntax和lnapplication,采用逐步回归的方法,基于AIC准则选择最优模型,如表3,通过建立在熵的概念基础上,衡量所估计模型的复杂程度和模型的拟合数据的优良性,AIC准则不仅可以鼓励数据优良拟合,还可以避免出现过度拟合的情况。
Table 3. Model AIC value
表3. 模型AIC值
编号 |
模型 |
AIC |
1 |
|
63.59657 |
2 |
|
119.29 |
3 |
|
148.1891 |
4 |
|
347.6671 |
5 |
|
98.78591 |
6 |
|
314.2745 |
7 |
|
345.8122 |
8 |
|
534.9305 |
9 |
|
147.0325 |
10 |
|
191.7039 |
11 |
|
357.3866 |
通过程序进行逐步筛选,选择AIC值最小的模型作为最优模型,意味着在保证一定拟合优度的基础上,尽可能选择参数个数较少的模型,故选择模型1为最优模型如下:
即解释变量为:地区出生率(lnrate)、城镇失业人口数(lnunemployment)、人均可支配收入(lnincome)、出口额(lnexport)。
3.4. 模型的检验
在筛选出最优模型以后,对修正后的模型进行初步的多元回归分析,并进行后续检验,结果如表4。
Table 4. OLS preliminary regression model
表4. OLS初步回归模型
Variable |
Coefficient |
Std.err. |
t |
P > |t| |
lnrate |
0.5642936 |
0.0896365 |
6.30 |
0.0000 |
lnunemployment |
0.8266501 |
0.0343172 |
24.09 |
0.0000 |
lnincome |
0.7542001 |
0.073968 |
10.20 |
0.0000 |
lnexport |
0.1449622 |
0.0180405 |
8.04 |
0.0000 |
|
−2.4081114 |
0.8566437 |
−2.81 |
0.005 |
R-squared |
0.9194 |
Adj R-squared |
0.9178 |
异方差检验
在多元线性回归模型中,如果误差项(残差)存在异方差,就会导致估计模型的参数产生偏离。因此,本文通过STATE对建立的回归模型进行异方差检验。异方差检验常用的方法有BP检验法、怀特检验法和残差图观察法[9]。
1) BP检验与怀特检验
对模型进行BP检验和怀特检验如表5。
Table 5. BP test and White test
表5. BP检验和怀特检验
怀特检验 |
BP检验 |
chi2(14) = 73.96 |
chi2(1) = 2.90 |
0.0000 |
0.0887 |
由表可知,BP检验得到的P值为0.0887 > 0.05说明在5%的显著性水平下,接受原模型随机干扰项相同的假设,但是在给定的
的前提下,怀特检验得到的模型的P值为0.0000 < 0.05,故认为此模型存在异方差。
2) 残差图观察法
进行回归后画出模型的残差图,如图2。
Figure 2. Residual plot
图2. 残差图
由图2可以看出,残差的变化幅度较大,在拟合值较大时较为紧凑,当拟合值较小时,扰动项的方差较大。即可得出结论:此模型存在异方差问题。
3.5. 模型重建与分析
1) 模型构建
由于上述结果说明该模型存在异方差,对于上述模型进行最小二乘法异方差修正。选取残差平方的倒数作为权重进行修正,如表6,并得到最终模型为
Table 6. OLS preliminary regression model
表6. OLS初步回归模型
Variable |
Coefficient |
Std.err. |
t |
P > |t| |
lnrate |
0.5117219 |
0.0973092 |
5.26 |
0.0000 |
lnunemployment |
0.8632833 |
0.0303303 |
28.46 |
0.0000 |
lnincome |
0.7986083 |
0.701884 |
11.38 |
0.0000 |
lnexport |
0.1345708 |
0.016422 |
8.19 |
0.0000 |
|
−2.771311 |
0.823652 |
−3.36 |
0.001 |
R-squared |
0.9454 |
Adj R-squared |
0.9444 |
通过分析计算可知,模型的拟合优度变为R2 = 0.9454,估计量的置信区间、标准差、t值和P值都发生了明显变化,且在10%的置信度下系数检验全部通过。所以,该模型已经消除异方差带来的影响。
2) 拟合度检验
在实际应用中通常使用判定系数R2来衡量线性回归模型的拟合优度。R2的取值范围为[0, 1],R2的值越接近1,则说明回归方程对研究样本的拟合程度越好。在该模型中,R2值为0.9454,说明地区出生率、城镇失业人口数量、国内三种专利申请数量、货物出口额可以解释地区生产总值的94.54%变化因素。并且通过表6中的相关系数可以衡量地区出生率、城镇失业人口数量、人均可支配收入、货物出口额四个自变量对地区生产总值的影响程度,其中地区出生率、城镇失业人口数量、人均可支配收入、货物出口额的回归系数为正。
3) F检验
针对H0:
,即所有解释变量联合起来对被解释变量的影响不显著。给定显著性水平
,在F分布表中查出对应的临界值为3.3,因为F = 918.32,且P = 0.0000 < 0.1,表示模型通过F检验,说明地区出生率、城镇失业人口数量、人均可支配收入、货物出口额中至少一项会对地区生产总值产生影响。
4) t检验
首先确定原假设H0:
,给定显著性水平为10%,通过查找t分布表可知临界值为2.132。表6可知,所有变量的t检验的绝对值大于2.132。说明在给定的显著水平
下,应拒绝原假设H0,即保证其他变量不变的情况下,解释变量地区出生率、城镇失业人口数量、人均可支配收入、货物出口额对地区生产总值的影响显著。
3.6. 重建模型检验
1) 共线性检验
由于经济数据的特殊限制,国内生产总值与相关经济指标的时间序列数据都不是很稳定,在建立回归模型的时候通常会出现多重共线性问题,使得估计的数据不准确,或者t检验和P检验不可信等问题。因此,采用方差膨胀因子作为衡量标准对模型进行共线性检验。
方差膨胀因子(简称VIF)通常以10作为判断,若VIF超过10则表明存在较强的多重共线性,对重建模型根据进行VIF方差膨胀因子检验如表7。
Table 7. The VIF variance expansion factor test of the reconstruction model was reconstructed
表7. 重建模型VIF方差膨胀因子检验
lnrate |
lnunemployment |
lnincome |
lnexport |
1.53 |
2.43 |
1.94 |
2.96 |
由表7可知,地区出生率、城镇失业人口数量、人均可支配收入、货物出口额的VIF分别为1.53、2.43、1.94、2.96,均小于10。综上,模型设计通过共线性检验,解释变量基本不存在多重共线性,服从正太分布,符合OLS的基本假设,结果具有可信度,可进行后续的分析。
2) 残差检验
首先作模型的正态QQ图观察样本残差分布是否符合正态分布,如图3。从QQ图中可以观察到样本残差基本服从正态分布,这符合OLS最小二乘法的基本假设。
Figure 3. QQ plot of residuals
图3. 残差QQ图
接着从偏度、峰度角度确定残差是否服从正态分布。从表8中可以看出样本残差的偏度较小、峰度接近2,这符合正态分布的要求。同时D.W检验值接近2,P值为0.1171大于0.05,残差不存在序列相关性,即接受原假设即认为残差服从正态分布,样本数据通过残差检验。
4. 经济意义分析
地区出生率的回归系数约为0.5117219,P = 0.000 < 0.01,在1%的水平下显著,说明地区出生率越高,地区生产总值越高。原因可能是出生率的提高可以提供更多的劳动力,促进地区经济水平发展。
Table 8. Skewness, kurtosis, D.W test results
表8. 偏度、峰度、D.W检验结果
偏度 |
峰度 |
D.W |
P-value |
−0.2935493 |
2.949628 |
2.16303 |
0.1171 |
城镇失业人口数的回归系数约为0.8632833,P = 0.000 < 0.01,在1%的水平下显著,说明城镇失业人口数越高,地区生产总值越高。原因可能是某些行业的衰退或者技术替代导致城镇失业人口增加,但是对于地区生产总值可以起到促进作用。
人均可支配收入的回归系数约为0.7986083,P = 0.000 < 0.01,在1%的水平下显著,说明人均可支配收入越高,地区生产总值越高。原因可能是居民手头的资金更加宽裕,他们有更多能力去消费和投资,这种消费扩张将带动生产活动的增加,进而推动GDP的增长。
出口额的回归系数约为0.1345708,P = 0.000 < 0.01,在1%的水平下显著,说明货物出口额越高,地区生产总值越高。原因可能是地区出口额的增加可以反映地区企业和产业在国际市场上的竞争力,企业创新和升级会进一步提高生产效率和市场占有率,从而带动地区经济发展。
5. 结论及建议
本文通过实证分析得出以下结论:地区出生率、城镇失业人口数、人均可支配收入、货物出口额的提高会促进地区生产总值的提高。通过结合地区发展现状,本文针对地区生产总值的提高提出以下几点建议:
1) 优化生育政策,提高公共服务水平
政府可以制定更加灵活的生育政策,鼓励家庭生育。例如,通过提供生育津贴、扩大产假和育儿假等措施,减轻家庭生育的经济负担和时间压力。同时,通过改善教育、医疗等公共服务设施,提高服务质量,降低家庭在子女成长过程中的后顾之忧。这将有助于增强家庭的生育意愿,从而提高地区出生率,进而逐步增加劳动力人口以促进地区生产总值的提高。
2) 优化产业结构,鼓励创新创业
地区生产总值的增加并不能直接反应就业市场的状况,本文主要关注新兴行业发展对于衰退行业的市场抢占所造成的失业。通过优化产业结构,推动传统产业转型升级,同时大力发展新兴产业和现代服务业,提升地区整体的经济实力。同时也应关注在产业转型和创新创业发展过程中创造更多就业岗位,吸纳失业人口。
3) 提高居民收入水平,优化消费环境
政府和企业应该注重提高劳动者的工资水平,保障劳动者权益,使劳动者能够获得与其劳动付出相匹配的报酬。同时加强市场监管,打击假冒伪劣商品,保护消费者权益,提高消费者的购物信心。
4) 优化产品结构,改善营商环境
加大对高新技术产品、绿色环保产品以及具有地域特色和文化内涵的产品的研发和推广力度,提高出口产品的国际竞争力。同时,加强知识产权保护,维护企业合法权益,为出口企业提供良好的法治保障。政府、企业和社会共同努力,推动地区出口额的增长,进而促进地区经济发展的繁荣。