1. 引言
地区生产总值是指地区生产总值(地区GDP)是指本地区所有常住单位在一定时期内生产活动的最终成果。地区生产总值等于各产业增加值之和。地区生产总值是衡量一个地区发展情况的良好尺度,本文使用线性回归模型对云南省地区生产总值的影响因素进行实证研究,通过变量选择方法,筛选得到了对地区生产总值具有显著影响的因素,并建立了拟合模型,该模型通过了异方差性检验。
2. 数据来源与变量选择
2.1. 数据来源
本数据来源于国家统计局网(http://data.stats.gov.cn/easYquerY.htm?cn=E0103)上公布的2007~2016的相关数据。
2.2. 变量选择
本文的地区生产总值的影响因素的研究主要考察在众多因素中哪些因素对生产总值有显著的影响。此处首先给出自变量的待选变量集。经查阅资料,此处将城镇单位就业人员工资,全社会固定资产投资总额,地方财政一般预算收入和工业增加值、农林牧业增加值以及建筑业增加值引入待选变量集中,此外由于昆明作为春城花都,常年吸引世界各地的游客前来游玩,故将国际旅游外汇收入也引入待选变量集中。综上,此处选取地方财政一般预算收入(亿元)、全社会固定资产投资总额 [1] (亿元)、城镇单位就业人员工资总额(亿元)、工业增加值(亿元)、农林牧业增加值(亿元)、建筑业增加值(亿元)、国际旅游外汇收入(亿元) (为了统一数量级,此处将统计年鉴中的“百万美元”单位换算为“亿元”)为自变量,以地区生产总值(亿元)为响应变量。
3. 建立模型
3.1. 模型估计 [2]
首先,绘制出变量Xi (
)和Y之间的散点图(见图1),观察解释变量与响应变量之间的关系。通过散点图可以初步发现,解释变量Xi与生产总值Y大致成线性正向影响关系。Y与X之间的pearson相关系数分别为0.9936,0.9798,0.9938,0.9726,0.9968,0.9911,0.9834。
3.2. 用普通最小二乘法(OLS)估计模型 [3]
为了进一步分析解释变量Xi对生产总值Y的影响,本文采用多元线性回归模型对变量之间的关系进行验证。此处建立云南省地区生产总值影响因素分析的七元回归预测模型:
其中,X1系地方财政一般预算收入(亿元)、X2系全社会固定资产投资总额(亿元)、X3系城镇单位就业人员工资总额(亿元)、X4系工业增加值(亿元)、X5系农林牧业增加值(亿元)、X6系建筑业增加值(亿元)、X7系国际旅游外汇收入(亿元),Y系地区生产总值(亿元)。βi (
)为各解释变量对应的参数,μ为随机误差项。回归方程的参数估计值及检验结果如表1所示:
所得到的模型为
线性方程的回归检验的P值为
,R2为0.999,这意味着在5%的显著性水平下,因变量与自变量之间的线性关系是显著的。而在系数的t检验中,p值最小的是0.155,故在5%显著性水平下所有系数均不显著,即每个解释变量对被解释变量的线性影响均不是显著的 [4] 。这说明模型自变量之间很可能存在多重共线性。T检验中的解释变量都不显著,可能是由于某些自变量对因变量的影响被其他自变量所掩盖。为了检验多重共线性 [5] 的存在,进一步对各变量之间的相关关系进行分析研究,结果如表2所示:
Table 2. System resulting data of standard experiment
表2. 标准试验系统结果数据
由表可以看出,各变量之间的确存在一定的线性关系。对七个自变量采用逐步回归的方法进行变量筛选 [6] ,得到的结果如图2:
逐步回归 [7] 的结果显示选择的自变量应当为工业增加值(X4),农林牧业增加值(X5),建筑业增加值(X6)。在5%的显著性水平下,他们的P值分别为0.0002、0.0202和0.0000,表明这三个解释变量对模型方程的影响是显著的。
为了进一步确证变量选择结果,此处使用AIC准则 [8] 对一些重点待选模型进行比较。比较结果见表3。
由表可见,AIC准则提供的变量选择的结果与逐步回归法一致,均选择X4,X5和X6。
将模型方程进行二次拟合,结果如表4所示
故得出模型方程为:
。
3.3. 异方差性检验
a. 残差图分析法 [9]
由异方差性检验原理可知,当线性回归模型满足其假设条件时,即模型中不存在明显的异方差性,残差图上的n个数据点的散布应该是随机的,无任何规律。观察图3可得,数据点的分布较为随机,故此模型不存在明显的异方差性。
b. 斯皮尔曼(Spearman)检验 [10]
由MATLAB程序运算可得,P值为0.8810,大于0.5,故模型不存在异方差。
4. 结论
经过上述分析,我们建立了
这样一个方程模型。从这个模型来看,在地方财政一般预算收入、全社会固定资产投资总额、城镇单位就业人员工资总额、工业增加值、农林牧业增加值、建筑业增加值和国际旅游外汇收入这些自变量中,对地区生产总值影响最为显著的是工业增加值、农林牧业增加值和建筑业增加值。工业增加值、农林牧业增加值、建筑业增加值均与地区生产总值成正相关。这说明工业、农业和建筑业对地区生产总值的提高具有积极作用,这与我们的常识了解也是相一致的。欲提高一个地区的生产总值,应大力促进其工农建三方面产业的发展。