1. 引言
1.1. 研究背景和意义
改革开放以来我国发生了翻天覆地的变化,经过三十年的发展我国的经济总量已稳居世界第二。但是现在的中国依然存在着贫困地区,贫困人口,我们的农村依然落后,我们的人均GDP依然处于中下等收入水平。显然GDP并不能完全衡量一国的发达程度和国民的生活水平。民生是我们国家一直重视的问题,必须把民生问题放在第一位。近年来国家开始重视农村的发展,国家开始颁布一些惠农政策:种粮直补、农机补贴、产粮大县奖励等。但是考虑到我国农村人口多且发展水平远远落后于城镇,国家福利政策并不能彻底解决我国农城乡居民收入差距过大的问题。我们的最终目标是实现共同富裕,邓小平同志说过“我们允许一部分人先富起来”。但是仅仅靠城镇的发展来支撑国家的经济会导致城乡居民收入差异过大使得社会不稳定。所以提高农民的收入以缩小城乡居民收入的差异,对于我国实现全面的小康社会,现代化以及社会的和谐稳定发展具有重要的意义。那么如何才能使农民真正的富起来,如何使城乡居民收入差距变小成为越来越重要的课题。自从改革开放以来,我国政府改变了城市的长期封闭状态,加速城市化进程,大量的农民工流入到城市中,这一进程使得城乡居民的收入都在持续提高,但是令人关注的问题是城乡居民收入差距却有增大的趋势。如果要确保整个国家社会的稳定和经济的快速发展,必须重视城乡居民收入分配的不平等问题。
1.2. 国内外文献综述
综合国内外学者的研究成果虽然应用的方法各异,讨论的因素不同,但是可以总结出影响城乡居民收入差异的几个因素:城镇化水平、经济的发展情况、国家政策、教育水平等。虽然文献很多但大多是研究单个指标对城乡居民收入差异影响的研究。本文综合国内外文献的研究成果选取多个指标进行综合分析,主要利用计量经济学方法进行研究分析。通过综合分析可以得出各指标对城乡居民收入差异的影响方向和影响程度,同时可以将多个指标对城乡居民收入差异的影响进行比较,得到更加全面的分析结果,总结出更具有建设性的观点 [1] [2] [3]。
2. 城乡居民收入差异的现状分析以及模型构建
2.1. 我国城乡居民收入差异的现状分析及预测
从图1我们用不变价的人均GDP来表示我国经济的发展状况,可以看到我国自1978年开始实施改革开放以来经济一直保持增长,并在21世纪实现了较快增长。这在一定程度上说明我国的人民生活水平在不断地提高,并且在2017年不变价人均GDP达到了9500元左右。从图中可以看出,在我国经济持续增长的时间里,我国城乡居民收入差距却变化不定。根据1978~2017年城乡居民收入差异的时间序列图,我们可以看到我国的城乡居民收入差异在1978~1990年是呈现下降趋势的。在1990年到2000年的这段时间呈现上涨趋势,进入21世纪之后城乡居民收入差距在一个比较高的位置达到稳定,并且在2010年开始城乡居民收入差异开始呈现下降趋势。库兹涅次倒U曲线是说横轴表示经济发展的某些指标,纵轴表示收入分配不平等的指标,解释的关系为倒U字。国内的学者纷纷验证倒U假说,比如刘敏楼利用省区的横截面数据得出两者之间的关系不是统计显著的库兹涅次倒U曲线;陈伟国、樊士德利用1978到2006年的面板数据,验证了库兹涅次倒U曲线。不过经济发展的资料表明,曲线不符合发展中国家的实际情况,发展中国家的收入不平等会越来越悬殊。不过用人均GDP为横坐标来来表示国家经济的发展,以城乡居民消费水平的比值作为纵坐标表示收入分配的不平等,可以看到1978年到2000年是正U曲线,1990到2017年却是一个倒U曲线,且我国的城乡居民收入差异已经过了拐点,呈下降的趋势。

Figure 1. Time series chart of GDP per capita and income difference between urban and rural residents
图1. 人均GDP及城乡居民收入差异的时间序列图
为了能够较好的把握我国未来城乡居民收入差距的情况下面我们利用1990~2017年衡量城乡居民收入差距的指标的时间序列数据做一个ARIMA趋势模型,更准确地预测我国未来的城乡居民收入差距。
2.2. ARIMA模型的建立步骤
2.2.1. 利用ADF单位根检验,确定单整阶数
1) 建立一对假设即原假设和备择假设:
H0:时间序列存在单位根;H1:时间序列不存在单位根
2) 利用eviews软件进行ADF检验最终检验结果如表1所示:
注:用Y表示城乡居民收入差异,用∆Y表示城乡居民收入差异的一阶差分序列。
从表1我们可以看到,对时间序列进行ADF单位根检验检验类型都是包含趋势项和截距项。原时间序列的ADF检验统计量的值为−1.125182,其伴随概率为0.9112,在1%,5%,10%显著性水平下是不拒绝原假设的即原时间序列是不平稳的。对城乡居民收入差异的一阶差分序列进行ADF检验的统计量的值为−3.957,它的伴随概率为0.0190,所以说分别在5%显著性水平是拒绝原假设的,即一阶差分序列是平稳的。所以得出城乡居民收入差距的时间序列为一阶单整序列即I(1)序列。
2.2.2. 模型的识别
通过差分序列的自相关函数和偏自相关函数来判别模型的形式 [4]。利用eviews8.0软件得出的自相关函数图和非自相关函数图中可以判断自相关函数,偏自相关系数都是第一个后截尾,所以初步判断模型ARIMA(1,1,1)。为了更加准确地建立ARIMA预测模型,利用软件分别建立模型:ARIMA(1,1,1),ARIMA(1,1,0),ARIMA(0,1,1),依据AIC,SC,HQ准则来判断ARIMA模型的具体形式:

Table 2. Model lag order judgment
表2. 模型滞后阶数判定
如表2所示在模型为MA(1)时AIC和HQ取值最小,模型为AR(1)所以选择MA(1)模型,即建立ARIMA(0,1,1)模型。
2.2.3. 模型的建立
从表3中可以看到模型的拟合优度即可决系数R2是很高的为0.926,也就是因变量的变差中有96%可由该拟合模型所解释。说明模型拟合的很好。

Table 3. Model goodness of fit evaluation table
表3. 模型拟合优度评价表

Table 4. ARIMA model coefficient table
表4. ARIMA模型系数表
在表4中我们可以看模型中一阶滞后项的参数t检验的p值为0.002,所以参数在显著性水平5%情况下通过了t检验。用∆Y表示城乡居民收入差距的一阶差分序列,用a表示残差序列,则可以直接写ARIMA(0,1,1)模型的表达式:
(1)
从图2可以观察到时间序列的拟合值同原时间序列实际值基本重合,也说明了模型拟合的比较好,同时可以看到未来我国的城乡居民收入差异呈现下降趋势。

Figure 2. ARIMA model fitting and prediction chart
图2. ARIMA模型拟合及预测图
2.2.4. 模型的适应性检验
首先利用LM检验根据AIC,SC,HQ准则来确定残差序列的滞后阶数 [5] [6],结果如表5所示:
依据AIC,SC,HQ的最小准则,残差序列的序列相关检验应以滞后一阶为准。提出一对假设:
H0:残差序列无一阶自相关;H1:残差序列存在一阶自相关。
根据LM检验的检验统计量为0.415813,伴随概率为0.5190,所以不拒绝原假设,即残差序列{at}是独立的。城乡居民收入差异数据建立的ARIMA(0,1,1)模型是适应的。利用该模型可以对城乡居民收入差异进行预测。
3. 影响城乡居民收入差异的因素定量分析
3.1. 指标选取
根据大量学者对于城乡居民收入差异的因素分析,本文总结出多个影响城乡居民收入差异的因素,考虑数据的可得性,和分析的科学性,选取了三个可能影响城乡居民收入差异的指标,即经济发展,城镇化水平以及产业结构。
用城镇人口占总人口的比重来表示我国的城镇化水平;用第二产业占总增加值的比重来表示产业结构的变动情况;人均GDP衡量经济的增长。为了消除通货膨胀对数据分析的影响,我搜集1978年到2017年的居民消费价格指数,并且计算出以1978年为基期的不变价的人均GDP;对于城乡居民收入差异的测度指标有很多种,主要有城乡居民收入比、基尼系数和结构相对数等等。但是考虑城乡人均可支配收入并没有包含城市居民的养老保障、失业保险等福利因素,使用城市和农村居民的消费水平比值来表示城乡居民收入差距更加合理 [7] [8]。
我搜集了各个指标在1978~2017年的有关数据。在经济意义上,城乡居民收入差异和经济增长,以及产业结构,城镇化水平在某种程度上有着一定的联系,那么本文将用数据分析来判断这些指标之间存在着怎样的关系,最终我们要研究我国经济水平,产业结构,城镇化水平是如何影响我国的城乡居民收入差异的。接下来所有的数据分析都是在计量分析软件eviews8.0上完成的。
3.2. 平稳性检验
我们所用的数据均为时间序列数据,对时间序列数据进行分析之前首先要对数据进行平稳性检验。可以帮助我们确定恰当的数据分析方法。数据的平稳性检验方法有很多种,这里我们用ADF单位根检验。检验结果如表6所示:

Table 6. ADF unit root test result
表6. ADF单位根检验
对原时间序列进行单位根检验结果都是不平稳的,对原时间序列进行一阶差分后,再进行单位根检验。结果如表所示,在5%的显著性水平下,所有的时间序列都是平稳的。因为四个变量是同阶单整的,他们之间很有可能存在着协整关系,所以我们选择用Johansen协整检验来考察四个变量之间是否具有长期的均衡关系 [9]。
3.3. 最优滞后阶数的确定
首先要建立VAR模型,在VAR模型中选择较大的适当的滞后阶数,能够消除误差项中存在的自相关,但是滞后阶数过大会使得模型自由度减少,影响模型参数估计的有效性。我们利用LR、FPE、AIC、SC、HQ五个准则来确定最优滞后阶数。结果如表7,当设置最大的滞后阶数为4时,在滞后阶数为4时四个判断准则都达到了最小值,所以最后选择最优滞后阶数为4。

Table 7. Model lag order evaluation table
表7. 模型滞后阶数评价表
3.4. 最优滞后阶数的确定
已经确定最优滞后阶数为4后,下面开始进行Johansen协整检验。检验结果如表8所示。

Table 8. Johansen cointegration test results
表8. Johansen协整检验结果
当原假设为不存在协整关系时,检验的迹统计量为98.05991,而5%显著性水平下的临界值为47.85613,统计量的值明显大于临界值,且最大特征值为53.399,也大于相应5%临界值,所以在5%显著性水平下应该拒绝原假设,即城乡居民收入差异,人均GDP,第二产业占增加值比重,城镇化水平四个变量之间存在着协整关系。当原假设为最多存在一个协整关系时,迹统计量为44.66053,同样大于5%显著性水平下的临界值,且最大特征值也大于5%显著性水平的临界值,表明在显著性水平为5%的水平下拒绝原假设。同理,当原假设为至少存在两个和三个协整关系时,迹统计量的值均小于5%显著性水平下的临界值,所以不拒绝原假设。综上所述,四个变量之间存在两个协整关系。
当被解释变量为城乡居民收入差异时得到了如表9所示的协整方程,并且方程具有较大的对数似然值为402.7699,说明方程拟合的很好。协整方程为:
(2)

Table 9. The co-integration relationship with the income difference between urban and rural residents as the explained variable
表9. 以城乡居民收入差异为被解释变量的协整关系
通过协整方程式,可以看到城乡居民收入差异与第二产业比重和城镇化率有正相关的长期均衡关系,而与经济增长有着负相关的长期均衡关系。其中,第二产业所占比重每上升1%,城乡居民收入差异增加1.52%,人均GDP每增加1%,城乡居民收入差异会减少0.15%,城镇化水平每增加1%,城乡居民收入差异会增加0.92%。我们从协整方程的结果来看,与预期判断存在出入。比如说,我们会认为随着国家工业的发展,社会会涌现更多的工作机会,农民可以获得工资性收入,应该会使城乡居民收入差异缩小;镇化水平越高则农村人口越少,会使得农村居民人均收入上升。但是结果却相反。了解到王子文,董春宇多元回归分析中得出的结论即:第一产业对于提升农村收入的作用明显,只有提高农村人民收入,才能真正缩短城乡居民收入差距,才能解决一系列的社会经济问题。结合王子文,董春宇研究,通过得到的协整方程我们可以看到,国家通过发展工业来提高城镇化水平以缩小城乡居民收入的差异是不科学的,甚至结果是背道而驰的 [10] [11]。
调整系数值是指在VEC模型中变量之间的动态关系偏离协整关系后的调整速度。调整系数为负值表明即使偏离均衡状态,非均衡误差也会得到修正;如果调整系数为正值,则说明非均衡误差得不到修正且误差会更大。如果调整系数值全部为正值,说明得到的协整关系是无效的。如表10所示,调整系数值中只要有一个为负值,那么协整关系就是有效的。

Table 10. Judgment of the rationality of the cointegration relationship
表10. 协整关系合理性判定
3.5. 最优滞后阶数的确定
以上协整方程只是表现了变量之间的长期均衡关系,没有表现各变量在短期内不均衡情况,而这种短期内不均衡是常态。为研究各变量间长期均衡与短期调整之间的关系,可以建立误差修正模型。基于协整理论的误差修正模型可以反映短期波动对于均衡状态的偏离程度,误差修正项前面的系数是调整参数,用于反映变量当期的变化回归到长期均衡关系式消除非均衡误差的速度,获得关系偏离程度的调整信息。根据AIC、SC、HQ等准则最小化原则将模型滞后阶数定为3,向量误差修正模型(VEC),结果如表11:

Table 11. Error correction model coefficient table
表11. 误差修正模型系数表
得到正规化的协整方程(误差修正项)为:
(3)
(4)
从第一个正规化的协整方程中可以发现,对于城乡居民收入差距的短期波动幅度影响最大的是第二产业占总增加值的比重,说明产业结构对于城乡居民收入差异的影响较为显著,政府应该更加注重产业结构优化升级。尤其是促进农业的发展,使得农民收入增加是减小城乡居民收入差距的根本。从第二个正规化的协整方程也可以得到,经济的发展和第二产业的发展对于城镇化水平都有推动作用,因为经济的发展和第二产业的比重增加都意味着工作岗位的增加,就会促使一部分农村人口迁移到城镇工作。使得城镇化水平提高 [12]。
(5)
其中,
,
,
量不变的情况下,LNY在第t期的变化可以消除上期2.3814%的非均衡误差,以使非均衡状态回归均衡状态,且起到反向调整作用。0.50454表示在其他变量不变的情况下,LNY在第t期的变化可以消除上期50.45%的非均衡误差,且为正向调整。0.516551说明滞后1期的城乡居民收入差异存在正向调节影响,0.35899说明滞后1期的城镇化率有正向调节影响。而0.114012和−0.209497都表示城镇化水平对城乡居民收入差异的短期波动影响的调整速度。0.353899说明滞后一期的城镇化率有正向调节影响。
3.6. 脉冲响应分析
脉冲响应的含义是:冲击对某个变量在不同时期的影响效果。由图3可知LNX2,LNX1,LNX3在第一期对LNY的冲击为零,从第二期开始LNX3即城镇化水平对城乡居民收入差异起着正向的作用,且在初期阶段作用并未完全显现出来,到后期越来越显著。随着城镇化水平的提高,会使城乡居民收入差异不断扩大。

Figure 3. Impulse response analysis chart
图3. 脉冲响应分析图
从第二期开始的初期阶段LNX3,第二产业所占比重对城乡居民收入差异呈现负面影响,说明初期第二产业的增长会使城乡居民收入的差异减少,当第二产业发展到一定程度后开始对城乡居民收入差异起到正面影响作用,即第二产业所占比重越大会使城乡居民收入差异越大。LNX1即人均GDP对城乡居民收入差异的影响为负,且越往后期影响越大。从影响的绝对方面来讲,人均GDP对城乡居民收入的差异的脉冲响应是最大的,城乡居民收入差异对经济增长的变化更敏感。
3.7. 方差分解
方差分解的含义为方差分解的含义是:不同时点变量的预测方差可以分解为不冲击解释的部分。图4可以看到,蓝色的线代表城乡居民收入差异的预测方差由自身变动来解释的比例。LNX2,LNX1,LNX3都是越往后期对LNY的预测方差解释的越多,其中LNX1即人均GDP对城乡居民收入差异预测方差的解释比例最高,在最高时达到了30%,说明人均GDP对城乡居民收入差异的影响最大,随后是城镇化水平,然后是第二产业所占增加值比重。
4. 结论
从定量分析来看,在1978~2017年这段时间里我国的城乡居民收入差异与经济增长和城镇化水平,以及第二产业比重有着长期的均衡关系。通过脉冲响应分析和方差分解可以得出,人均GDP即经济的发展越好,城乡居民收入差异越小,且经济的发展对城乡居民收入差异的影响最大。同时也可以了解到第二产业的发展在初期会使得城乡居民收入差异减小,但是当第二产业达到一定比重后对城乡居民收入差异的影响变为正向,所以发展工业虽然会通过提高农民的工资性收入以达到缩小城乡居民收入差异,但这不是根本的办法。从方差分解结果来看第二产业的发展对城乡居民收入差异具有一定的影响。城镇化水平的提高会使得城乡居民收入差异扩大,所以加速城镇化的发展并不能对减小城乡居民收入差异起到好的作用。从方差分解结果来看,城镇化水平对城乡居民收入差异的影响并不明显 [13] [14] [15]。
致谢
感谢在我完成这篇论文的过程中给予我帮助的老师和同学,感谢这篇论文所引用的文献的作者。