1. 引言
重庆作为首批国家数字乡村试点地区,其开展的探索实践,对于破解西部农村数字基础设施建设滞后、农民数字能力较为薄弱等普遍性的难题,有着重要的示范价值。依据“十四五”规划所提出的数字化转型整体驱动战略,重庆市在乡村数字经济建设方面积累了较丰富的经验,为数字经济与农业产业链的深度融合提供了实践探索,有益于构建城乡融合发展的可复制模式,促进农村经济的高质量发展。
在乡村数字经济与居民收入的理论研究方面,许多学者已经了积累较多研究成果。杨丽娟、张艳丽(2024) [1]基于中国农村居民收入数据,借助地理空间计量技术剖析数字乡村建设的传导机制。宋逸香[2]将县域数字乡村指数和家庭金融调查数据相结合,构建了多层模型以及中介效应模型来展开实证检验。赵奕澎[3]详细剖析了数字化经济模式对城乡居民收入差异所产生的双重作用机制。丁可可、马正兵、王涛聚[4]聚焦于乡村数字经济对于农民收入的传导机制以及区域差异特征。纪阳阳、王永静、吴家庆[5]深入分析了乡村数字经济对农民消费在“量”与“质”方面的双重影响机制,并对数字经济作用于农民消费水平以及消费结构的路径进行了系统分析。崔凯、冯献[6]基于数字乡村战略实施需求,系统开发了从理论建构到指标设计的评估框架。张良、徐志明、李成龙[7]以包容性增长为切入点,深入剖析了农业数字技术应用对农户收入的影响路径,并通过构建计量模型发现乡村数字化经济的发展与农民收入增长呈正向关联。徐卓呈[8]运用空间计量方法剖析了数字工具对农村居民收入的影响机制。倪勇[9]基于2017~2020年中国农村居民可支配收入省级面板数据构建计量模型,借助工具变量法进行参数估计,得出数字化经济对农村人均可支配收入有着促进作用,其传导机制有双重特性。Deichmann、Goyal和Mishra [9]就新兴经济体农业现代化进程开展了系统性研究,着重研究了数字工具的应用潜力及实施障碍。衡林、上官阳[10]依据共同富裕理论框架,借助2017~2019年县域面板数据构建多维评估体系,对数字化乡村建设给农户经济收益带来的影响机理开展了实证研究。王瑾[11]依据乡村发展战略背景,通过构建覆盖数字经济渗透度、产业数字化水平等评估体系,采用计量方法剖析数字化经济对农户经济收益的传导途径。
通过文献研究发现,已有相关研究尚存在以下问题:一是较少关注数字经济多维指标间的共线性,无法处理维度冗余问题;二是在研究数字经济与收入之间关系时,较少考虑长期均衡关系;三是已有研究大多运用线性回归模型,其假设数字经济与收入之间存在一种固定不变的关系,与实际问题的契合度不足。在本研究中,分别采用主成分降维技术、向量自回归模型、门限向量自回归模型,能够较好的解决上述问题,提供更加有效的实证研究结果。
2. 研究方法与数据来源
(一) 研究方法
论文采用“数据降维–动态建模–非线性扩展”三阶段递进式研究框架,在数据降维阶段,为解决多维指标共线性与信息冗余问题,采用主成分分析(PCA);用向量自回归(VAR)模型揭示数字经济与农村居民收入增长的时变交互机制;用门限向量自回归(TVAR)模型识别政策效应的结构性突变特征。
1) 主成分分析(PCA)
主成分分析(Principal Component Analysis),属于一种多变量统计方法,该方法借助正交变换,把原始的相关变量转变为线性无关的主成分,以此在保留原始数据主要信息的情况下达成降维目的。
基于主成分分析(PCA)构建多维指标体系,模型设定如下:
(1) 标准化处理:为消除量纲差异,对原始数据
进行标准化
(1)
其中,
和
分别表示第j个变量的均值和标准差,n为样本容量,p为变量个数。
(2) 主成分提取:求解特征方程
,其中Σ为原始数据的协方差矩阵,λ为特征值,v为特征向量,主成分表达式为:
(2)
(3) 综合指数合成:以方差贡献率为权重构建数字经济指数(DEI):
(3)
(4) 主成分选择:选取累计方差贡献率超过特定值的主成分,生成数字经济指数
(4)
其中,
为第i个主成分得分,
为权重,k为选取的主成分个数。
2) 向量自回归(VAR)模型
VAR模型是一个多变量系统,其中包含了多个内生变量。这些变量可以是不同的经济指标,如GDP、通货膨胀率、失业率等。VAR模型的一般形式可以表示为:
(5)
其中:
(1)
是一个
的内生变量向量。
(2)
是
的参数矩阵。
(3)
是误差项向量,通常假设为白噪声序列。
以两个变量
和
滞后1期的VAR模型为例:
(6)
其中:
(1)
所代表的是在时间点t时,其中一个内生变量所呈现出来的值,
所代表的则是在同样的时间点t,另一个内生变量所呈现出来的值。
(2)
是模型参数表示两个变量对彼此滞后一期值的影响程度。
(3)
和
是误差项,通常假设为白噪声序列,表示模型未能解释的随机扰动。
3) 门限向量自回归(TVAR)模型
门限向量自回归模型(TVAR),属于向量自回归模型,即VAR的一种扩展形式,该模型借助引入门限值,以此来区分不同的VAR过程,对多个变量之间的非线性动态关系展开分析。
引入TVAR模型捕捉非线性特征,其中
为第t年的数字经济指数,
(7)
门限值
通过网格搜索法确定。
(二) 数据来源与说明
本文的数据主要源自《重庆市统计年鉴》《重庆市数字农业农村发展“十四五”规划》《重庆电子商务发展报告》《中国数字乡村发展报告》《农业信息化应用调查报告》。此外,还从重庆市财政局与农业农村委员会的公开数据中,提取了农业科技财政支出占比、电商助农补贴金额等政策投入数据。
综上数据源,获取了反映重庆市农村居民收入的指标变量(农村居民人均可支配收入)数据,以及体现重庆乡村数字经济建设的10个指标变量数据:农村宽带接入户数、农产品网络销售额、农村电商企业数量、农业大数据平台使用率、农业机械总动力、科技转化与推广服务、农林水支出总额、农业科技财政支出占比、农村数字金融覆盖率、电商助农补贴金额。现以2011~2013年为例,将相应指标数据列于下表1中。
Table 1. Example of index data (2011~2013)
表1. 指标数据示例(2011~2013年)
变量 |
2011年 |
2012年 |
2013年 |
农村居民人均可支配收入(元) |
6605 |
7526 |
8493 |
农村宽带接入户数(万) |
39 |
52 |
67 |
农产品网络销售额(亿元) |
8 |
10 |
13 |
农村电商企业数量(家) |
1200 |
2300 |
3800 |
农业大数据平台使用率 |
2% |
4% |
6% |
农业机械总动力(万千瓦) |
1141 |
1162 |
1198.88 |
科技转化与推广服务(万元) |
39 |
53 |
60 |
农林水支出总额(万元) |
1989065 |
2563490 |
2819412 |
农业科技财政支出占比 |
0.002% |
0.0021% |
0.0021% |
农村数字金融覆盖率 |
24% |
29% |
34% |
电商助农补贴金额(万元) |
1200 |
2850 |
3700 |
3. 实证研究与结果分析
(一) 主成分分析
对原始数据矩阵Xn × p进行Z-score标准化,其中n = 12,p = 10。用KMO检验和Bartlett球形检验数据是否适合做主成分分析。根据KMO检验值为0.78 (>0.7标准),Bartlett球形检验χ2 = 356.7 (p < 0.001),表明数据适合做主成分分析。主成分分析(PCA)结果显示,前三个主成分的累积方差贡献率已达99.66%,具体如下表2所示。
Table 2. Variance decomposition of principal components
表2. 主成分方差分解表
主成分 |
标准差 |
方差贡献率 |
累计贡献率 |
PC1 |
3.1049 |
96.40% |
96.40% |
PC2 |
0.5193 |
2.70% |
99.10% |
PC3 |
0.2360 |
0.56% |
99.66% |
由以下碎石图(图1)可知,前三个主成分斜率显著陡峭,自第四主成分趋于平缓,PC2与PC3贡献率虽低,但与研究关注的调节效应机制相关,所以选取了三个主成分进行分析。
Figure 1. Scree plot
图1. 碎石图
主成分载荷分析可揭示多维指标的结构特征,由下表3知,第一主成分(PC1)在农村宽带接入户数、农村电商企业数量、农业大数据平台使用率、农业机械总动力、农村数字金融覆盖率、电商助农补贴金额这六项指标里,都有大于0.3的载荷系数。这些指标共同构成了乡村数字生态系统的核心支撑架构,将其命名为“数字生态基础指数”,第二主成分(PC2)在农林水支出总额上的载荷系数为0.791,将其定义为“政府主导型现代化投入”。第三主成分(PC3)的载荷结构中,农产品网络销售额的载荷系数为0.3638,而农业科技财政支出占比呈现负向载荷,系数为−0.6981,科技转化服务也呈现负向载荷,系数为−0.407,它与电商助农补贴等市场激励政策形成反向作用机制,电商助农补贴系数为0.2008。这揭示出科技创新投入与市场调节政策在资源配置中的动态关系,采用“科技政策调节效应”作为该主成分的命名。
Table 3. Load matrix
表3. 载荷矩阵
变量名 |
Comp.1 |
Comp.2 |
Comp.3 |
农村宽带接入户数 |
0.3179 |
−0.1961 |
−0.1903 |
农产品网络销售额 |
0.3171 |
−0.2669 |
0.3638 |
农村电商企业数量 |
0.3173 |
−0.3090 |
0.1751 |
农业大数据平台使用率 |
0.3208 |
−0.1473 |
0.1514 |
农业机械总动力 |
0.3186 |
0.2408 |
0.0319 |
科技转化与推广服务 |
0.3202 |
−0.0011 |
−0.4070 |
农林水支出总额 |
0.2926 |
0.7913 |
0.2533 |
农业科技财政支出占比 |
0.3174 |
0.0595 |
−0.6981 |
农村数字金融覆盖率 |
0.3206 |
0.1449 |
0.1390 |
电商助农补贴金额 |
0.3187 |
−0.2540 |
0.2008 |
将三个主成分按照方差贡献率的大小分配权重,得到综合数字经济指数(DEI)。
(8)
具体的综合数字经济指数值如表4所示:
Table 4. Values of the Digital Economy Index (DEI)
表4. 综合数字经济指数(DEI)的值
年份 |
综合数字经济指数 |
2011 |
−4.1056 |
2012 |
−3.5972 |
2013 |
−3.1948 |
2014 |
−2.7977 |
2015 |
−1.6399 |
2016 |
−0.8518 |
2017 |
0.0878 |
2018 |
1.0965 |
2019 |
2.0215 |
2020 |
3.1098 |
2021 |
4.3226 |
2022 |
5.5488 |
DEI为负值表示该年在数字经济综合水平上低于样本年份平均水平,意味着在数字经济的多个维度上,该年的数字经济发展较慢,比如2011年和2012年,DEI分别为−4.1056和−3.5972,表明这两年的重庆市农村数字经济整体发展水平较低。究其原因,数字基础设施建设、电商活动等可能还处于起步阶段,尚未达到平均水平。正值表示该年在数字经济综合水平上高于样本年份平均水平,意味着该年的数字经济发展较快。DEI值逐渐增大,到了2017年,DEI变为正值,表明从2017年开始,重庆市农村的数字经济整体发展水平逐渐超过样本年份平均水平,数字基础设施建设、电商活动等取得了显著进展。
(二) 向量自回归(VAR)模型实证分析
依据数字经济发展指数以及年度农村居民人均可支配收入这两个变量,在构建VAR模型时,非平稳性数据或许会引发伪回归问题,也就是在回归分析里出现虚假的较大性结果,这会致使模型估计呈现出不稳定性以及不可靠性,借助平稳性检验,可以保证时间序列数据的基本特性处于稳定状态,如此一来所建立的VAR模型更有可解释性。为此,首先对DEI与农村居民人均可支配收入(Income)两个序列进行平稳性检验,检验结果如下表5所示。
Table 5. ADF test results
表5. ADF检验结果
变量 |
ADF值 |
p值 |
检验结果 |
DEI |
0.4617 |
0.99 |
非平稳 |
Income |
0.9745 |
0.99 |
非平稳 |
检验结果显示两个序列都是不平稳的,由于样本量较小,先进行一阶差分,再对一阶差分后的序列进行平稳性检验,检验结果如表6所示。
Table 6. ADF test results
表6. ADF检验结果
变量 |
ADF值 |
p值 |
检验结果 |
diff_DEI |
−5.3663 |
0.01 |
平稳 |
diff_Income |
4.1781 |
0.01 |
平稳 |
在建VAR模型时,选择合适的滞后阶数非常关键。通过选择适当的滞后阶数,可以最大化地利用时间序列数据中的信息,提高模型的解释能力和预测精度。基于AIC准则选择VAR模型最优的滞后阶数为1。
根据输出结果,建立的综合数字经济指数差分模型为:
(9)
其中,
系数的p值为0.124 > 0.05,则系数不显著,
系数的p值为0.974 > 0.05,则系数不显著。模型的R2 = 0.3047,调整R2 = 0.1061,说明模型对综合数据经济指数的解释能力较弱。
建立的农村居民人均可支配收入差分模型为:
(10)
其中,
系数的p值为0.4985 > 0.05,则系数不显著,
系数的p值为0.0379 < 0.05,则系数显著。模型的R2 = 0.4977,调整R2 = 0.3542,这显示出模型对综合数字经济指数有一定程度的解释能力,处于中等水平。
虽然VAR模型指出数字经济与重庆农村居民收入之间的短期动态关系,然而其线性假设可能会掩盖不同发展阶段作用机制方面的差异,为了捕捉数字经济对重庆农村居民收入的非线性影响,下面引入门限自回归模型,把门限变量设定为DEI自身,以此来检验其临界值对系统结构的划分作用。
(三) 门限向量自回归(TVAR)模型
利用重庆市2011年至2022年农村数字经济与农村居民收入数据,借助门限向量自回归(TVAR)模型来剖析数字经济指数(DEI)对农村居民可支配收入的非线性影响,同时检验数字经济指数对农村居民可支配收入的影响是否存在门限效应。以重庆农村居民人均可支配收入(income)为因变量,核心解释变量为DEI,同时,DEI自身作为门限变量,检验其临界值对模型结构的划分作用。
运用TVAR函数估计两区制的模型,这两区制分别是低区制和高区制,将滞后阶数设定为1,凭借网格搜索法确定最优门限值为0.3032。当DEI < 0.3032时属于低区制,说明重庆市乡村经济受传统因素主导;当DEI ≥ 0.3032时属于高区制,说明数字经济效应显现出来了。
低区制农村居民收入方程为:
(11)
截距项的系数0.3364显著(p < 0.05),表明低区制下收入存在基础增长趋势,农村居民收入滞后项的系数0.8610显著(p < 0.05),表明收入具有正向自相关,即前期收入增长会推动当期收入增长。DEI滞后项的系数0.0588不显著(p > 0.05),说明在低阈值区制下,数字经济指数对农村居民收入的影响较弱。
低区制DEI方程为:
(12)
截距项的系数−0.1793不显著(p > 0.05),表明低区制下数字经济指数无显著基础增长,农村居民收入滞后项的系数4.8259高度显著(p < 0.01),表明农村居民收入增长对数字经济指数有强正向驱动。
高区制农村居民收入方程为:
(13)
截距项的系数0.7524高度显著(p < 0.01),表明在高区制下农村居民收入基础增长更高,农村居民收入滞后项的系数−0.8518显著(p < 0.05),表明农村居民收入呈现负向自相关,可能反映市场调节或政策干预导致前期高收入抑制当期增长。DEI滞后项的系数0.5754高度显著(p < 0.01),说明在高阈值区制下,数字经济对农村居民收入有显著促进作用。
高区制DEI方程为:
(14)
截距项的系数1.1931高度显著(p < 0.01),表明数字经济指数基础增长加快, DEI滞后项的系数0.9590显著(p < 0.05),表明数字经济指数在高区制下具有强持续性。
Table 7. Comparison of parameters between zones
表7. 区制间参数对比
z |
低区制(DEI < 0.3032) |
高区制(DEI ≥ 0.3032) |
收入方程 |
|
|
截距项 |
0.3364** |
0.7524** |
收入滞后项 |
0.8610* |
−0.8518* |
DEI滞后项 |
0.0588 |
0.5754** |
DEI方程 |
|
|
截距项 |
−0.1793 |
1.1931** |
收入滞后项 |
4.8259** |
0.0333 |
DEI滞后项 |
−0.3322 |
0.9590* |
注:“***”表示p < 0.001,“**”表示p < 0.01,“*”表示p < 0.05。
在这些数据中,模型的AIC为−128.33,BIC为−125.76,整体拟合优度呈现出较高的水平,SSR的值是0.00685,残差平方和极小,这显示出模型对于数据有一定的解释能力,当DEI处于低区制时,农村经济主要依靠传统增长模式,数字经济处于辅助的位置,收入增长依靠自身的惯性;当DEI处于高区制时,数字经济对农村居民收入的影响明显提高,由表7可知,系数为0.5754 (低区制下的系数为0.0588),体现出非线性特征,农村居民收入增长模式从惯性驱动转变为政策或者技术驱动。下面将线性VAR模型与非线性TVAR模型的拟合效果以及经济学解释力进行对比。
VAR模型:虽通过平稳性检验,但解释力有限,且数字经济对农村居民收入的短期影响不显著,暗示线性框架的局限性;
TVAR模型:借助门限效应识别出了结构突变点,该突变点对应的DEI值为0.3032,这一识别使得模型的解释力得到了提升,具体表现为AIC值的变化,由表8可知,TVAR模型的AIC为−128.33,而VAR模型的AIC为−48.22。另外,参数较大差异性也指出数字经济对农村居民收入的影响存在区制依赖性。
Table 8. Model performance comparison
表8. 模型性能对比
指标 |
VAR模型 |
TVAR模型(两区制) |
AIC |
−48.2200 |
−128.3300 |
BIC |
−46.4100 |
−125.7600 |
调整R2 (收入) |
0.1061 |
0.3542 (低区制)
0.4977 (高区制) |
参数显著性 |
仅收入滞后项显著 |
高区制DEI滞后项显著 |
经济学解释力 |
线性关系受限 |
非线性机制明确 |
TVAR模型的AIC比VAR模型低,TVAR模型借助区制划分能更全面地捕捉数据变化,综合考量模型性能与政策启示,TVAR模型因有捕捉非线性机制的能力以及拥有更高的拟合优度,被选作本研究的核心分析框架,其门限值的识别,为农村经济从传统模式迈向数字驱动的转型提供了关键的阈值参考。
4. 结论
通过对重庆市2011~2022年农村数字经济与居民收入数据展开分析,结果显示,依靠主成分分析提取出的三个维度,其累计方差贡献率达到了99.66%,其中数字生态基础指数以96.40%的贡献率在农村数字经济发展格局中占据主导地位。政府主导型现代化投入(PC2)凭借农林水支出总额拥有0.7913的正向载荷。科技政策调节效应(PC3)呈现出农业科技财政支出占比为−0.698的负向载荷,以及科技转化服务为−0.4070的负向载荷,和电商助农补贴有着0.2008的正向载荷形成了政策工具间的对冲效应,科技投入的结构性失衡有可能抑制数字技术对收入的边际贡献。通过对提取的三个主成分加权,生成了重庆农村数字经济指数。
向量自回归(VAR)模型分析显示,数字经济指数(DEI)与农村居民可支配收入(income)的短期波动呈现出随机性特征,滞后一阶的DEI系数不大,p > 0.05,模型解释力比较弱,R2 = 0.30,这证实数字经济短期影响受到政策试点周期与市场不确定性的干扰,而收入滞后项较大,p = 0.0379,则揭示出传统增长路径存在惯性依赖。
门限向量自回归(TVAR)模型检测到0.3032的临界阈值,当数字经济指数低于这个阈值的时候,农村居民收入增长主要依靠自身惯性,系数是0.8610,而且数字经济影响微弱,系数是0.0588,而突破阈值之后数字经济成为核心驱动力,系数是0.5754,并且触发增长模式转型,滞后收入项系数是−0.8518,这印证数字技术红利的释放遵循边际收益递增规律,其网络效应与知识溢出需要达到临界规模才能显现。研究结果说明,农村经济正经历从资源密集型向技术驱动型的渐进式转型,不过转型效率受到政策协同度与技术渗透率的双重约束。