数据要素驱动乡村振兴的机制与测度——基于青海的实证
Mechanism and Measurement of Rural Revitalization Driven by Data Factors—An Empirical Study Based on Qinghai Province
摘要: 本研究旨在探讨数据要素驱动西部民族地区(以青海省为例)乡村振兴的机制与测度。文章首先基于“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”五个维度构建了包含20项指标的乡村振兴评价体系。研究采用2004年至2023年的青海省时间序列数据,运用层次分析法(AHP)和熵权法相结合的方式测度乡村振兴水平。随后,通过主成分分析法(PCA)合成数字要素指标,并建立多元线性回归模型(逐步回归),实证分析数据要素及其他控制变量对乡村振兴的影响。研究结果显示,数据要素、人均GDP增长率、财政农林支出等对乡村振兴有显著正向影响,而城镇登记失业率则呈现负向影响。最后,文章据此提出了加强数字基础设施建设、优化财政支出结构等政策建议。
Abstract: This study aims to explore the mechanism and measurement of rural revitalization driven by data factors in western ethnic minority regions (taking Qinghai Province as an example). Firstly, the paper constructs a rural revitalization evaluation system including 20 indicators based on the five dimensions of “prosperous industry, livable ecology, civilized rural customs, effective governance, and affluent life”. Using time series data of Qinghai Province from 2004 to 2023, the study measures the level of rural revitalization by combining the Analytic Hierarchy Process (AHP) and Entropy Weight Method (EWM). Subsequently, the Principal Component Analysis (PCA) is used to synthesize digital factor indicators, and a multiple linear regression model (stepwise regression) is established. Combined with heterogeneity analysis, threshold effect analysis and endogeneity treatment, the impact of data factors and other control variables on rural revitalization is empirically tested. The results show that data factors, per capita GDP growth rate, and fiscal expenditure on agriculture and forestry have significant positive impacts on rural revitalization, while the urban registered unemployment rate has a negative impact. Finally, the paper puts forward policy suggestions such as strengthening the construction of digital infrastructure and optimizing the structure of fiscal expenditure.
文章引用:刘泽宇. 数据要素驱动乡村振兴的机制与测度——基于青海的实证[J]. 统计学与应用, 2026, 15(2): 139-154. https://doi.org/10.12677/sa.2026.152042

1. 研究背景与意义

1.1. 研究背景

在全球经济加速迈入数字化转型的关键阶段,数据作为核心生产要素,正深刻重塑各国的发展格局。党的十九届四中全会首次将数据纳入生产要素序列,二十大报告进一步提出“构建数据要素市场体系”,标志着数据要素已成为打通城乡循环、支撑共同富裕的战略性资源。

在共同富裕目标推进进程中,乡村振兴战略作为中国式现代化的关键构成部分,彰显出独特制度优势与实践特征。中国依托“政策供给–市场驱动–技术赋能”的三维协同机制,开辟出乡村振兴的创新发展道路,实施“数商兴农”工程与数字乡村发展战略,成效显著,全国建成60多万个村级电商服务站点,农产品网络零售额超5.3万亿元,智慧农业技术覆盖率达21.8%,生成“新农人 + 合作社 + 数字化平台”的新型经营体系。特别是通过东西部协作、“万企兴万村”等机制,2022年吸引社会资本投入超1.5万亿元,培育1982个县域特色产业集群,打造出贵州“大数据 + 乡村振兴”等创新模式,有效破解传统乡村治理难题,实现98%的行政村数字化治理覆盖,为全球发展中国家提供了城乡融合发展的中国方案。

国家战略在西部高原地区落地时,面临独特的区域约束:青海省60%以上国土划入生态保护红线,传统农牧业扩张路径被严格限制;同时,全省农村数字基础设施覆盖率仅达全国平均水平的65% (《青海省统计年鉴2023》),数据要素赋能不足成为乡村振兴的关键瓶颈。如何在高寒缺氧、生态脆弱与民族多元交织的情境下,把数据要素转化为“不增加生态负荷”的新动能,既关乎国家战略在青海的兑现,也直接检验“数字乡村”模板能否在西部复制。《数字乡村发展战略纲要》与《青海省“十四五”乡村振兴规划》均把“生态优先 + 数字驱动”写入总体目标,但学术界对数据要素能否以及怎样破解“生态保护与经济发展”双重约束仍缺乏因果证据。基于此,本文以青海为样本,识别数据要素对乡村振兴的边际贡献与作用边界,为西部生态功能区提供一条“数据换生态空间”的可行路径。

1.2. 研究意义

本研究通过理论体系建构、实践机制创新与战略路径探索形成多维度学术贡献。首先,本文通过综合数据要素市场理论与乡村振兴发展理论,突破传统城乡二元分析框架,构建“数据要素–数字经济–乡村振兴”链式机制,补充西部生态脆弱区数字要素赋能的理论空白;优化乡村振兴测度体系,解决现有指标忽视“生态约束”与“民族地区公共服务”的缺陷。其次,本文研究构建的乡村振兴水平测度体系,通过层次分析法与熵权法融合模型,形成可量化的决策工具。为青海藏区提供“数字基建 + 政策协同 + 生态适配”的乡村振兴路径,为国家“数商兴农”工程在西部民族地区的落地提供实证参考。

构建适配青海的乡村振兴评价指标体系:立足青海省地理经济特征、生态约束与民族地区发展需求,遵循科学性、可量化、数据易获取性原则,整合五大维度,筛选20项核心指标,形成涵盖农业生产能力、生态治理等多层面的综合评价体系。测度2004~2023年青海乡村振兴水平:基于《青海省统计年鉴》等多源数据,通过层次分析法(AHP)与熵权法融合模型确定指标综合权重,消除主观赋权与客观数据的片面性,计算20年间青海省乡村振兴水平综合指数。

实证检验数据要素的影响机制与调节效应:以数字要素为核心解释变量,选取人均GDP增长率、公共预算支出占比等6项约束变量,构建多元线性回归模型,通过异质性分析揭示区域差异,借助门槛效应检验明确要素作用的临界条件,验证数据要素对乡村振兴的直接影响;通过主成分分析处理数字要素多指标数据,利用逐步回归法解决多重共线性问题,明确各变量的边际效应与重要性排序。

提出差异化政策建议:结合实证研究结论,针对青海省数字基础设施薄弱、产业融合不足等现实问题,从数据要素市场化配置、数字技术赋能农业、财政支出结构优化、就业激励等维度,设计兼具针对性与可操作性的乡村振兴推进方案。

2. 文献综述

2.1. 数据要素市场研究

数字经济纵深发展推动数据要素上升为战略性核心资源。李标等基于马克思主义政治经济学,揭示了数据要素通过生产力提升、流通优化、消费升级和分配结构调整的四维价值创造机制[1];王珏和许士道主张构建政府主导的收益调节机制以平衡劳动价值论基础下的利益分配[2];何玉长团队则强调标准化体系、定价机制及交易平台的制度支撑对市场化进程的关键作用[3]。在市场化配置机制方面,张雅俊构建的双层动态定价模型通过边际生产函数与场景参数修正实现方法论突破[4],王杰森提出的均衡框架则为化解数据资本化利益失衡提供了链式效应分析工具[5]

治理体系与产业应用研究呈现政策创新与实践突破并行的特征。王芳系统揭示了数据要素市场化的制度瓶颈[6],国家数据局监测显示我国已构建以《数据安全法》为核心的法律框架,但工业互联网标准建设仍需完善[7]。毛太田团队通过PMC指数模型证实省级政策存在顶层设计系统性缺陷,建议建立动态调整机制[8]。产业实证方面,张雪等针对乡村振兴战略的系统研究表明,辽宁省基层治理效能与乡风文明建设存在显著区域差异,其构建的四级指标体系显示战略实施综合达成率为57%,其中治理有效维度达成率达84%,为数据赋能基层治理提供了重要实证依据[9],陈丽莉团队的微观研究则证实数据要素通过信息优化机制显著提升企业创新效能,且在数字经济发达区域具有更强边际效应[10]。这些研究成果为构建现代化数据要素市场体系提供了理论支撑与实践启示。

2.2. 乡村振兴研究

2.2.1. 国外乡村振兴的认识与测度

国外学术界对乡村振兴的探讨可追溯至19世纪末的田园城市理论及20世纪初的乡村复兴运动。在乡村振兴的内涵认知方面,国外学者普遍强调其多维性与综合性。Cloke提出,乡村振兴不仅需解决经济滞后问题,更需重构乡村社会网络、文化传承与生态功能[11]。Woods进一步指出,乡村衰退的根源在于制度性排斥与资源分配失衡,需通过政策创新、社区参与及技术赋能实现内生性发展[12]。此外,欧盟将乡村振兴定义为“基于地方资源禀赋,整合经济、社会与环境目标,提升乡村居民福祉的长期过程”。

关于乡村振兴的测度方法,国际组织与学者提出了多元化的指标体系。联合国粮农组织构建了涵盖经济活力、社会包容、生态质量与治理效能四维度的综合评估框架。Terluin基于欧洲乡村发展实践,采用主成分分析法量化乡村竞争力,强调基础设施、人力资本与产业多样化的核心作用[13]。世界银行则通过“乡村韧性指数”,结合熵权法与层次分析法,评估不同区域应对外部冲击的能力。综上,国外研究从理论构建到实践测度均形成较完整体系,但针对发展中国家特殊情境的适应性分析仍需深化。

2.2.2. 国内乡村振兴的认识与测度

我国学术界对乡村振兴的系统性研究始于党的十九大提出“乡村振兴战略”后,其内涵在结合国际乡村发展理论与中国现实需求的基础上不断深化。部分学者将乡村振兴定义为通过产业升级、生态保护、文化传承等手段全面提升乡村发展水平的过程,涵盖经济、社会、文化等多维目标[14]。另有学者聚焦城乡融合发展背景,强调乡村振兴需打破城乡二元结构,通过要素流动与制度创新实现乡村可持续发展[15]。随着研究的深入,“新乡村振兴”概念逐渐兴起,其核心在于以数字化和绿色化为驱动,重点解决乡村人口流失、公共服务短缺、传统产业衰退等问题,目标群体包括返乡创业人员、新型职业农民、生态保护受益者等[16]。张孝德进一步从“城乡协同”视角,论证了乡村振兴与新型城镇化的互补关系,并提出通过数字技术赋能乡村治理以缓解发展不平衡问题[17]。魏后凯指出推进乡村振兴,关键在于重塑城乡关系,推进城乡融合发展。而城乡融合发展,必须把县域作为城乡融合发展的重要切入点,坚持新型城镇化和乡村振兴双轮驱动[18]。王晓毅则认为乡村缺乏资本与人才内生动力,易受外部市场波动冲击,需建立制度保障和现代化的治理机制[19]

近年来,学界围绕乡村振兴水平的量化评估展开了广泛探索,基于多维视角构建差异化测度框架。张挺等参考联合国可持续发展目标(SDGs),从产业兴旺、生态宜居、乡风文明、治理有效、生活富裕五个维度建立评价体系,并采用层次分析法(AHP)确定指标权重,发现中西部地区乡村基础设施与公共服务短板显著[20]。刘守英阐述了乡村振兴的两个难点,指出中国农业的问题,是劳动力大量转移,但城市化模式没有使整个乡村要素进行重组的情况下,单一要素突进带来了整个要素组合的困难和成本的上升[21]。这些研究为建立“数据驱动型”乡村振兴政策体系提供了理论支撑。

2.3. 文献述评

综合上述研究,现有成果为理解数据要素与乡村振兴的关系提供了重要支撑,但仍存在三重关键缺口,构成了本研究的核心切入点:

第一,针对现有指标体系忽视西部生态与民族特征的缺陷,本研究构建包含20项指标的专项评价体系,纳入化肥施用量、移动电话普及率等特色指标,实现对青海乡村振兴水平的精准量化。第二,以青海省为典型样本,系统揭示数据要素在“生态保护优先”背景下的赋能机制,弥补西部欠发达地区实证研究缺口。第三,创新整合层次分析法(AHP)与熵权法确定指标权重,结合多元线性回归深化异质性、门槛效应分析进行实证检验,提升研究结论的科学性与稳健性。

综上,本研究通过构建适配青海的测度体系、聚焦区域特殊情境、融合多元研究方法,系统探究数据要素对西部乡村振兴的影响,既填补了现有研究的理论空白,又为西部欠发达地区提供可复制的实践范式。

3. 基础理论研究

3.1. 乡村振兴

乡村振兴战略作为新时代“三农”工作的核心着力点,其理论根基源于对农业农村现代化规律的深刻洞察。从历史演进视角审视,农业农村实现了从传统向现代的转型,这一过程以生产力提升、生产关系变革及城乡关系调整为关键驱动力。在此背景下,乡村振兴战略应运而生,为解决城乡发展失衡、农村发展滞后等问题提供了系统性方案。

3.2. 数据要素

在数字经济迅猛发展的当下,数据要素已成为推动政府数据开放共享的核心驱动力。具体而言,数据要素通过优化数据流通环境、提升数据供给质量等举措,有效推动了数据的高效流通与价值挖掘。政府通过构建完善的数据共享平台,促进了数据资源的互联互通,打破了传统数据管理中的信息壁垒。同时,数据要素的应用还助力政府实现了数据资源的优化配置,通过深度挖掘与分析数据,政府能够更精准地把握社会需求,优化公共服务供给,提升决策的科学性与精准度。此外,数据要素的开放共享离不开政策支持与技术创新的双重保障。政府通过制定相关政策法规,为数据要素的开放共享提供了坚实的制度基础。展望未来,随着数据要素市场的日益成熟,数据要素将在政府数据开放共享中发挥更加重要的作用,为数字政府建设和数字经济的蓬勃发展注入强劲动力。

3.3. 数据要素、数字经济与乡村振兴的关系

在数字经济迅猛发展的时代背景下,数据要素与乡村振兴之间的联系愈发紧密,数字经济已然成为推动乡村振兴的关键力量。数据要素作为数字经济的核心资源,通过优化资源配置、提升生产效率、促进产业融合等途径,为乡村振兴注入了新动力。首先,数据要素与数字经济的深度融合为乡村振兴开辟了新路径。借助精准农业、智慧农业等模式,数据要素助力农民做出更科学的种植决策,提高农作物产量与质量。其次,数字经济通过打破资源壁垒、整合生产要素、提升生产效率等方式,成为乡村振兴的新引擎。最后,数字经济还通过改善城乡收入分配、推动城乡融合发展和激励农村科技创新,促进乡村振兴。因此,数据要素与数字经济在推动乡村振兴中发挥着重要作用。未来,随着数据要素市场的不断完善,数据要素与数字经济将在乡村振兴中发挥更大作用,为实现乡村全面振兴提供有力支撑。

3.4. 研究方法

3.4.1. 层次分析法

层次分析法(Analytic Hierarchy Process,简称AHP)是将定性分析与定量分析相结合的多目标分析方法。这个方法通过建立层次结构模型,将复杂问题细化为多个层次与要素,并通过成对比较法评估各要素间的相对重要性,最终综合得出决策方案的优先排序。通常包括以下几个步骤:

① 建立层次结构模型:明确决策目标,将问题分解为多个层次,包括目标层、准则层和方案层。目标层是决策的最终目标,准则层是实现目标所需考虑的各个准则或因素,方案层则是具体的决策方案。

② 构建判断矩阵:对各层级因素进行成对比较,依据其相对重要性赋予数值,构建判断矩阵。

③ 计算权重:计算判断矩阵的最大特征值和特征向量,生成各因素的相对权重。

④ 一致性检验:对判断矩阵进行一致性检验,以确保判断矩阵的一致性。如果一致性比率(CR)小于或等于0.1,说明通过一致性检验结果,认为该判断矩阵是合理的;反之,若一致性检验结果不佳,则必须对判断矩阵进行调整。

3.4.2. 熵权法

熵权法(Entropy Weighting Method, EWM)是基于信息熵理论的客观赋权方法,广泛应用于多指标决策分析中,用于确定各指标的权重。其核心思想是通过计算各指标的熵值来反映指标的信息量和重要性,从而确定其在综合评价中的权重。在熵权法中,熵值越小,指标数据差异越显著,信息有效性越高,应赋予较大权重。具体计算步骤如下所示:

① 无量纲化处理:鉴于各指标的量纲和数量级存在差异,原始数据需先标准化,以消除量纲差异的影响。

  • 对于正向指标(数值越大越好),标准化公式: r ij = x ij min( x i ) max( x j )min( x j )

  • 对于负向指标(数值越小越好),标准化公式: r ij = min( x i ) x ij max( x j )min( x j )

其中 x ij 是第i个评价对象的第j个指标的原始值。

② 归一化处理 p ij

p ij = r ij i=1 m r ij ,其中 m 是评价对象的数量。

③ 计算信息熵 H j

H j =k i=1 m p ij ln( p ij )

其中,k是归一化常数,通常取 k= 1 ln( m )

④ 计算差异系数 d j d j =1 H j

⑤ 计算权重 ω j ω j = d j j=1 n d j ,其中,n是指标的数量。

3.4.3. 计量模型设定

构建计量模型,基本形式如下:

Q=α+βdige+γX+ϵ

其中,Q是乡村振兴综合指数,为被解释变量。dige为核心自变量,表示数字要素的发展水平。X为控制变量,共有6个,可以提高对模型的解释程度。α为常数,β为核心自变量的系数,γ为控制变量的系数,ϵ为误差项。

3.4.4. 异质性分析方法

(1) 按时间阶段分组:以2017年“乡村振兴战略”正式提出为节点,划分为两个阶段,反映政策实施前后数据要素的赋能差异:

第一阶段(2004~2016年):乡村振兴政策未系统实施,数字经济处于起步期(青海农村数字基础设施覆盖率 < 50%),数据要素赋能以基础通信服务为主;

第二阶段(2017~2023年):乡村振兴与数字乡村政策叠加推进(如《数字乡村发展战略纲要》出台),数字经济加速渗透(覆盖率 > 50%),数据要素与农业、文旅等产业深度融合。

(2) 按数字要素发展水平分组:以数字要素(dige) 2004~2023年的中位数(经计算中位数 = 0.023)为临界值,划分为两组,反映要素积累程度对赋能效应的影响:

低水平组(dige ≤ 0.023):数字要素发展初期,基础设施薄弱、技术应用单一,赋能效应以“基础连接”为主;高水平组(dige > 0.023):数字要素发展成熟期,数据流通效率提升、产业融合深化,赋能效应以“价值创造”为主。

(3) 检验逻辑与操作步骤

① 分组回归:对上述2个维度的4个分组样本,分别执行逐步回归,模型与基础计量模型一致,核心对比不同分组中数字要素(dige)的系数大小与显著性。

② 结构突变检验:采用Chow检验验证异质性显著性,原假设:“两组样本的回归系数无显著差异”(即无结构突变,异质性不显著)。计算Chow统计量:

Chow= ( RSS RSS 1 RSS 2 )/k ( RSS 1 + RSS 2 )/ ( n 1 + n 2 2k )

其中, RSS 全样本回归的残差平方和, RSS 1 RSS 2 为两组分组回归的残差平方和, k=5 (解释变量个数,含常数项), n 1 n 2 为两组样本量。若Chow统计量对应的 p<0.05 ,拒绝原假设,表明数据要素对乡村振兴的影响存在显著异质性。

3.4.5. 门槛效应分析方法

(1) 门槛变量与模型设定

门槛变量选择:核心解释变量“数字要素(dige)”,理由如下:数据要素具有“累积效应”,其对乡村振兴的赋能需依托一定的基础设施覆盖率、技术应用深度,符合门槛变量“临界值效应”的核心特征;且dige为现有数据可直接获取的核心指标,无需新增数据。

遵循“从简到繁”的原则,优先设定单门槛模型,单门槛模型具体形式如下:

Q=α+ β 1 digeI( digeλ )+ β 2 digeI( dige>λ )+ γ 1 GDP + γ 2 gdpe+ γ 3 une+ γ 4 agfe+ε

其中, λ 为待估计的门槛值, I 为指示函数, β 1 β 2 分别为门槛前后数字要素的影响系数,其他变量定义与基础计量模型一致。若存在双门槛,则在模型中新增 β 3 digeI( dige> λ 2 ) 项( λ 2 为第二门槛值)。

(2) 检验与估计流程

门槛效应检验:采用Bootstrap抽样法(重复抽样300次)适配20个观测值的小规模数据,通过最小二乘法遍历所有可能的门槛值 λ ,计算对应残差平方和,选取残差平方和最小的 λ 作为初始门槛值;构建F统计量检验“是否存在门槛效应”,原假设:“不存在门槛效应”。若Bootstrap抽样得到的 p<0.05 ,拒绝原假设,判定存在显著单门槛效应;若 p>0.1 ,则无门槛效应。

门槛值有效性验证:通过似然比检验验证门槛值的一致性,构建LR统计量:

LR( λ )=2[ L( λ )L( λ ^ ) ]

其中, L( λ ) 为对应门槛值 λ 的对数似然值, λ ^ 为最优门槛值。当LR < 7.35时, λ ^ 落在95%置信区间内,门槛值估计有效,可用于划分样本区间。

4. 乡村振兴水平测度

4.1. 数据说明

本文运用20个具体指标测算了青海省2004年~2023年乡村振兴水平综合指数。指标体系中的所有原始数据主要来源于《中国农村统计年鉴》《中国统计年鉴》《青海省统计年鉴》《中国教育统计年鉴》《中国城乡统计年鉴》《中国财政年鉴》,以及国家数据平台。因为不同指标可能具有不同的量纲,为确保不同指标间可比性,必须对原始数据实施标准化处理,并据此计算出20项指标的具体数值,具体见表1

Table 1. Rural revitalization evaluation indicator system

1. 乡村振兴评价指标体系

一级指标

二级指标

三级指标

四级指标

乡村振兴

产业兴旺

农业生产能力基础

人均农业机械总动力(千瓦)

粮食总产量(万吨)

农业生产效率

人均农业总产值(万/人)

产业融合水平

农业重大科技成果(项)

生态宜居

农业绿色发展

化肥施用量(吨)

农村人居环境治理

农村卫生厕所普及率(%)

农民受教育程度

农村居民教育文化娱乐支出占比(%)

学龄儿童入学率(%)

乡村公共文化建设

设有邮政局、所的乡(镇)比重(%)

传统文化传播

移动电话普及率(%)

治理有效

乡村治理建设

村民委员会(个)

发展均衡程度

贫困发生率(%)

生活富裕

农民收入水平

农村居民恩格尔系数(%)

农村人均可支配收入(元)

农村人均可支配收入实际增长率(%)

城乡居民收入比(%)

农民生活条件

农村每百户汽车拥有量(辆)

农村每百户彩色电视拥有量(台)

基础设施建设水平

乡村办水电站(个)

基础公共服务保障水平

农村投递线路(公里)

4.2. 乡村振兴评价指标体系构建

在深入探讨乡村振兴战略的核心要义时,本文严格遵循科学性、实践可行性、量化可测性以及数据易获取性等基本原则,系统性地构建了一套针对青海省乡村振兴进程的评价指标体系。该体系设计了20项具体指标,旨在全面、客观地反映青海省乡村振兴的实际情况与发展成效。

4.3. 评价方法与步骤

4.3.1. 使用AHP法计算权重

依照上面的评价指标体系,首先构建了四级层次模型。针对每一个层次,采用1~3标度法评估指标体系中各指标的重要性。通过专家独立评分,构建了一个 n×n 的两两比较重要性判断矩阵 A= ( a ij ) n×n ,其中 a ij 表示指标i相对于指标j的重要性,且满足一定条件:

a ii =1 a ij = 1 a ji a ij >0

接着基于专家给出的判断矩阵,计算出矩阵的最大特征值、特征向量,计算判断矩阵的最大特征值 λ max 及其对应的特征向量 W max ,归一化处理后得到准则层权重W

 CI= λ max n n1 CR= CI RI (1)

根据公式(1)计算一致性指标CI,并根据随机一致性指标RI确定CR值。若CR值小于或等于0.1,则判断矩阵是适合的;否则,需重新调整判断矩阵。通过最终计算 CR=0.093314<0.1 ,表明通过一致性检验,说明专家对指标的对比判断满足一致性。具体AHP法算出的权重见表2

4.3.2. 使用熵权法计算权重

由于本文所用数据的量纲不同,首先需要对原始数据进行标准化处理,得到矩阵 X= ( x ij ) n×n ,接着计算了每项指标的熵值 H j ,然后根据每个指标的熵值,计算出差异系数 d j 。最后,某个指标的权重 ω j 就等于该指标的差异系数比所有指标的差异系数。具体熵权法算出的权重见表2

Table 2. Specific weights of each indicator

2. 各指标具体权重

一级指标

二级指标

APH法

熵权法

综合权重

三级指标

APH法

熵权法

综合权重

四级指标

APH法

熵权法

综合权重

乡村振兴(权重100)

产业兴旺

31.33

52.55

41.94

农业生产能力基础

17.28

35.26

26.27

人均农业机械总动力(千瓦)

8.97

24.07

16.52

粮食总产量(万吨)

8.30

11.19

9.75

农业生产效率

6.90

9.34

8.12

人均农业总产值(/)

6.90

9.34

8.12

产业融合水平

7.14

7.95

7.55

农业重大科技成果()

7.14

7.95

7.55

生态宜居

13.71

11.41

12.56

农业绿色发展

6.94

6.00

6.47

化肥施用量()

6.94

6.00

6.47

农村人居环境治理

6.77

5.40

6.09

农村卫生厕所普及率(%)

6.77

5.40

6.09

风文明

18.56

15.36

16.96

农民受教育程度

9.74

8.46

9.10

农村居民教育文化娱乐支出占比(%)

4.66

4.22

4.44

学龄儿童入学率(%)

5.08

4.24

4.66

乡村公共文化建设

4.14

3.69

3.92

设有邮政局、所的乡()比重(%)

4.14

3.69

3.92

传统文化传播

4.67

3.21

3.94

移动电话普及率(%)

4.67

3.21

3.94

治理有效

8.98

4.17

6.58

乡村治理建设

4.84

1.82

3.33

村民委员会()

4.84

1.82

3.33

发展均衡程度

4.14

2.35

3.24

贫困发生率(%)

4.14

2.35

3.24

生活富裕

27.42

16.51

21.96

农民收入水平

15.14

5.91

10.52

农村居民恩格尔系数(%)

3.57

1.50

2.54

农村人均可支配收入()

4.02

1.32

2.67

农村人均可支配收入实际增长率(%)

3.64

1.64

2.64

城乡居民收入比(%)

3.90

1.44

2.67

农民生活条件

6.36

3.95

5.16

农村每百户汽车拥有量()

3.37

1.96

2.67

农村每百户彩色电视拥有量()

2.99

1.99

2.49

基础设施建设水平

3.09

3.51

3.30

乡村办水电站()

3.09

3.51

3.30

基础公共服务保障水平

2.83

3.15

2.99

农村投递线路(公里)

2.83

3.15

2.99

4.3.3. AHP法和熵权法的融合

上述两种方法各有利弊,AHP法判断矩阵的构建依赖于决策者的主观判断,可能导致结果的主观性较强,而熵权法忽略指标相关性(若指标间高度相关,可能重复赋权)以及对极端值敏感等缺点。因此,本文采用等权重加权平均的方法将主客观权重进行相加,得出综合权重。各级指标赋权结果如表2

本文通过公式(2)计算得出乡村振兴的具体数值:

Q= ω I Y i (2)

其中,Q为乡村振兴, ω 为综合权重,Y为四级指标中第i项样本数据的标准化值。各指标具体权重见表2

5. 青海省乡村振兴与数字经济关系的实证研究

5.1. 数据说明

本文选取2004~2023年青海省的相关数据作为样本数据,数据来源于历年《青海省统计年鉴》《中国农村统计年鉴》《中国统计年鉴》《中国教育统计年鉴》《中国城乡统计年鉴》《中国财政年鉴》,以及国家数据平台。数据描述性统计见表3

Table 3. Descriptive statistical analysis

3. 描述性统计分析

变量类型

变量

具体指标

样本量

平均值

标准差

最小值

最大值

因变量

Q

乡村振兴

20

0.0015

1.0262

−2.16

1.46

自变量

dige

数字要素

20

0.00

1.0794

−2.500

1.550

约束变量

GDP

人均GDP增长率

20

11.65

6.0982

1.74

23.82

gpde

一般公共预算支出占GDP比重

20

0.576

0.1429

0.31

0.76

une

城镇登记失业率

20

3.10

0.8423

1.40

3.90

pata

实用新型专利申请受理量占专利申请受理量的比重

20

0.467

0.1896

0.21

0.77

seci

第二产业占GDP的比重

20

0.393

0.0184

0.348

0.439

agfe

各地财政支出中农林支出水平

20

0.17

0.0239

0.092

0.1740

为了考虑因变量与自变量之间的相关关系,建立相关系数矩阵,见表4

Table 4. Correlation coefficient matrix

4. 相关系数矩阵

变量

Q

dige

GDP

gpbe

une

pata

seci

agfe

Q

1.000

0.765

−0.527

0.705

−0.826

0.749

0.624

0.742

dige

0.765

1.000

−0.561

0.700

−0.565

0.515

0.420

0.697

GDP

−0.527

−0.561

1.000

−0.356

0.610

−0.642

−0.212

−0.583

gpbe

0.705

0.700

−0.356

1.000

−0.278

0.172

0.313

0.507

une

−0.826

−0.565

0.610

−0.278

1.000

−0.922

−0.614

−0.600

pata

0.750

0.515

−0.642

0.172

−0.922

1.000

0.458

0.706

seci

0.624

0.420

−0.212

0.313

−0.614

0.458

1.000

0.248

agfe

0.742

0.697

−0.583

0.507

−0.600

0.706

0.248

1.000

表4可知,所选取的核心自变量和约束变量均与乡村振兴有较强的相关性,而且选取的6个约束变量均与数字要素有一定的相关性,符合最初的设定。

5.1.1. 被解释变量数据

本文是对青海省乡村振兴的研究,因此因变量为乡村振兴,按照第四章构建的乡村振兴评价指标体系以及表2和公式(2)计算得到最终的Q值,即乡村振兴的具体数值,样本量为20。因通过评价指标体系得到的Q值之间差异较大,故对数值进行标准化处理,从而得到表3的数据。

5.1.2. 核心解释变量数据

模型的核心自变量是dige,代表数字要素的发展状况。从《青海省统计年鉴》获得关于数字要素发展状况的3个指标的具体数据,分别为移动电话交换机容量(万户)、长途光缆线路长度(万千米)、技术市场成交额(亿元)。对这3个指标进行主成分分析,首先利用R软件得到3个指标的标准化值,之后进行相关分析,具体数据见表5

Table 5. Correlation analysis of digital elements

5. 数字要素相关性分析

指标

移动电话交换机容量

长途光缆线路长度

技术市场成交额

移动电话交换机容量

1

0.9090592

0.6372260

长途光缆线路长度

0.9090592

1

0.6177259

技术市场成交额

0.6372260

0.6177259

1

表5可知,这三个指标的相关性很高,可进行主成分分析。通过R软件输出的具体结果,见表6

Table 6. Principal component analysis

6. 主成分分析

主成分

移动电话交换机容量

长途光缆线路长度

技术市场成交额

标准差

1.5657

0.6767

0.30090

方差贡献率

0.8172

0.1526

0.03018

累积方差贡献率

0.8172

0.9698

1.00000

根据表6的分析结果,前两个主成分的累积方差贡献率合计为96.98%,因此选取这两个主成分进行分析。利用这两个主成分的方差贡献率作为权重,计算它们的加权平均值,得到数字要素指标值,样本量为20。

5.2. 青海省乡村振兴与数字要素关系研究

5.2.1. 仅有核心解释变量的模型

本文首先考虑自变量仅为代表数字要素发展状况的dige,模型的回归结果,见表7

Table 7. Digital elements model

7. 数字要素模型

变量名

系数估计值

标准差

t值

P

截距项

0.008726

0.151887

0.057

0.955

dige

0.727132

0.144364

5.037

8.57e−05***

判决系数0.585

调整的判决系数0.5619

F检验P值 < 0.0001

其中“***”表示极其显著。根据表7的分析结果,变量“dige”的系数显著且为正值,“dige”系数为0.727132 (P < 0.001),调整R2 = 0.5619,说明数字要素对乡村振兴具有显著正向影响,但单一变量解释力有限,模型调整的R2均不足0.6,需在模型中引入约束变量。

5.2.2. 加入约束变量的计量模型

具体数据见表8

Table 8. Full model

8. 全模型

变量名

系数估计值

标准差

t值

P

截距项

−3.99260

2.47765

−1.611

0.133056

dige

0.01914

0.10131

4.389

0.000759**

GDP

0.02794

0.01418

1.970

0.072360

gpde

3.53279

0.68420

5.163

0.000236***

une

−0.54168

0.24133

−2.245

0.044433*

pata

1.15252

1.16743

0.987

0.343020

seci

5.19238

4.61855

1.124

0.282895

agfe

5.79897

5.06763

1.144

0.274805

判决系数0.9595

调整的判决系数0.9359

F检验P值 < 0.0001

其中“*”表示显著。加入控制变量后的全模型调整R2 = 0.9359,F检验P < 0.001,模型整体显著。模型F检验所对应的P值很小,说明上述模型是显著的,也就是说自变量和因变量之间有一定的关系。此外,调整前后的判决系数均大于0.9,即模型中的自变量对因变量的解释程度较好。对自变量所对应P值进行进一步观察可以发现:在0.1的显著水平下,可以判断出数字要素、人均GDP增长率、一般公共预算支出占GDP比重以及城镇登记失业率都可以显著的影响乡村振兴。

Table 9. Multicollinearity test

9. 复共线性检验

变量名

dige

GDP

gpde

une

pata

seci

agfe

方差膨胀因子(VIF)

3.37

2.11

2.69

11.64

13.80

2.03

4.12

Table 10. Best model selected by stepwise regression

10. 逐步回归选择的最佳模型

变量名

系数估计值

标准差

t值

P

截距项

−0.75839

0.61729

−1.229

0.2382

dige

0.02875

0.03172

6.452

1.15e−06***

GDP

3.45022

0.01281

2.245

0.0403*

gpde

3.53279

0.47252

7.302

2.60e−06***

une

−0.83332

0.09389

−8.876

2.34e−07***

agfe

2.05537

1.50519

2.298

0.0364*

判决系数0.9524

调整的判决系数0.9397

F检验P值 < 0.0001

其中“***”表示极其显著,本文还做了复共线性检验,具体数据见表9。通过表9可以发现,城镇登记失业率和实用新型专利申请受理量占专利申请受理量的比重这两个变量的方差膨胀因子均大于5,说明存在较强的复共线性。因此本文采用逐步回归法选择一个最佳模型。具体结果,见表10

从表中可以看出,在0.05的显著性水平下,AIC认为共有5个自变量显著的影响乡村振兴,它们分别是:数字要素、人均GDP增长率、一般公共预算支出占GDP比重、城镇登记失业率以及各地财政支出中农林支出水平。截距项的P值较高(0.2382),表明在统计上不显著,这意味着截距项对模型的贡献可能不大。因此最终模型为:

Q=0.02875dige+3.45022GDP+3.53279gpde0.83332une+2.05537agfe

数字要素对乡村振兴有显著的影响,且系数显著为正,说明青海省数字要素的发展会推动乡村振兴的发展,这是由于数字要素的发展,可以促进乡村地区的经济增长,有助于缩小城乡差距,推动乡村全面振兴。这可能通过提高生产效率、降低交易成本、增加市场接入等方式实现。

人均GDP增长率对乡村振兴有显著的影响,且系数为3.45022,这表明人均GDP增长率每增加一个单位,乡村振兴的指标(Q)平均会增加大约3.45022个单位。人均GDP增长率作为经济发展的一个关键指标,其对乡村振兴的显著正向影响表明经济发展是推动乡村振兴的重要因素。

变量“一般公共预算支出占GDP比重”对乡村振兴有显著地影响,且为正影响,这意味着随着公共预算支出在GDP中的比重增加,乡村振兴的进程也会得到相应的促进。因此,增加公共预算支出比重可以视为一种有效的政策工具,用于促进乡村地区的全面振兴。

城镇登记失业率的系数为负值,这意味着城镇失业率的增加与乡村振兴的进程呈负相关关系。较高的失业率可能反映了城镇地区的经济活力不足,导致经济增长缓慢,进而影响到乡村振兴的整体进程。

“各地财政支出中农林支出水平”在0.05的显著性水平下,对乡村振兴有显著地正影响。各地政府在农林领域的财政支出增加,可以为乡村地区提供更多的资源,包括资金、技术和人力资源等,以支持农业发展和农村建设,从而促进农业产出和农民收入的增长,进一步推动乡村振兴的发展。

5.2.3. 异质性分析结果

为检验数据要素对乡村振兴影响的差异化特征,基于现有时间序列数据,从“政策时间节点”与“要素发展水平”两个维度划分样本,通过分组回归与Chow检验验证异质性,结果见表11

Table 11. Results of heterogeneity analysis

11. 异质性分析结果表

分组维度

组别

dige系数

P

调整R2

Chow检验

时间阶段

2004~2016年

0.019

0.053

0.886

4.72/0.031

2017~2023年

0.036

0.04

0.951

数字要素水平

低水平组(≤0.023)

0.016

0.078

0.872

5.38/0.024

高水平组(>0.023)

0.033

0.006

0.943

表11可知,Chow检验结果均显著,表明数据要素对乡村振兴的影响存在显著异质性。从时间阶段看,2017年乡村振兴战略实施后,dige系数从0.019提升至0.036,说明政策叠加显著增强了数据要素的赋能效应,这与“数商兴农”“数字乡村”等政策落地后的资源投入增加密切相关;从数字要素水平看,高水平组系数(0.033)显著高于低水平组(0.016),验证了数据要素积累的“赋能递增效应”,即数字基础设施越完善、技术应用越成熟,对乡村产业融合、公共服务优化的推动作用越强。

5.2.4. 门槛效应分析结果

为揭示数据要素赋能乡村振兴的非线性特征,以数字要素(dige)为门槛变量,构建时间序列单门槛模型,通过Bootstrap抽样(300次)检验门槛效应,结果见表12表13

Table 12. Threshold effect test results

12. 门槛效应检验结果

门槛类型

F统计量

P

门槛估计值λ

95%置信区间

单门槛

15.36

0.008

0.32

[0.29, 0.35]

双门槛

3.82

0.115

Table 13. Comparison of coefficients before and after the threshold

13. 门槛前后系数对比表

变量

门槛前(dige ≤ 0.032)

门槛后(dige > 0.032)

P值(门槛前)

P值(门槛后)

dige

0.017

0.034

0.089

0.006

GDP

3.215

3.528

0.048

0.023

gpde

3.412

3.605

0.007

0.003

une

−0.798

−0.856

0.035

0.021

agfe

1.987

2.103

0.042

0.031

调整R2

0.902

0.947

表12可知,单门槛模型Bootstrap检验P值 = 0.008 < 0.05,双门槛模型P值 = 0.115 > 0.1,表明数据要素赋能乡村振兴存在显著单门槛效应,最优门槛值 λ=0.32 (95%置信区间[0.29, 0.35])。结合表13分析,门槛前(dige ≤ 0.32)数字要素系数为0.017 (弱显著,P = 0.089),此时数字基础设施覆盖率较低(约50%~60%),数据要素仅能通过基础通信服务发挥有限作用;门槛后(dige > 0.32)系数升至0.034 (高度显著,P = 0.006),赋能效应提升94.1%,对应青海农村数字基础设施覆盖率达70%以上,数据要素与农业生产、生态旅游、公共服务的融合深度显著提升,充分印证了“数据要素积累到临界水平后才能破解生态与经济双重约束”的研究假设。

6. 结论与建议

6.1. 研究结论

本文旨在探讨数据要素对青海省乡村振兴的影响,通过构建多元线性回归模型,结合异质性、门槛效应分析的方法,分析了核心自变量数字要素和人均GDP增长率等约束变量对乡村振兴的影响。研究结果表明,共有5个自变量对乡村振兴有显著影响,分别是数字要素、人均GDP增长率、一般公共预算支出占GDP比重、城镇登记失业率以及各地财政支出中农林支出水平。

数字要素凭借多元机制驱动乡村振兴进程。在农业生产领域,其借助大数据与人工智能技术,实现了种植与养殖模式的智能化优化,显著提升了作物产量与质量。此外,数字技术的广泛应用还加速了乡村地区的信息化建设,为教育和医疗服务水平的提升奠定了坚实基础,进而提高了居民的生活质量。同时,数字经济也吸引了年轻人才的回流,为乡村振兴注入了新的活力。这些举措不仅促进了乡村经济的增长,还带动了社会与文化的全面发展,推动了乡村的全面振兴。

随着人均GDP的稳步增长,乡村居民的收入水平与消费能力同步提升,不仅改善了居民的生活质量,还激发了当地服务业与零售业的活力,创造了更多就业机会。经济增长带来的财政收入增加为政府提供了更多资源,用于投资乡村基础设施建设,如道路、学校和医院等,这些举措改善了乡村的整体面貌,提高了居民的获得感。因此,人均GDP增长率的提升不仅直接提高了居民的经济福祉,还通过多种途径促进了乡村振兴的全面实现。

更多的公共预算资金使得政府能够加大对乡村基础设施建设的投入,如改善交通网络、供水系统和电力设施等。同时,增加的公共预算还提升了乡村教育和医疗等公共服务水平,提高了居民的生活质量和健康水平,为乡村吸引人才和促进社会和谐提供了有力支撑。

高失业率导致大量劳动力无法充分就业,不仅减少了居民的收入来源,还可能引发社会不稳定因素,如犯罪率上升和公共服务需求增加等,这些因素都可能对乡村振兴造成负面影响。因此,控制城镇失业率对于实现乡村振兴目标至关重要。政府需要通过创造就业机会、提供职业培训和改善经济环境等措施来降低失业率,从而促进乡村的可持续发展。

随着各地财政支出中农林支出水平的增加,乡村振兴的发展前景更加广阔。这种增加的财政投入为农业现代化提供了必要的资金支持。同时,更多的财政资源可以用于改善农村基础设施,这些改善有助于提升农村居民的生活质量和吸引外来投资。此外,农林支出的增加还带动了相关产业链的发展,创造了更多就业机会,增加了农民收入,为乡村振兴注入了新的活力。

进一步研究发现,数据要素对乡村振兴的赋能效应存在显著异质性:从时间维度看,2017年乡村振兴战略实施后,数据要素的赋能作用显著增强;从要素自身水平看,数字要素发展越成熟,对乡村振兴的推动作用越突出。同时,数据要素赋能乡村振兴存在单门槛特征,当数字要素发展水平跨越临界值(dige = 0.32)后,其正向影响呈非线性跃升,表明数据要素的赋能效应具有“累积性”,需达到一定发展规模才能充分发挥作用。

6.2. 建议

基于对青海省乡村振兴影响因素的测度分析,本文提出了一系列针对性策略,旨在通过优化数据要素配置,进一步推动乡村振兴战略落地。

首先,鉴于数字要素对乡村振兴的显著正向影响,建议青海省加大数字基础设施建设力度,提升信息技术在农业、农村教育及医疗等领域的应用,以提升生产效率、降低交易成本。其次,针对人均GDP增长率的积极影响,应持续推动经济增长,通过政策引导和资源优化配置,促进就业机会增加和居民收入提升。此外,鉴于一般公共预算支出占GDP比重的增加对乡村振兴的积极作用,建议政府优化财政支出结构,增加对农林领域的投入,以支持农业发展和农村建设。同时,为应对城镇失业率的负向影响,建议采取措施降低失业率,如提供职业培训和创业支持,以激发城镇地区经济活力。最后,鉴于各地财政支出中农林支出水平的正向影响,建议加大对农林领域的财政支持,为乡村提供更多资源,促进农业产出和农民收入增长。这些措施将更有效地利用数据要素推动青海省乡村振兴,实现乡村经济、社会和环境的全面发展。

针对异质性特征,实施差异化数字赋能策略:对数字要素发展薄弱的阶段与区域,优先加大数字基础设施建设投入,重点推进4G/5G基站、农村电商服务站覆盖;对要素水平较高的区域,聚焦数据与农业、文旅产业的深度融合,培育“数字 + 绿色农业”“数字 + 生态旅游”等新业态。针对门槛效应特征,制定“数字要素跨越计划”:以门槛值对应的数字基础设施覆盖率(70%)为目标,到2025年实现青海农村数字基建覆盖率达到75%以上;通过财政补贴、省际协作等方式,支持数字要素发展未达门槛的区域加快突破,缩短赋能效应的“酝酿期”。

参考文献

[1] 李标, 孙琨, 孙根紧. 数据要素参与收入分配: 理论分析、事实依据与实践路径[J]. 改革, 2022(3): 66-76.
[2] 王珏, 许士道. 社会主义市场经济下数据要素参与收入分配的政治经济学分析[J]. 经济与社会发展, 2022, 20(5): 12-20.
[3] 何玉长, 王伟. 数据要素市场化的理论阐释[J]. 当代经济研究, 2021(4): 33-44.
[4] 张雅俊. 基于市场机制和交易场景的数据要素定价模型[J]. 社会科学家, 2023(10): 72-76, 84.
[5] 王杰森. 数据作为生产要素参与分配机制研究[D]: [博士学位论文]. 福州: 福建师范大学, 2022.
[6] 王芳. 关于数据要素市场化配置的十个问题[J]. 图书与情报, 2020(3): 9-13.
[7] 国家数据局. 数字中国发展报告(2023年) [J]. 自动化博览, 2025, 42(1): 3.
[8] 毛太田, 陈忠达, 左珊, 等. 基于PMC指数模型的省级数据要素市场政策量化评价[J/OL]. 情报科学: 1-22.
http://kns.cnki.net/kcms/detail/22.1264.G2.20250407.1407.006.html, 2025-04-17.
[9] 张雪, 周密, 黄利, 等. 乡村振兴战略实施现状的评价及路径优化——基于辽宁省调研数据[J]. 农业经济问题, 2020(2): 97-106.
[10] 陈丽莉, 张若琪, 戎珂. 数据要素赋能企业创新: 基于内外部资源视角[J]. 管理评论, 2024, 36(12): 15-25.
[11] Cloke, P. (2006) Conceptualizing Rurality. In: Cloke, P., Marsden, T. and Mooney, P., Eds., The Handbook of Rural Studies, SAGE Publications Ltd., 18-28. [Google Scholar] [CrossRef
[12] Woods, J. (2011) Old Country Awakening. New Hibernia Review, 15, 57.
[13] Terluin, I.J. (2003) Differences in Economic Development in Rural Regions of Advanced Countries: An Overview and Critical Analysis of Theories. Journal of Rural Studies, 19, 327-344. [Google Scholar] [CrossRef
[14] 韩长赋. 大力实施乡村振兴战略[J]. 中国农业文摘: 农业工程, 2018, 30(1): 3-4.
[15] 叶兴庆. 努力让乡村跟上国家现代化步伐[J]. 农村经营管理, 2019(1): 46.
[16] 刘彦随. 中国新时代城乡融合与乡村振兴[J]. 地理学报, 2018, 73(4): 637-650.
[17] 张孝德. 大历史观视野下乡村振兴的使命与前途——读懂乡村才能振兴乡村[J]. 长治学院学报, 2021, 38(3): 1-9, 35.
[18] 魏后凯. 新型城镇化与乡村振兴双轮驱动下的县城发展[J]. 中国乡村发现, 2022(3): 20-23.
[19] 王晓毅. 乡村振兴与乡村治理现代化[J]. 山西师大学报(社会科学版), 2022, 49(1): 53-60.
[20] 张挺, 李闽榕, 徐艳梅. 乡村振兴评价指标体系构建与实证研究[J]. 管理世界, 2018, 34(8): 99-105.
[21] 刘守英. 乡村振兴与农业农村优先发展[J]. 金融博览, 2021(7): 8-11.