1. 引言
随着数字时代的到来,数据和信息已成为新的关键生产要素,深刻改变着传统生产方式和经济结构。依据《中国数字经济年度发展评估报告(2024)》发布的最新统计数据,至2023年底,我国数字经济总规模达到53.9万亿元,在国内生产总值中占比达42.8个百分点。特别值得关注的是,该产业对国内生产总值增速的拉动效应达到66.45%,显著成为驱动宏观经济持续增长的核心动能。在这一背景下,农民作为社会的重要组成部分,亟需提升他们的素质与能力,尤其是数字素养。2024年10月,中央网信办公布了《全民数字素养与技能发展水平调查报告(2024)》。该报告表明,农村地区农民的数字素养水平较低,与城市居民尚存“数字鸿沟”。在我国大力推动数字经济发展的背景下,数字素养乃是农村居民消除数字鸿沟、融入数字社会并更好地利用数字技术带来的便利的关键能力。
影响农村劳动力非农就业的因素复杂多样,已有研究从内部因素与外部因素等不同角度进行了探讨。研究表明,随着农村劳动力受教育年限的增长,更有利于农村劳动力的非农就业且教育回报率在本科阶段达到最大[1];农业生产托管服务通过发挥时间释放效应促使女性劳动力兼业转移并提高农村女性非农就业的概率,同时显著提高其非农就业收入[2];农村电子商务发展增加了本地非农就业机会,尤其是本地服务业就业机会,促使不就业或者农业就业的女性更多转向本地非农就业,满足了女性平衡工作和家庭的需求[3];新农保通过提升家庭互联网接入以及影响农户的风险态度进而影响农户非农就业的概率[4];新冠肺炎疫情等突发公共事件会对农村劳动力的心理健康产生短期的负向影响,进而会在短期内降低农村劳动力非农就业的可能性[5]。
现如今,数字素养在许多领域都深刻地影响着农村社会。已有研究从政治、经济与社会生活等方面进行了探讨。研究表明,提升农民的数字素养能有效激发乡村精英农民群体参与乡村数字治理的热情[6];同时,数字素养的增强有助于提高农户对生活垃圾分类治理的参与意愿,并促使其更积极地实施垃圾分类行为[7];在增收方面,数字素养的提升可以促进财产性收入增长[8];此外,数字素养的提升能改善农村居民的创业活动,进而助力减轻其多维贫困状况[9];还有研究表明,农村女性劳动力客观就业质量的提高,得益于数字素养通过拓宽信息获取途径所发挥的作用[10]。
本研究以2020年中国家庭追踪调查(CFPS)微观数据为基础,通过构建非线性概率模型,系统考察数字素养对乡村从业人员非农就业选择的作用效应,并为数字经济赋能乡村全面振兴战略的实施路径提供了微观层面的机制解释。
2. 理论分析与研究假说
2.1. 数字素养与农村劳动力非农就业的关系
舒尔茨的人力资本理论着重指出,个体通过教育、培训等途径所积累的知识与技能,本质上是一种宝贵的资本,能够为个人创造经济收益,拓宽就业机会[11]。在现代社会,数字素养已然成为这一理论框架下极为重要的一种人力资本,对农村劳动力的非农就业产生着多维度的深远影响。一方面,数字素养通过重塑农村教育内容和方式,成为推动劳动力非农就业转型的核心引擎。它使教育从传统文化课转向实战型数字技能培训(如电商运营、智慧农业操作),并通过在线课程突破地域限制,降低学习成本。这直接赋能劳动力掌握高附加值技能,推动就业从低端体力劳动向技术岗位跃升,实现收入增长。另一方面,数字素养通过重构农村劳动力的社会资本形态,显著促进非农就业升级。农村劳动力通过利用微信、抖音和快手等平台接入跨地域行业社群,打破传统熟人网络的信息封闭性,直接获取全国各地的用工招工信息。同时,数字信用(如支付宝芝麻分)替代人情担保,降低就业信任成本,同时提升信息核验能力,降低了正规就业的门槛。最后,数字素养通过有效降低迁移成本环节驱动农村劳动力非农就业。数字技能的使用(如网上招聘平台或政策数据库的使用)使得农村劳动力实现精准岗位匹配,降低其信息获取成本。同时,农村劳动力通过提升数字素养,学习前沿的数字技术,能够迅速掌握新的工作技能,完成从传统农业劳动力向适应现代非农产业需求的转变。基于以上分析,本文提出研究假说H1:
假说H1:数字素养能促进农村劳动力非农就业。
2.2. 数字素养促进农村劳动力非农就业的理论机制
信息不对称在农村劳动力非农就业过程中有着至关重要的影响[12]。信息不对称是指在经济活动或交易中,参与双方所掌握的信息量或信息质量不一致,导致一方比另一方拥有更多或更准确的信息。数字素养较高的农村劳动力,他们能够更熟练地运用数字工具主动搜索和获取非农就业的相关信息,拓宽信息渠道,了解不同行业、地区的就业需求和薪酬待遇。同时,数字素养还增强了他们的信息分析和处理能力,使他们能够对收集到的就业信息进行筛选、比较和分析,更准确地判断哪些岗位适合自己的能力和兴趣。这种能力降低了与就业市场之间的信息不对称程度,避免了盲目求职,提高了就业匹配度和满意度。基于以上分析,本文提出研究假说H2:
假说H2:数字素养可以通过提高农村劳动力信息获取能力促进其非农就业。
自身工作能力对农村劳动力非农就业起着重要影响。较强的工作能力意味着更高的就业竞争力和更广泛的职业选择范围,有助于农村劳动力寻求更好的工作机会和薪资待遇;相反,自身能力的不足可能会限制他们的工作意愿和选择,使他们更难以找到合适的工作。具有较高数字素养的农村居民可以利用互联网等手段学习更多的知识与技能,提升自己的工作能力水平,从而使自己在就业环境中可以保持较高的竞争力,从而推动农村劳动力的非农就业。基于以上分析,本文提出研究假说H3:
假说H3:数字素养可以通过提升农村劳动力自身的工作能力推动农村劳动力非农就业。
3. 数据来源、变量选取与模型选择
3.1. 数据来源
本文所使用的数据来源于《中国家庭追踪调查(CFPS)》。根据CFPS问卷当中不同的内容,可以大概划分为以个体特征为主要内容的成人问卷和少儿问卷、以家庭背景信息为主要内容的家庭问卷和以生活自然与经济背景为主要内容的村居问卷三个方面,内容涉及政治、经济、文化、教育和社会等多个层面。该项目目的是搜集我国社会发展变化数据,并为学术界进行相关研究和政府进行相关政策制定提供真实的数据信息支持,其数据具有较强的公信力。本文选择其最新的2020年农村居民样本数据来进行研究,经过清洗与质量控制,筛选出符合研究要求的有效观测数据共计4241份。
3.2. 变量选取
1) 被解释变量:农村劳动力非农就业。参照阮若卉等的做法[13],选择CFPS问卷中的问题“您这份工作是农业工作还是非农工作?”来衡量农村劳动力工作的性质。在本文中,将从事农业工作,赋值为0;从事非农工作,赋值为1。
2) 核心解释变量:数字素养。借鉴李丽莉等学者的研究思路[14],本研究基于CFPS数据,整合了8个数字素养相关的测量题项,并应用熵权法对各题项进行客观赋权,将数字设备接入、数字信息获取、数字生活3个维度的数字素养子指标进行合成,得到综合的数字素养得分。(见表1)
Table 1. Digital literacy measurement indicator system
表1. 数字素养测度指标体系
|
维度 |
具体测量题项 |
赋值 |
|
数字设备接入 |
是否移动设备上网 |
是 = 1;否 = 0 |
|
|
是否电脑上网 |
是 = 1;否 = 0 |
|
|
是否看短视频 |
是 = 1;否 = 0 |
数字素养 |
数字信息获取 |
是否网络学习 |
是 = 1;否 = 0 |
|
|
是否使用微信 |
是 = 1;否 = 0 |
|
|
是否玩网络游戏 |
是 = 1;否 = 0 |
|
数字生活 |
是否网络购物 |
是 = 1;否 = 0 |
|
|
朋友圈分享频率 |
从不 = 1;几个月一次 = 2;一月一次 = 3;一月2~3次 = 4;一周1~2次 = 5;一周3~4次 = 6;几乎每天 = 7 |
3) 机制变量:(a) 信息获取能力。结合已有研究和CFPS问卷内容,选择问题“互联网对你获取信息的重要程度?”(按重要程度从1~5进行打分,1表示非常不重要,5表示非常重要)来衡量农村居民的信息获取能力。分数越接近于1,说明从互联网获取信息能力越弱;分数越接近于5,说明从互联网获取信息能力越强。(b) 工作能力。结合已有研究和CFPS问卷内容,选择问题“网络对你的工作有多重要?”(按重要程度从1~5进行打分,1表示非常不重要,5表示非常重要)来衡量工作能力。分数越接近于1,说明从网络获取更多工作能力越少;分数越接近于5,说明从网络获取更多工作能力越多。
4) 控制变量:本文参考李晓静等的研究[15],重点考察微观个体特征与家庭结构属性两个层面。具体而言,个体层面指标包含性别构成、年龄、婚姻登记状态、工作稳定性、工作满意度、身体健康状况、主观幸福感、政治面貌以及教育年限等维度;家庭层面的变量则包括家庭年收入总额、父母照料和家庭规模(即家庭成员数量)。(见表2)
3.3. 模型选择
鉴于核心因变量“农村劳动力是否参与非农就业”为二元离散变量(0~1形式),且其分布特征满足标准正态分布前提条件,本研究选用二元Probit模型分析数字素养对农民非农就业选择的影响。具体的基准回归模型如下:
在模型中,
代表农村劳动力非农就业,
为潜变量,如果
,则
为1,否则为0;
代表农村劳动力的数字素养;
则代表控制变量;
为截距常数项;
和
分别为数字素养和控制变量的估计系数;
为随机扰动项。
Table 2. Description of variables and descriptive statistics
表2. 变量说明与描述性统计
变量类型 |
变量名称 |
定义与赋值 |
均值 |
标准差 |
最小值 |
最大值 |
被解释变量 |
农村劳动力非农就业 |
非农就业 = 1;农业就业 = 0 |
0.63 |
0.48 |
0 |
1 |
核心解释变量 |
数字素养 |
采用熵权法进行测算 |
0.10 |
0.10 |
0 |
0.42 |
控制变量 |
性别 |
男 = 1;女 = 0 |
0.54 |
0.50 |
0 |
1 |
婚姻状况 |
已婚 = 1;未婚 = 0 |
0.80 |
0.40 |
0 |
1 |
受教育程度 |
文盲/半文盲 = 1;小学 = 2;
初中 = 3;高中/中专/技校/职高 = 4;大专 = 5;大学本科 = 6;硕士及以上 = 7 |
3.01 |
1.20 |
1 |
7 |
年龄 |
岁 |
37.91 |
10.81 |
18 |
60 |
工作稳定性 |
有编制 = 1;无编制 = 0 |
0.03 |
0.16 |
0 |
1 |
工作满意度 |
非常满意 = 5;比较满意 = 4;一般 = 3;不太满意 = 2;
非常不满意 = 1 |
3.60 |
0.94 |
1 |
5 |
健康状况 |
非常健康 = 5;很健康 = 4;
比较健康 = 3;一般 = 2;
不健康 = 1 |
2.72 |
1.12 |
1 |
5 |
幸福感 |
从0~10进行打分 |
7.35 |
2.09 |
0 |
10 |
政治面貌 |
党员 = 1;非党员 = 0 |
0,02 |
0.12 |
0 |
1 |
父亲照料 |
照顾 = 1;未照顾 = 0 |
0.22 |
0.42 |
0 |
1 |
母亲照料 |
照顾 = 1;未照顾 = 0 |
0.26 |
0.44 |
0 |
1 |
家庭人口规模 |
人 |
4.70 |
2.02 |
1 |
14 |
家庭年总收入 |
过去12个月家庭总收入取对数 |
4.42 |
0.34 |
2.18 |
5.86 |
信息获取能力 |
从1~5进行打分(1表示非常不重要,5表示非常重要) |
4.07 |
1.10 |
1 |
5 |
工作能力 |
从1~5进行打分(1表示非常不重要,5表示非常重要) |
3.53 |
1.36 |
1 |
5 |
4. 实证结果与分析
4.1. 基准回归分析
如表3所示,基准回归模型检验了数字素养对农村劳动力非农就业的影响。随着模型(1)至(3)控制变量的逐步引入,结果显示,即使在仅包含核心变量的模型(1)中,数字素养对促进非农就业亦存在显著的正向作用。进一步观察包含最完整控制变量的模型(3),其结果显示数字素养的边际效应估计值为1.245。这表明,在保持其他因素不变的前提下,农民个体的数字素养水平每提高一个单位,其实现非农就业的概率将提升124.5%。因此,研究假设H1获得实证支持。
Table 3. Baseline regression results
表3. 基准回归结果
变量 |
被解释变量:农村劳动力非农就业 |
模型(1) |
模型(2) |
模型(3) |
数字素养 |
4.450*** |
1.451*** |
1.245*** |
(0.234) |
(0.275) |
(0.291) |
性别 |
|
0.311*** |
0.312*** |
|
(0.044) |
(0.048) |
婚姻状况 |
|
−0.032 |
−0.108 |
|
(0.064) |
(0.070) |
受教育程度 |
|
0.256*** |
0.231*** |
|
(0.022) |
(0.024) |
年龄 |
|
−0.035*** |
−0.042*** |
|
(0.002) |
(0.003) |
工作稳定性 |
|
0.810*** |
0.718*** |
|
(0.225) |
(0.222) |
工作满意度 |
|
0.099*** |
0.111*** |
|
(0.023) |
(0.024) |
健康状况 |
|
−0.010 |
−0.012 |
|
(0.011) |
(0.021) |
幸福感 |
|
−0.010 |
−0.009 |
|
(0.011) |
(0.011) |
政治面貌 |
|
0.023 |
0.133 |
|
(0.213) |
(0.221) |
父亲照料 |
|
|
−0.105 |
|
|
(0.064) |
母亲照料 |
|
|
−0.279*** |
|
|
(0.060) |
家庭人口规模 |
|
|
−0.040*** |
|
|
(0.012) |
家庭年总收入 |
|
|
0.334*** |
|
|
(0.073) |
省份固定效应 |
未控制 |
未控制 |
已控制 |
常数项 |
−0.098*** |
0.432** |
−0.083 |
(0.029) |
(0.172) |
(0.568) |
样本量 |
4241 |
4241 |
4181 |
注:*、**和***分别表示在10%、5%和1%的统计水平上显著;( )为稳健标准误。
4.2. 稳健性检验
第一,更换回归模型。由于本文使用的研究数据为分类变量,为了检验前文的回归结果是否可靠,采用Logit模型替代原有Probit回归,结果如表4中稳健性检验一所示,数字素养的回归系数在1%水平上显著为正,这与基准模型的实证发现具有高度一致性。该结果进一步验证了数字素养对农村劳动力非农就业决策存在正向促进效应的研究假设,与前文一致。第二,剔除数字基础设施发达地区。鉴于我国区域间经济社会发展存在梯度特征,各省份数字化基础设施建设水平差异显著,可能导致农村人口数字素养存在空间分异效应。依据《中国互联网应用发展统计报告》对省级行政单位的评估,确定广东、北京、上海、浙江及福建为数字化建设前沿区域。因此,参考王杰等关于样本选择的处理方式[9],将上述高互联网普及率地区的观测值予以排除后重新进行估计。表4的稳健性检验二结果显示,在控制区域数字化发展梯度因素后,农村劳动力数字素养系数仍在1%水平上显著正向,其边际效应与基准模型估计值保持统计一致性,进一步证实了研究结果的可靠性。
Table 4. Robustness test results
表4. 稳健性检验结果
变量 |
稳健性检验一 |
稳健性检验二 |
模型(1) |
模型(2) |
模型(1) |
模型(2) |
数字素养 |
7.626*** |
2.304*** |
4.385*** |
1.284*** |
(0.422) |
(0.506) |
(0.245) |
(0.303) |
性别 |
|
0.538*** |
|
0.346*** |
|
(0.082) |
|
(0.050) |
婚姻状况 |
|
−0.231* |
|
−0.095 |
|
(0.123) |
|
(0.073) |
受教育程度 |
|
0.396*** |
|
0.244*** |
|
(0.041) |
|
(0.025) |
年龄 |
|
−0.070*** |
|
−0.042*** |
|
(0.005) |
|
(0.003) |
工作稳定性 |
|
1.544*** |
|
0.796*** |
|
(0.481) |
|
(0.243) |
工作满意度 |
|
0.193*** |
|
0.116*** |
|
(0.041) |
|
(0.025) |
健康状况 |
|
0.193*** |
|
−0.018 |
|
(0.041) |
|
(0.022) |
幸福感 |
|
−0.013 |
|
−0.012 |
|
(0.019) |
|
(0.012) |
政治面貌 |
|
0.186 |
|
0.107 |
|
(0.391) |
|
(0.223) |
父亲照料 |
|
−0.191* |
|
−0.104 |
|
(0.108) |
|
(0.066) |
母亲照料 |
|
−0.481*** |
|
−0.298*** |
|
(0.101) |
|
(0.062) |
家庭人口规模 |
|
−0.069*** |
|
−0.049*** |
|
(0.021) |
|
(0.013) |
家庭年总收入 |
|
0.570*** |
|
0.312*** |
|
(0.128) |
|
(0.077) |
省份固定效应 |
未控制 |
已控制 |
未控制 |
已控制 |
常数项 |
−0.183*** |
−0.066 |
−0.152*** |
−0.352 |
(0.047) |
(1.025) |
(0.030) |
(0.549) |
样本量 |
4241 |
4181 |
3806 |
3749 |
注:*、**和***分别表示在10%、5%和1%的统计水平上显著;( )为稳健标准误。
4.3. 内生性检验
数字素养反映个人使用数字技术的能力,在因果识别中可能产生潜在的内生性问题致使估计偏误,如反向因果关系、遗漏变量以及变量测量误差等。参考杜凤军等的研究[16],将农村劳动力对互联网信息渠道的重视程度作为工具变量。数字素养越高的农村劳动力,对互联网信息渠道越重视,符合相关性要求。此外,农村劳动力对互联网信息渠道的重要程度评价是一种主观认知,不会对其非农就业造成直接影响,符合外生性要求。表5报告了内生性检验结果,第一阶段回归结果显示,工具变量对数字素养在1%的统计水平上有显著的正向影响,说明与逻辑推论一致。第二阶段回归结果显示,在控制了潜在内生性偏误后,数字素养对农村劳动力非农就业在5%的统计水平上有显著的正向影响。这一结论与基准回归的结论一致,表明在用工具变量处理了内生性问题后,数字素养对农村劳动力非农就业的影响依然显著。
Table 5. Endogeneity test results
表5. 内生性检验结果
变量 |
第一阶段 |
第二阶段 |
数字素养 |
|
4.407** |
|
(2.089) |
工具变量 |
0.585*** |
|
(0.073) |
|
控制变量 |
已控制 |
已控制 |
省份固定效应 |
已控制 |
已控制 |
观测值 |
4186 |
4186 |
注:*、**和***分别表示在10%、5%和1%的统计水平上显著;( )为稳健标准误。
4.4. 作用机制检验
基于前述理论探讨,信息获取能力与工作能力可能是数字素养作用于农村劳动力非农就业的关键中介机制。数字素养较高的农民,能够有效利用多种互联网工具及平台,突破地域空间的制约。此举不仅能显著拓展其社会交往范围,还有助于精准识别并有效整合社交网络中蕴藏的各类资源,从而为个体发展创造更多机会。选取2020年CFPS数据库中“互联网作为信息渠道的重要程度”这一问题来衡量农民的信息获取水平。提升农民的数字素养能够更好地帮助农民从互联网中学习各种知识与技能,提高自身的人力资本水平,从而加强农民对工作的适应性与匹配度。选取2020年CFPS数据库中“网络对你的工作有多重要?”这一问题来表示农民的工作能力。表6报告了作用机制检验的回归结果,估计结果显示,数字素养对农民信息获取能力和工作能力均产生正向影响且显著,表明数字素养提升有助于提高农民的信息获取能力和提升农民自身的工作能力,从而有助于促进农村劳动力的非农就业。据此,H2和H3得以验证。
Table 6. Regression results of mechanism of action test
表6. 作用机制检验的回归结果
变量 |
信息获取能力 |
农村劳动力非农就业 |
工作能力 |
农村劳动力非农就业 |
数字素养 |
1.861*** |
1.245*** |
2.677*** |
1.245*** |
(0.199) |
(0.291) |
(0.245) |
(0.291) |
信息获取 |
|
0.061*** |
|
|
|
(0.020) |
|
|
工作能力 |
|
|
|
0.041** |
|
|
|
(0.017) |
控制变量 |
已控制 |
已控制 |
已控制 |
已控制 |
省份固定效应 |
已控制 |
已控制 |
已控制 |
已控制 |
样本量 |
4186 |
4181 |
4181 |
4181 |
注:*、**和***分别表示在10%、5%和1%的统计水平上显著;( )为稳健标准误。
4.5. 异质性分析
农民群体基数庞大且结构多元,其内部不同特征个体的数字素养存在显著差异。深入探究数字素养对农村劳动力非农就业的异质效应,有助于更全面地理解这一现象。借鉴现有文献普遍做法,本研究重点从性别、年龄及受教育程度三个维度进行异质性检验。其中,年龄维度依据生命周期理论,将样本划分为45周岁以下(青年组)和45周岁及以上(中老年组);受教育程度维度以九年义务教育为界,将文盲/半文盲、小学及初中学历归类为低教育水平,高中/中专/技校/职高及以上学历归类为高教育水平。根据表7的异质性分析结果,在性别(男性/女性)、年龄组(青年/中老年)和教育层级(低/高)等不同维度下,数字素养均显著提升了各特征群体农民的非农就业水平。该结果证实数字素养在促进农民非农就业方面具有广泛适用性,同时凸显了增强农民数字能力对于保障全体农民共享数字时代收益的关键价值。
Table 7. Heterogeneity test results
表7. 异质性检验结果
核心解释变量 |
被解释变量:农村劳动力非农就业 |
男性 |
女性 |
青壮年 |
中年 |
低学历 |
高学历 |
数字素养 |
0.941** |
1.957*** |
1.521*** |
0.284 |
1.218*** |
1.303** |
(0.373) |
(0.473) |
(0.335) |
(0.635) |
(0.351) |
(0.551) |
控制变量 |
已控制 |
已控制 |
已控制 |
已控制 |
已控制 |
已控制 |
省份固定效应 |
已控制 |
已控制 |
已控制 |
已控制 |
已控制 |
已控制 |
观测值 |
2250 |
1915 |
2945 |
1199 |
3042 |
1133 |
注:*、**和***分别表示在10%、5%和1%的统计水平上显著;( )为稳健标准误。
5. 主要结论与政策建议
本文利用2020年CFPS数据,通过构建Probit计量模型对数字素养与农村人口非农就业行为之间的作用关系及影响路径进行实证探讨。结论如下:第一,数字素养的提升可以推动农村劳动力的非农就业。通过更换Logit模型以及剔除数字基础设施发达地区进行稳健性检验后,研究结论依然保持一致,具有较好的稳健性。第二,数字素养通过提升农村居民的信息获取能力和工作能力,进而促进农村劳动力的非农就业。第三,从异质性分析的结果来看,数字素养对女性、青壮年、低学历的农村劳动力非农就业具有更为显著的促进作用。
基于以上研究结论,提出如下政策建议:
第一,完善农村地区的数字基础设施建设。推进“千兆光网进村入户”与5G网络规模化部署,优先覆盖行政村、农业产业园、物流基地等重点区域,消除城乡网络代差。设立农村数字基建专项资金,重点支持光纤铺设、基站建设等骨干工程;同时通过税收减免、用地审批优化等政策,引导电信运营商、科技企业下乡参与。第二,应着力推进农村人口数字素养培育建设。构建覆盖数字化终端操作、信息技术应用能力及网络安全防护意识的系统化培育体系,通过提升劳动者数字技能储备,促进数字技术红利向农业生产领域深度渗透。设立地方数字素养专项基金,允许用地方政府债券支持培训基建。将村民数字技能达标率(如会视频问诊、在线维权等)纳入乡镇干部KPI考核等。第三,深化非农职业技能开发机制。重点实施面向新型城镇化需求的专项培训计划,着重增强农村转移劳动力对现代服务业与新兴产业岗位的适应能力,特别是提升其对数字经济背景下产业转型机遇的辨识与把握能力,提升农村劳动力利用数字工具对非农就业资源的整合能力。