1. 引言
随着科技与网络的发展,数字科技以肉眼可见的速度走进了千万家,数字普惠金融的号召也得到了确切地落实与发展。初始,普惠金融意在号召解决社会资源配置失衡问题 [1] ,让国内低收入群体享受到价格合理、有效的金融服务,通过普惠金融的全面推广,中国提前完成全面脱贫的伟大进程。现如今国内的经济发展进入了新发展阶段,因此我们对普惠金融的要求不能仅仅停留在普及这一层面,只有针对性地找准普惠金融的发展方向并落到实处,才能继续发挥普惠金融的意义,早日达到推进国内经济高质量发展,优化资源配置,促进全体人民富裕的新目标,为地区的区域经济发展带来切实的提升。
本文认为,对普惠金融这一政策是否得到了希望的深层次发展进行分析 [2] ,应当从普惠金融的使用深度入手,结合地区差异性,考虑到国家地域广阔且经济发展程度不一,将省份依据地理条件进行东西部划分,对普惠金融的使用深度指标进行靶向性剖析。有效探究东西部地区差异是否会对普惠金融使用深度带来影响,而反过来普惠金融的使用深度是否会影响到地区人均收入,加大居民对普惠金融的使用率是否会带来其他方面的经济提升。
2. 理论分析与研究假设
了解近年来普惠金融的相关文献可知,学者们对于普惠金融的研究多分布在普惠金融总指数的层面,从总指数的角度出发,研究普惠金融对居民消费、减缓农村贫困、促进创业等方面的研究。陈佩婷(2021)使用中介效应模型,基于西部12个省份的面板数据研究数字普惠金融发展对居民消费的影响。曹俊勇、张乐柱(2023)采用熵值法测度了2011~2020年中国31省市区域农村产业融合综合发展水平指数,又采用系统GMM方法和门限效应模型研究了数字普惠金融对农村产业融合发展的动态影响。祁好英、张明(2021)通过基础的回归模型,纵向比较了我国不同区域的普惠金融发展。谢绚丽、沈艳、张皓星、郭峰(2018)将普惠金融指数省与度量地区创业活跃度的新增企业注册信息创建固定效应模型,研究数字金融的发展和推广与企业创业之间的关系。万佳彧、周勤、肖义(2020)通过中介效应模型,实证检验了融资约束在数字金融与企业创新活动之间的中介效应并分析其影响效果。
随着数据金融与科技的普及,数字普惠金融的覆盖率得到了稳步的提升,同时也说明,单一考虑普惠金融指数与普惠金融的覆盖率 [3] 或总指数已经不能满足现阶段的经济分析,因此本文从普惠金融的使用深度入手,基于东西部的经济差异性,对比分析普惠金融使用深度与地区经济发展之间的关系。
3. 研究设计
3.1. 数据说明
本文收集了2010~2021年北大数字普惠金融指数数据与中国城市数据,由于倾向匹配得分模型其内涵是对样本进行一对一或一对多地匹配,因此对数据准确性要求较高。为保证结果的准确性,在数据预处理中,对数据进行逐年逐省份审查,对数据缺失仅一个的变量运用线性插值的方法进行数据填充。又由于原始样本数据量庞大,变量涉及面较广,存在部分变量缺失值较多的情况,因此对于这部分缺失值过多的样本数据,本文使用直接剔除的方法。
最终保留2014~2019年中国城市数据库数据,以该数据为基础 [4] ,如表1,从人力资源、市场需求、政府运营三个角度,对会影响到普惠金融使用深度的变量进行收录,共9个变量,且存在部分城市部分年份缺失的情况。结合北京大学数字普惠金融指数 [5] ,从宏观与微观两个层次收集了5个变量。

Table 1. Description of variables and indicators
表1. 变量与指标说明
3.2. 倾向匹配得分模型设定
分析东西部地区普惠金融使用深度的差异原因,需保证实验组与对照组之间控制变量的差异性尽可能地减小,而仅仅保留待分析的地区效应与结果变量之间的关系,更大程度地减少选择偏误的影响,倾向匹配得分(PSM)方法可以达到取消控制变量间差异的效果。
根据“被分析地区是否类属于东部地区”为标准 [6] ,设置新变量,属于东部地区的城市赋值为1,不属于东部地区的城市赋值为0。通过逻辑回归,以地区普惠金融发展深度为因变量,判断地区类属于东/西部地区作为匹配变量,其他各个可能影响到地区经济收入的变量作为控制变量。进行倾向匹配得分,即在给定协变量的情况下,计算因变量等于1的概率,如(1)式,等式右边为逻辑回归得到的各变量系数值,与观测值所对应的自变量进行对应相乘,将所求得的数值计算正态分布的累计分布,得到最终的取值即为倾向匹配得分值(下简称PS值)。
(1)
通过对样本的控制变量进行对比与划分,达到实验组与对照组样本的控制变量能够极为相似,更好的分析地区间差异是否影响到了普惠金融使用深度的水平发展,最终有效地结合地区经济,对普惠金融发展做出建议与评估。
基于得分对样本进行倾向匹配,考察普惠金融使用深度的二级指标变量的平均处理效应(ATT),用公式(2)表示。
(2)
其中,
表示属于东部城市的样本中,倾向得分为
的比率。而ATT表示对多维控制变量计算处置效应后,计算得到的以
为权重的加权平均值。
3.3. 变量定义
从政策效应、被解释变量与控制变量三个方向,除普惠金融使用深度因素以外,收集到可能影响区域经济的指标的变量类型较多。变量集见表1。
为考察变量之间是否具有相关性,首先对协变量进行相关性分析,可以得知部分变量之间存在极强的相关性,该情况可能造成数据冗余,进行倾向匹配得分时需匹配量过多,造成倾向匹配得分精度降低,导致结果存在较大误差。
为保证匹配倾向得分的准确性,在原始数据不变的基础上,对现有部分变量进行基本的精炼总结,并定义新的指标 [7] 。将“科学支出”与“教育支出”两变量进行相加合并,合并为政府的“科教类总支出”变量,文中表示符号为“sci_edu_spending”。
观察所有变量可见,对于单位非百分比的变量,其数值在不同省市之间数据涵盖范围较大,即数据差异较大,因而容易导致数据方差过大而具有异方差性;且不同变量间取值范围差异过大,易导致模型系数的估算结果不准确,为得到更为准确的逻辑回归模型,因此对“自然增长率”以外的变量进行对数处理,使数据更加符合方差稳定性的前提。
4. 实证分析
4.1. 基准回归优选变量组合
根据倾向匹配得分的步骤可知,倾向匹配的各变量PS值是根据逻辑回归的系数值而来。首先确定逻辑回归的因变量,将全国省市根据地理位置进行东西部划分,当省市所属于“东部城市”的时候,赋值为1,否则为0。影响经济因素的变量复杂繁多,而变量数的增加无疑增大了倾向匹配方法的难度,同时也降低了倾向匹配的准确性,因此对样本进行不同的组合形式,分别使用Logit模型进行基准回归 [8] [9] ,以对比选择出最优模型结果 [4] ,确定最佳的变量组合。得到结果表2。
由表2多种控制变量组合下的逻辑回归结果可见,被分析地区属于是东部地区的概率与自然增长率、第一产业从业人员比重、社会消费品零售总额、城乡居民储蓄年末余额呈显著或部分显著正相关关系;与科教类总支出呈显著负相关关系;与第二产业从业人员比重、第三产业从业人员比重、人均地区生产总值呈不相关关系。科教类总支出呈现显著负相关关系,根据现实情况进行分析,是由于一般情况下,在进行科教类费用支出后,较短时间内无法得到实质性的回报结果,因此从表面来看是对普惠金融发展深度造成了显著性的负向影响。
判断逻辑回归的优劣性,本文对四次回归模型计算AUC值,按照评判标准认为若0.5 < AUC < 1时,值越大越能说明逻辑回归有效,特别当模型AUC值大于0.7即可认为模型准确。在表1中,组合(1) (3) (4)模型的AUC值均大于0.7494,并且组合(4)的所有变量均呈现出显著性,因此认为组合(4)的逻辑回归效果最优,选择该组变量进行倾向匹配。

Table 2. Logit regression variable estimation results
表2. Logit回归变量估计结果
注:括号内表示检验t值,*、**、***分别表示10%%、5%与1%的显著性水平。
4.2. 倾向匹配效果对比
倾向匹配模型 [10] 的PS值衡量的是由于各省市的地理差异,造成地区间普惠金融的使用深度不同,将样本划分为两组进行逐一对比,衡量比较所属地理位置不同、但普惠金融值相似的省市之间,各个协变量数据之间的相似程度。为更直观地看出倾向匹配前后的地区间差异,对东部与西部城市的PS值作核密度图,如图1(a),图1(b)所示。
由倾向匹配前后地区PS值核密度图可以明显看出,匹配后的控制组与对照组之间的核密度图呈现了极强的同趋势性,且具有近乎完美的共同支撑域 [11] ,因此可以说此时的实验组与对照组已经略去了控制变量的影响。进一步观察各变量的匹配前后数据分布与变化情况。
进而比较样本匹配前后各个变量的标准差 [12] ,图2可以看出匹配后变量数据的标准差明显缩小,更紧密地分布在0值附近。这也更加证明了匹配后的样本,实验组与对照组的控制变量之间相似程度更小,本研究所建立的PSM模型是具有合理性的。
(a)
(b)
Figure 1. Comparison of kernel density distribution before and after tendency
图1. 倾向匹配前后核密度分布对比

Figure 2. Comparison of the standard deviation of control variables before and after matching
图2. 匹配前后控制变量标准差对比
为根据匹配倾向值(PS值)进一步观察匹配前后,实验组与对照组控制变量之间是否具有显著性差异,本文对变量进行t检验 [13] ,结果如表3。可以看出 [14] ,倾向匹配后的数据偏差都得到了大幅度降低,且匹配后各个变量的标准偏差明显变小,变量标准偏差均在10%以下。各个变量的T检验结果均为不显著,说明匹配后的数据在实验组和对照组之间不再存在系统性差异。可以说对变量进行倾向匹配得分后,实验组与对照组控制变量之间得到了很好的平行趋势结果。
分析表3倾向得分匹配平衡性检验 [15] 的结果,从匹配前的数据可以看出,对比东西部省市“自然增长率”这一变量均值,西部省市的自然增长率明显比东部省市高,而其余变量均为东部省市均值更高。可以说明西部城市经济相对落后,具体表现为西部省市的第一产业从业人员比例与社会消费品零售额明显少、城乡居民储蓄额低、科教类总支出略低,但在自然增长率上产生了积极效应,会相对来说更加注重生育,或死亡人口更少。因此可以考虑,若想降低东西部省市经济差异,可以从优先提高第一产业从业人员比例,利用活动与政策刺激居民消费入手。

Table 3. The propensity score matches the balance test result
表3. 倾向得分匹配平衡性检验结果
4.3. 效应分析
本文将所有控制变量划分为人力资源、市场需求、政府运作三大板块,详细分类见表1。各个地区会收到多方面因素影响,从而产生地区经济的发展差异性,因而影响普惠金融发展深度,最终造成在支付、保险、投资以及信用上的多方面影响,流程图见图3。

Figure 3. Flow chart of the impact of financial inclusion variables
图3. 普惠金融变量影响关系流程图
根据流程图,为详细分析本文中各地区控制变量对普惠金融发展深度各项指标的影响,结合前文的逻辑回归与倾向匹配得分结果,可以计算得到每一个结果变量产生的平均效应(ATT值) [16] [17] ,得到结果表4。

Table 4. Outcome variable effect analysis
表4. 结果变量效应分析
对于普惠金融深度下的各项衡量指标剖析结果如表4,重点考察每一个结果变量的平均效应(ATT值)结果,从检验T值的结果来看,根据PS值进行倾向匹配之后对支付、保险以及信用三方面指标具有统计学意义。对保险指标产生的ATT只在匹配前有意义,匹配后无意义。分析这一结果的出现是由于保险的发展虽然属于普惠金融的范畴,但该业务同时会受到环境、天气、个人因素的多方面影响,可以说是具有不可控性的。因此,我国东部地区对于普惠金融的建设在二级指标上总体产生了积极的正向效应,并且这一积极效应主要通过提高支付、投资以及信用方面的金融普惠,而达到加深普惠金融深度的作用效果,但对于保险类服务效果不明显。
5. 结论与政策启示
本文使用倾向匹配模型,对比东西部地区差异下的普惠金融使用深度影响,得到以下两点结论。
第一,分析东西部的普惠金融发展深度差异,可见与自然增长率、第一产业从业人员比重、社会消费品零售总额、城乡居民储蓄年末余额总体呈现了积极影响,因此建议地区发展加大对这几方面的促进与监管力度,增加发布类如人才引进、乡村农业发展、以及提升存储利率等相关普惠政策,督促企业、商场等开展销售活动,以提高社会消费品零售额。在第二、三产业从业人员比重与人均地区生产总值方面,均与东西部地区的普惠金融发展深度呈现不相关关系,因此可以先暂定这三方面的发展与普惠力度,将重心仍旧放在能够对普惠金融发展深度造成优势发展的变量中去。
第二,应当大力度注重普惠金融发展深度在支付、投资与信用这三方面的深度投入力度。根据数据结果,对于保险业务这一块具有较大的不可控性,因此可以将重心放在另外三个板块即可。在信用方面,普惠金融机构可以将目标重点放在引入大数据等技术手段,建立更加精准且全面的信用评估系统,收集好征信记录等工作,提高整体工作效率。在保险方面,普惠金融应当投发更深入、全面、个性化的保险保障。例如可以通过推广微型保险、共享保险等创新产品和服务,为广大中小微企业和个人提供深度保险服务的同时,还利用科技手段,如区块链、人工智能等,提高了保险产品的销售效率和理赔效率,降低保险行业的运营成本,进一步推动了保险市场的发展和普及。