1. 理论分析与研究假说
1.1. 互联网金融对银行零售业务盈利能力的影响
随着互联网金融的发展,现代互联网金融和现代互联网技术的结合,对传统的商业银行的零售业务产生了极大的影响。在对以往学者的研究进行总结的基础上,并与本文的研究问题相结合,笔者发现,互联网金融对商业银行及其零售业务的影响主要体现在三个维度。
一是“技术维度”,即技术层面上的推动作用。这意味着,迅速发展的信息技术会促使商业银行主动地进行金融创新,以零售金融产品与服务创新来提高金融服务的效率和品质 [1] 。
二是“产业维度”,即行业层面上,企业间的竞争力(Competition effect)。这意味着,互联网金融各种业务的发展和互联网金融的进入,将会使零售金融服务市场的市场结构发生变化,从而对传统商业银行的零售业务产生影响。
三是“融合维度”,即在不同维度的数据集上,研究其对数据集的“示范”作用。这是一种对互联网金融企业先进的技术、业务模式及服务理念进行学习和借鉴,对原有的业务模式及相关的产品与服务进行改良,进而达到对技术的改善和提高效率的目的。四是在整合的空间结构中,关联效应的影响。这就意味着,在互联网金融公司与商业银行之间,要有更多的合作,而商业银行则要继续与这些公司建立更多的业务关系,并要对这些公司进行更多的学习和学习。商业银行可以为互联网金融企业提供资金清算、划拨等支持,同时企业也可以为商业银行提供海量的客户流量、大数据、先进技术等支持 [2] 。
在上述分析的基础上,本文提出了研究假设H1,互联网金融对商业银行零售业务盈利能力的影响表现为U形,也就是在初期阶段,互联网金融企业与商业银行的竞争会在某种意义上,对银行零售业务的盈利能力造成了某种程度的削弱。但是,在后来阶段,伴随着与互联网金融的合作不断加深,并对信息技术的运用不断加深,从而促进了商业银行零售业务的盈利能力的提升。
1.2. 互联网金融对银行零售业务盈利能力影响的异质性
互联网金融对商业银行零售业务盈利能力影响的程度与商业银行自身的类型有很大的关系,即,互联网金融对不同类别的商业银行的影响有很大的差异,规模较大的商业银行对互联网金融的影响反映比较落后,而中小型商业银行对互联网金融的影响反应相对较快;这一点与中国银行业的特点、历史沿革以及中国银行业的监管体制有着密切的联系。国有企业所有权缺失、委托代理链条延长、政府隐性担保和“大而不倒”等因素,使得国有企业在面对市场竞争时表现出较低的抗风险能力 [3] 。大型商业银行规模庞大,管理层级较多,人员结构较为复杂,管理层级呈金字塔结构,因而在响应市场变化上信息传递滞后,在应对危机上反应较为迟钝。大型银行尤其是国有大行往往会出现委托代理冲突,缺乏足够的市场约束以及有效的激励措施,这些因素也会对它们对新技术的吸收与应用造成一定的阻碍 [4] 。
本文从理论上探讨了互联网金融对银行零售业务盈利能力的主要影响因素,并从实证上分析了影响银行发展的因素。与中小银行相比,它所受到的监管也要比中小银行更为严格。在体制机制、内部管理上,我国大型商业银行的体制机制都要逊色于中小银行,因此,它们对市场变化、市场竞争的反应要比中小银行慢得多。
在上述分析的基础上,本文提出了研究假设H2,互联网金融对商业银行零售业务盈利能力的影响呈现出了异质性,也就是随着商业银行的规模大小,互联网金融对银行零售业务盈利能力的影响也会呈现出一定的差异,国有大型商业银行对于互联网金融的影响会表现得更加的迟钝,而中小型商业银行对于互联网金融的影响会更加的灵活,也更加的敏感。
2. 研究设计
2.1. 模型设计
为验证假说H1,设计以下回归模型:
(1)
式(1)中,
为商业银行i在年份t的零售业务营业利润率,
为系数,
为年份t的互联网金融指数,
为系列控制变量。
为面板模型的个体固定效应,
为面板模型的随机误差项。考虑商业银行经营的持续性,方程中引入了商业银行零售业务利润率指标的一阶滞后变量
。根据理论剖析,预期的
回归系数显著为负,
的回归系数显著为正。
为验证假说H2,设计以下回归模型:
(2)
式(2)中,
为商业银行i的类型,当样本商业银行为大型商业银行时,K = 1,其他情况下K = 0。控制变量及其他变量与方程4.1相同。根据理论剖析,预期
的回归系数显著为正,
的回归系数显著为负。
因为方程(1)、(2)都含有被试的迟滞,所以所得到的经验方程很可能会产生横断面依赖和内生等问题。在此情况下,不适宜使用混合效应模型、固定效应模型以及随机效应模型等传统面板数据估计方法。传统的计量经济模型估计方法,例如:一般最小二乘法、工具变量法和极大似然法等,都存在着一定的局限。它的参数估计量对模型的约束比较多,当它需要满足某种假设条件时,它才具有良好的性质,并且估计结果会产生偏向。从这个角度来看,也是不合理的。与之相比,由Arellano and Bond (1991)所提出的差分一般矩法(Difference GMM)由于考虑了非平稳条件下的非平稳条件,使得该算法无需已知干扰项值的精确分布,且能够利用适当的工具变量来克服系统的内生特性,所得的模型与其它算法更接近于现实 [5] 。为此,我们使用差分高斯混合模型来解释这些变量间的相互联系。
2.2. 变量选择
2.2.1. 被解释变量
就目前的研究成果来看。总资产收益率(ROA)、净资产收益率(ROE)、营业利润率(OPM)、成本费用利润率(CPM)、市盈率(PE)和每股收益(EPS)等是衡量商业银行盈利能力的指标。针对上述问题,并在已有文献的基础上,本文选取我国商业银行的零售经营利润率(零售经营利润/零售经营收益)来度量我国商业银行的赢利性。为了保证研究的结果是可信的,选取了总资产回报率(ROA)作为相关的辅助代替指标,并对其进行了鲁棒性检验 [6] 。
2.2.2. 核心解释变量
本文以百度大数据为核心,通过对各大媒体词汇量的分析,采用文本分析等方法,建立互联网金融指数,利用百度检索指标对与互联网金融有关的关键字进行评价。拟在现有互联网检索数据的基础上,结合大数据的关联性和实时性,构建合适的财务信息度量模型。按照用户的检索渠道,百度的检索指标可以划分成PC检索指标(PC检索指标)和手机检索指标(手机检索指标) [7] 。为此,本文从语料的完整性与实用性出发,结合语料的特点,利用语料中的文本挖掘技术,弥补了目前语料中词汇数量定量分析的缺陷;我们将采用百度检索指数与每年的新闻数量来定量地衡量这些互联网金融的各项指标。这一步是这样做的:
首先,从三个主要维度出发,并参考以往的文献,从三个维度中筛选出19个关键字,构建了一个新的词汇体系(图1)。

Figure 1. Original lexicon of internet finance index variables
图1. 互联网金融指数变量的原始词库
其次,使用百度这个功能最强的搜索引擎,对与互联网金融相关的关键字进行词频检索,并将这些关键字进行定量化,将原来的词汇进行定量。文章中的关键字词频度来自两个领域。一是参考池荷(2023)、Ko (2020)等人(2022)的成果 [8] [9] ,使用百度搜索引擎的关键字作为每年一次的头条数指数。在此基础上,我们使用百度的媒体索引来替代百度的信息发表数,从而实现对其进行同质性比较。百度传媒指数是根据百度各个主要网络传媒所报导的与关键字有关的资讯,所收录的资讯,以含有关键字的资讯为依据,以资讯头条为指标;一种用来衡量一个单词在传媒中受到的注意。二是对百度检索结果进行检索,得到百度检索结果。然后对这两个指标进行加权,得到各指标的年词汇频率。
最后,运用因素分析方法对我国的财务指标进行了计算。因子分析法指的是以对指标相关矩阵内部的依赖关系为基础,将一些信息重叠、具有错综复杂关系的变量,归纳为少数几个相互独立的因子的一种多元统计分析方法。分为两个阶段 [10] 。
一是对以上19个关键字进行因素分析,以测度国内互联网金融总体发展态势;第一,对资料进行检查。根据三个维度下表征互联网金融的19个关键词的相关系数(图2)及KMO、Bartlett检验(表1)可以看出,相关系数基本上都是大于0.3的,这表明各个关键词之间有一个共同的因素,适合于因子分析。

Figure 2. Correlation coefficient table of key words in internet finance
图2. 互联网金融关键词相关系数表

Table 1. Relevant proxy variables of internet finance
表1. 互联网金融的相关代理变量
注:***、**和*分别表示在1%、5%、10%水平下显著。
第二个是抽取共同因素。运用了主成分分析法,对特征值大于1的公因子进行了提取,结果表明,公因子方差贡献率达到了89.44% (表2),可以更完整地、更直接地反映出原始信息。

Table 2. Total variance explained by internet finance explanation
表2. 互联网金融解释的总方差
提取方法:主成分分析。
第三是对各因素的评价。按照方差最大的原则,将荷载矩阵进行正交旋转,使用回归分析方法来估算因子的得分系数矩阵(表3)。

Table 3. Component score coefficient matrix
表3. 成分得分系数矩阵
注:提取方法为主成分法;旋转法为具有Kaiser标准化的正交旋转法。
第四项是综合指标。以因子得分作为加权,将公因子表达为原始变量的线性组合,并运用最大最小化处理,将数据标准化至0~1之间,最终获得了互联网金融指数(IFI) (表4)。
数据来源:作者根据文本挖掘法计算。
二是对每一维的关键字,进行因素分析,以衡量三维的发展程度(详细的方法与财务科技指标相同,结果同样列于表3)。
在使用以上文本挖掘方法并结合统计学相关方法所构建出来的互联网金融指数及三个维度指数每年走势具体如下:图3所示,其与我国互联网金融的发展趋势基本上是相符合的。伴随著资讯科技的迅速发展与国家的经济与社会的持续发展,互联网金融层出不穷,行业团体越来越多,行业间的竞争也越来越激烈;随着互联网金融与商业银行之间的合作越来越多,这也导致了整个互联网金融行业持续地向前发展 [11] 。2015~2022年,互联网金融指数呈现出了一种每年都在增长的趋势,这比较好地反应了现实情况。就三个维度而言,科技维度与工业维度的指数亦呈现出每年递增的趋势,符合现实状况。在2015~2018期间,互联网金融与商业银行等机构的融合维数总体呈现出增加的趋势,但是在此期间出现了一些起伏,这说明了商业银行与互联网金融机构等机构的协同发展经历了一个曲折的历程。从实际运作情况来看,早期的商业银行因为长期享受并习惯了垄断性地位带来的红利,会持续抗拒互联网金融的入侵,并且对互联网金融也会采用对抗的态度,因此,指数的波动是可以接受的。从研究的角度来看,2015~2018年,随着“互联网金融”这个词被学者们正式引入,“互联网金融”这个词也在近些年来逐渐被人们所接受,搜索到的关于互联网金融和互联网金融的信息并不多,平均每个月只有100条左右 [12] 。2019~2022年搜索引擎的热度直线上升,每个月的平均热度都超过了3600,这才造成了评分的起伏。所以,虽然在个别年度,融合维度指标存在一定的波动,但是总体来说,它还是呈现出了上升的趋势,它也能更好地反应出现实的情况。

Figure 3. Internet finance development index
图3. 互联网金融发展指数
据此,本文提出了以百度检索指标与百度媒介指标为基础的文本数据挖掘方法,所建立的财务科技指标体系具有一定的合理性,并能较好地反应财务科技在实际中的发展状况;用这种方法进行的经验研究是可以的。
2.2.3. 控制变量
本文拟选取反映我国宏观经济发展的GDP、反映货币政策弹性的广义货币供给(M2)、反映外资银行在中国外资银行总资产占其总资产比例(FBCs)、刻画银行微观结构的银行不良贷款率(RNPL)、银行资产负债率(ALR)等 [13] 。中国央行和国家统计局的官网,以及《中国统计年鉴》和《中国金融年鉴》的相关资料均来自于国家统计局和国家统计局的官网。
2.3. 研究样本
因为本文所要做的是对商业银行零售业务的业绩进行统计,从而保证了这些统计资料的真实性和现实性,因此,本课题选取了中国六大国有商业银行、中信银行等9大国有股份制银行和北京银行等18大都市商业银行作为研究对象。2015年至2022年,包括无锡商业银行在内的9家县域商业银行。以上资料均来自中国央行的官网及各大银行的年度报告及Wind财经数据库。在此基础上,对我国商业银行的零售额进行了统计分析。每个关键变量列于图4中。
3. 研究结果分析及稳健性检验
3.1. 变量平稳性检验
本项目拟采用Hadri检验、LLC检验、IPS检验、Fisher检验等方法,对我国各大银行的样本样本进行统计分析,以保证样本的平稳性,从而避免“伪回归”。研究发现,各商业银行零售业务的经营利润率、零售不良贷款率、资产负债率、总资产回报率等指标在显著性测试中都是稳定的(表5),对上述指标进行了统计,并未发现“伪回归”现象。

Table 5. Unit root test for commercial bank variables
表5. 商业银行变量的单位根检验
3.2. 互联网金融对银行零售业务盈利能力的影响
在表6中列出了H1假设的经验性研究结果。模型一和模型二是以商业银行的零售经营利润为被解释变量,对样本数据进行了比较分析。通过对两个模型进行实证研究,发现在两个模型中,各因素对迟滞项的影响均达到了明显的正值,这说明了我国商业银行在零售行业中的经营利润率的确是存在着一定的持续性。通过AR (2)检验和Sargan检验,发现统计量的P值都超过0.1,这说明干扰项差没有二阶自相关,工具变量的过度辨识问题也没有出现。由此可以看出,本文所建立的动力学模型是正确而高效的。
首先,在只考察互联网金融与银行业整体盈利能力之间的相关性的基础上,我们得到了互联网金融与银行业整体盈利能力之间的相关性,并得到其一次因子(IFI)与二次因子(IFI2)的正向与负向,并在1%的显著性检验下得到验证。上述研究证实了上述假设:在我国,我国的商业银行中,互联网金融水平与其零售利润水平呈“U”形正相关。然后,在模型2中添加了一个控制变项,研究发现,与互联网金融相关的各因素的正负相关关系并没有改变,这也验证了假设。在产业维度上,互联网金融会使商业银行的零售业务利润率下降,但是在融合维度上,伴随着商业银行和互联网金融的持续融合,银行对互联网金融的运用越来越广泛,因此,双方的合作共赢渐渐变成了一种常规模式;促进了利润率的上升。

Table 6. Empirical analysis of the impact of internet finance on commercial bank retail profitability
表6. 互联网金融对商业银行零售业务利润率影响的实证分析
注:回归系数下方括号内为标准误差;模型检验下方括号为P值;回归结果省略了常数项。
其次,对控制因素进行了回归分析,得到了与假设1和现有文献相吻合的结论。宏观经济发展水平(GDP)、外资银行进入(FBC)等因素系数在1%的水平下,是显著为正的,这说明经济发展水平、外资银行进入程度等与商业银行零售业务营业利润率之间有着非常明确的正相关。零售不良贷款率(RNPL)、资产负债率(ALR)等因70素系数在1%的水平下,均显著为正,这说明其与商业银行零售业务利润率呈现出明显的负相关,也就是零售贷款不良率越低、负债越少的商业银行,其零售营业利润率越高。
为了确保本文的稳健性,选取了总资产回报率(ROA),将其用作商业银行零售业务利润率的替代指标,来对其进行稳健性检验,其结果在表6的模型3、4中被列出。研究发现,在每个模型中,互联网金融的一次项(IFI)和二次项(IFI2)的系数,分别为负和二次项(IFI2)的系数,它们都通过了1%水平下的显著性检验,并且对控制变量的结果没有显著改变。稳健性测试又一次对假设进行了验证,结果显示,在变化的情况下,本论文的结果并不会产生偏差。
4. 结论
本文首先从三个维度综合剖析了互联网金融对我国商业银行零售利润的作用机制,并在此基础上提出两个假设。其次,对互联网金融指数进行度量,以百度检索指标为基础,以百度传媒指标为基础,利用文本挖掘法和因素分析法对互联网金融指数进行了构造,并对互联网金融指数进行了评价。第三,选取国内42家商业银行为研究对象,以学者们的研究结果为基础,设置被解释变量、解释变量、控制变量等,并构建经验公式。最后,与样本数据相结合,展开了一系列的实证研究,最终得到了如下的结论:
互联网金融对商业银行零售业务盈利能力的影响表现为U型特征,也就是在初期,互联网金融会在某种程度上对商业银行零售业务的盈利能力造成一定的削弱,但是在后来,伴随着与互联网金融的合作不断深化,两家公司逐渐朝着共同的方向发展。互联网金融将推动商业银行的零售利润恢复。互联网金融对商业银行零售业务的作用呈现出了一种异质性,也就是说,在各商业银行的经营范围内,互联网金融对商业银行零售业务盈利能力的作用存在着很大的差异,因此,在面对互联网金融的冲击时,国有大型商业银行表现出了更强的应变能力,并且也更加地敏感。