我国上市银行经营业绩影响因素分析
Analysis on the Factors Affecting the Operational Performance of China Listed Banks
摘要: 经营业绩体现银行经营活动所带来的财务状况和经营成果,它的主要依据是会计报表,例如,财务状况主要以资产负债表、现金流量表及相关附注为基础,经营成果主要以利润表等损益类报表及相关附注为基础。本文首先利用多元线性回归分析法建立银行经营业绩评价分析模型,然后对回归方程、回归系数进行检验,并对回归方程进行诊断,从实验结果可以看出在显著性水平0.05下,回归方程显著,但回归系数只有Χ1,Χ8显著,并且回归方程存在多重共线和异方差。因此,利用主成分回归对回归方程进行改进。利用主成分分析法选择4个综合指标(包含原始变量92.555%)代替原始变量,然后对这4个指标做回归分析,主成分回归方程的所有回归系数均显著,并且回归方程不存在多重共线性、异方差和自相关性。
Abstract: Operating performances reflect the financial status and operating results brought about by the bank’s operating activities. Its main basis is the accounting statements. For example, the financial status is mainly based on the balance sheet, the cash flow statement and related notes, and the operating results are mainly basedon the income statement, etc. profit and loss statements and related notes. In this paper, the multiple linear regression analysis method is used to establish the analysis model of bank business performance evaluation, and then the regression equation and regression coefficient are tested, and the regression equation is diagnosed. It can be seen from the experimental results that at the significance level of 0.05, the regression equation is significant, but the regression coefficient is only Χ18 significant, and the regression equation has multicollinearity and heteroscedasticity. Therefore, the regression equation is improved by using principal component regression. Use principal component analysis to select 4 comprehensive indicators (including 92.555% of the original variables) to replace the original variables, and then perform regression analysis on these 4 indicators, all regression coefficients of the principal component regression equation were significant, and the regression equation did not have multicollinearity, heteroscedasticity and autocorrelation.
文章引用:吕苏琪. 我国上市银行经营业绩影响因素分析[J]. 统计学与应用, 2022, 11(4): 747-759. https://doi.org/10.12677/SA.2022.114079

1. 引言

1.1. 研究背景

2020年以来,新冠肺炎疫情蔓延对各国经济形成巨大冲击,全球经济总体上已经陷入衰退,当前中国经济发展面临前所未有的挑战。国际形势严峻复杂,我国统筹疫情防控和经济社会发展,经济运行稳定恢复,成为全球唯一实现经济正增长的主要经济体,“三大攻坚战”取得决定性成就。各银行主动融入国家发展大局,始终保持战略定力,在这个极不平凡的年份取得了极不寻常的成绩。为应对疫情冲击,我国货币、财政、产业政策多管齐下,加大逆周期调节力度。随着防范化解金融风险和深化金融改革开放的各项措施深入推进,年初以来快速变化、错综复杂形势带来的问题和挑战得到有效应对。我国银行业整体运行稳健,风险可控,服务实体经济能力不断提升。截至2020年6月末,我国银行业境内总资产301.5万亿元,同比增长9.8%。上半年人民币贷款增加12.09万亿元,同比多增2.42万亿元。银行业金融机构主要经营和监管指标处于合理区间。银行业金融机构紧扣“六稳”“六保”要求,把稳企业保就业和服务民营、小微企业更好结合起来,全力以赴促进经济社会恢复正常循环,坚定不移推动经济高质量发展。但也必须看到,受新冠肺炎疫情等因素影响,在未来一段时期内不良资产上升压力、部分中小金融机构公司治理以及部分市场乱象有所反弹等潜在风险和挑战依然较大。在危机中育新机,于变局中开新局 [1] 。

金融在社会经济不断发展的过程中,尤其是当今这个通讯、信息高度发达的时代,重要程度尤为突出。在我国,银行在金融业占据主导地位。随着实体经济的转型,我国银行产业的分化越来越明显。近年来,银行业的门槛进一步降低,大量竞争对手涌入,进一步加剧了国内银行业所面临的竞争。我国银行业想实现可持续发展的目标,就必须进行客观分析,在评价自身经营状况的前提下,提升经营业绩。

1.2. 研究意义

业务情况、管理水平的高低、资本结构的完善程度以及抗风险的能力都将影响银行的利润。

随着金融业的不断发展,我国上市银行不仅面临国内银行业的竞争,还要面临外资金融业的巨大挑战。良好的经营业绩,不但关系到股东的切身利益,而且关系到商业银行的竞争与发展 [2] 。

业绩是一个公司自身盈利水平的保证,业绩的好坏会直接影响公司的发展,同时业绩好的公司也意味着其具备更高的发展潜力。因此本文对16家上市银行2020年的数据进行分析,建立回归分析,分析对银行业绩有影响的因素。

1.3. 国内外研究现状

曹晓俊选取13家上市银行2014年9月的有关财务指标,利用主成分分析法、因子分析法、聚类分析法分析我国银行业的发展状况,然后将13家银行分为高效益型、低效益型、潜在发展型银行,并根据三类银行的经营特点和存在的问题提出相应措施 [3] ;屈磊利用因子分析法比较我国5家国有商业银行的经营业绩,指出股权结构的多样化与银行的综合业绩有一定的关联,根据因子得分对五家商业银行的经营业绩进行排名 [4] ;古文浩利用层次分析法构造具体的评价模型和公式,再利用这个评价模型和公式分析具体的商业银行,通过合理的指标评分办法和权重分配来计算并分析银行经营业绩,并且从定性和定量两方面来考虑各个因素对银行业绩的影响 [5] ;杨建海利用指标评价分析法,根据对商业银行经营业绩的影响程度,将其分为基础性业绩和非基础性业绩,并将两者结合得到综合业绩,再建立上市银行的经营业绩评价体系,并且对上市银行和商业银行的评价体系进行比较分析 [6] ;孙红彦、吴书广、赵涛基于因子分析法对我国商业银行综合业绩进行评价,将盈利性、流动性和风险(安全)三方面纳入因子分析中,对我国商业银行经营业绩进行分析 [7] 。赵萍利用因子分析对我国25家上市银行经营业绩进行分析,并提出针对性意见 [8] 。冯红梅运用向量自回归模型客观评价互联网金融对商业银行经营业绩的短期和长期影响 [9] 。刘志颖运用聚类分析和判别分析对16家上市银行进行业绩上的分类,运用R型聚类分析对财务报表各个指标值进行分类研究,运用主成分分析对16家上市银行业绩进行排名和对比 [10] 。

1.4. 研究内容及创新点

为研究16家上市银行的经营业绩及影响因素,本文利用多元线性回归进行分析,但多元线性回归方程系数不显著,并且回归方程存在异方差和多重共线性,并且变量所解释的含义与实际意义相违背。因此利用主成分回归首先对数据进行降维,用4个综合指标代替原始指标,再对这四个指标做多元线性回归进行分析,此时所有系数通过显著性检验,并且方程不存在多重共线性、异方差和自相关性。

本文的创新点在于利用主成分回归法对模型进行改进,克服了多元线性回归模型的缺陷。

1.5. 指标选择

本文研究的是我国的16家上市银行2020年的经营业绩,数据来源于新浪财经网各银行2020年年报。各指标介绍见表1

Table 1. Introduction of indicators

表1. 指标介绍

2. 理论知识

2.1. 多元线性回归模型

2.1.1. 多元线性回归模型的一般形式

设随机变量Y 与一般变量 X 1 , X 2 , , X p 的线性回归模型为:

Y = β 0 + β 1 X 1 + β 2 X 2 + + β P X P + ε (2-1)

其中, β 0 , β 1 , , β p 是p + 1 个未知量, β 0 称为回归常数, β 1 , , β p 称为回归系数,Y称为被解释变量(因变量),而 X 1 , X 2 , , X p 是p个可以精确测量的一般变量,称为解释变量(自变量) [11] 。当 p = 1 时,(2-1)式即为一元线性回归模型,当 p 2 时,(2-1)式就称为多元线性回归模型, ε 是随机误差 [11] 。对随机误差的假定:

{ E ( ε ) = 0 var ( ε ) = σ 2

E ( Y ) = β 0 + β 1 X 1 + β 2 X 2 + + β P X P

为多元线性回归方程。要得到多元线性回归模型,首先要估计未知参数 β 0 , β 1 , , β p 。由于参数估计是基于样本数据的,由此得到的参数只是参数真值 β 0 , β 1 , , β p 的估计值,记为 β ^ 0 , β ^ 1 , , β ^ p [11] 。于是有

Y ^ = β ^ + β ^ 1 X 1 + β ^ 2 X 2 + + β ^ P X P

对于一个实际问题,如果获得n组观测数据 ( x i 1 , x i 2 , , x i p , y i ) ( i = 1 , 2 , , n ) ,则线性方程(2-1) 可以表示为:

{ y 1 = β 0 + β 1 x 11 + β 2 x 12 + + β p x 1 p + ε 1 y 2 = β 0 + β 1 x 21 + β 2 x 22 + + β p x 2 p + ε 2 y n = β 0 + β 1 x n 1 + β 2 x n 2 + + β p x n p + ε n

其矩阵形式为

y = X β + ε

其中,

y = [ y 1 y 2 y n ] X = [ 1 x 11 x 1 p 1 x 21 x 2 p 1 x n 1 x n p ] β = [ β 0 β 1 β p ] ε = [ ε 1 ε 2 ε n ]

2.1.2. 多元线性回归模型的基本假定

对回归方程(2-1)式有如下一些基本假定:

1) 所有解释变量之间互不相关 [11] 。

2) 随机误差项具有零均值和同方差,即

{ E ( ε i ) = 0 , i = 1 , 2 , , n C o v ( ε i , ε j ) = { σ 2 , i = j 0 , i j i , j = 1 , 2 , , n

这个假定常称为高斯–马尔科夫条件。

3) 正态分布的假定条件为

{ ε i ~ N ( 0 , σ 2 ) , i = 1 , 2 , , n ε 1 , ε 2 , , ε n

对于多元线性回归的矩阵形式(2-1)式,这个条件可以表示为

ε ~ N ( 0 , σ 2 I n )

随机向量y遵从n维正态分布,且

E ( y ) = X β var ( y ) = σ 2 I n

因此,

y ~ N ( X β , σ 2 I n )

2.2. 主成分回归

主成分的基本思想

主成分分析的基本思想是降维,在损失很少信息的前提下把多个指标利用正交旋转变化转化为几个综合指标的多元统计分析方法。通常把转化生成的指标成为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间不相关 [7] 。

设对某一事物的研究设及p个指标,分别用 X 1 , X 2 , , X p 表示,这p个指标构成的p为随机向量 X = ( X 1 , X 2 , , X p ) 。设随机向量 X 的均值为 μ ,协方差矩阵为 Σ [11] 。

X 进行线性变换,可以形成新的综合变量,用Y表示,也就是说新的综合指标可以由原来的变量线性表示,即满足下式:

{ Y 1 = μ 11 X 1 + μ 12 X 2 + + μ 1 p X p Y 2 = μ 21 X 1 + μ 22 X 2 + + μ 2 p X p Y P = μ P 1 X 1 + μ P 2 X 2 + + μ P p X p

由于可以任意的对原始变量进行上述线性变换,得到的综合变量Y的统计特性也不尽相同,因此为了取得较好的效果,我们总是希望 Y i = μ i X 的方差尽可能大且各 Y i 之间相互独立 [7] 。

3. 多元线性回归分析法

3.1. 建立回归方程

本文选取9个解释变量研究上市银行2020年的利润,解释变量为:X1 (营业收入)、X2 (每股收益)、X3 (净资产增长率)、X4 (股本报酬率)、X5 (不良贷款率)、X6 (股东权益比例)、X7 (业务及管理费用)、X8 (总资产净利润率)、X9 (净利润增长率)。本文选取2020年新浪财经网中我国16家上市银行2020年的数据,以银行净利润作为因变量,以如上9个变量作为因变量做多元线性回归分析。

由SPSS25.0得到如下结果:

Table 2. Analysis of variance table

表2. 方差分析表

表2方差分析表知,显著性即P值小于0.05 (本文的显著性水平取为0.05),则在显著性水平 α 下,y与 x 1 , x 2 , , x 9 有显著的线性关系,即回归方程显著。

Table 3. Regression equation coefficients

表3. 回归方程系数

表3回归方程系数可以得到,y对9个自变量的回归方程为:

y ^ = 92332.580 + 0.392 * x 1 + 6519.938 * x 2 514.734 * x 3 105.491 * x 4 + 5021.615 * x 5 + 3813.421 * x 6 0.238 * x 7 + 85032.367 * x 8 + 180.079 * x 9

由于自变量 x 1 , x 2 , , x 9 的量纲不相同,数据差异往往很大,不利于在同一标准上进行比较,因此为消除量纲和数量级的不同所带来的影响一般对数据进行标准化处理。则标准化的回归方程为:

y ^ * = 1.057 * x 1 * + 0.62 * x 2 * 0.031 * x 3 * 0.126 * x 4 * + 0.016 * x 5 * + 0.020 * x 6 * 0.158 * x 7 * + 0.151 * x 8 * + 0.018 * x 9 *

从标准化回归方程可以看出,对经营业绩影响最大的是营业收入( X 1 ),其次是业务及管理费用( X 7 )。且 x 1 , x 2 , x 5 , x 6 , x 8 , x 9 对银行经营业绩起正影响, x 3 , x 4 , x 7 对银行经营业绩起负影响。这与定性分析的结果不一致,可能是变量之间存在相关关系。

表3可以看出其中一些变量的回归系数的显著性检验不能通过,回归方程并不理想,因此对模型进行诊断和优化。

3.2. 回归方程的诊断

3.2.1. 多重共线性的诊断

由SPSS25.0得到如下结果:

Table 4. Collinearity diagnostics

表4. 共线性诊断

表4可以看出, X 1 , X 2 , X 4 , X 7 的方差扩大因子较大,分别为 VIF 1 = 55.764 VIF 2 = 71.398 VIF 4 = 75.793 VIF 7 = 44.487 ,大于10,说明回归方程存在多重共线性。

3.2.2. 异方差性的检验

Figure 1. Residual plot

图1. 残差图

以因变量回归值 y ^ 为横轴,以残差 e i 为纵轴画散点图记为残差图,由图1残差图可以看出,残差有扩张的趋势,不满足基本假设,从而可以判断模型存在异方差。

3.2.3. 自相关性的检验

Table 5. DW inspection

表5. DW检验

表5可以看出, DW = 1.754 ,自相关系数 ρ ^ = 1 1 2 DW = 0.123 接近于0,因此误差项可能不存在自相关性。

3.3. 回归方程的改进

为避免不同变量的量纲不同所产生的影响,先将数据标准化。

由SPSS25.0得到如下结果:

Table 6. Total variance explained

表6. 总方差解释

表6可以看出,特征值大于1的是前三个主成分,方差百分比反映主成分所能解释数据变异的比例,即包含原始数据的信息比例。前三个主成分累计包含了原始9个变量87.083%的信息量,前四个主成分累计包含了原始9个变量92.555%的信息量。

Table 7. Extract four common factors

表7. 提取四个公因子

表7可以看出,提取4个公因子时,每个变量的共同度更加接近1,说明提取4个公因子更合理。各个变量的信息损失都较小。

Table 8. Composition matrix

表8. 成分矩阵

表8成分矩阵的第i列的每个元素分别除以第i个特征值的平方根 λ i ,就得到主成分分析第i个主成分的系数。结果如下:

Table 9. Principal component coefficients

表9. 主成分系数

表9可以得到4个主成分的线性组合如下:

y 1 = 0.186 * x 1 * + 0.430 * x 2 * + 0.409 * x 3 * + 0.404 * x 4 * 0.44 * x 5 * 0.106 * x 6 * 0.166 * x 7 * + 0.348 * x 8 * + 0.311 * x 9 *

y 2 = 0.539 * x 1 * + 0.040 * x 2 * + 0.409 * x 3 * + 0.0002 * x 4 * + 0.071 * x 5 * + 0.458 * x 6 * + 0.546 * x 7 * + 0.393 * x 8 * + 0.203 * x 9 *

y 3 = 0.079 * x 1 * + 0.468 * x 2 * 0.364 * x 3 * + 0.538 * x 4 * + 0.299 * x 5 * + 0.252 * x 6 * 0.071 * x 7 * 0.010 * x 8 * 0.454 * x 9 *

y 4 = 0.285 * x 1 * 0.083 * x 2 * + 0.242 * x 3 * 0.003 * x 4 * + 0.244 * x 5 * + 0.713 * x 6 * 0.264 * x 7 * 0.269 * x 8 * + 0.378 * x 9 *

Table 10. Factor scores

表10. 因子得分

表10因子得分,可以通过因子得分的关系算的主成分得分。用主成分法做因子分析得到的第i个样本的因子得分为 f ( i ) = ( A A ) 1 A X ( i ) ( i = 1 , 2 , , n ) ,用主成分法得到的第i个样本的因子得分为 z ( i ) = U X ( i ) ,可以看到, z ( i k ) = λ k f ( i k ) ( i = 1 , 2 , , n ; k = 1 , 2 , , p ) 。因此可以得到前四个主成分的系数如下表11

Table 11. Principal component method principal component coefficients

表11. 主成分法主成分系数

y * 对前四个主成分prin1,prin2,prin3,prin4做普通最小二乘回归。

Table 12. Coefficients of principal component regression equation

表12. 主成分回归方程系数

表12可以得到主成分回归方程为:

y ^ * = 1.203 * 10 6 0.080 * prin 1 + 0.329 * prin 2 0.092 * prin 3 0.411 * prin 4

由从表12可以看出四个主成分的回归系数的显著性检验均通过,并且多重共线性诊断方差扩大因子VIF均为1,则不存在多重共线性。

Table 13. Regression equation test

表13. 回归方程检验

表13可知,此回归方程的样本决定系数 R 2 = 0.986 ,调整后的样本决定系数 R 2 = 0.981 。由调整后的决定系数来看,回归方程高度显著。且 DW = 2.026 ,查DW表, n = 16 k = 5 ,显著性水平 α = 0.05 ,得 d L = 0.74 d U = 1.93 ,由于 d U < 2.026 < 4 d U = 2.07 ,因而DW落入无自相关区域,因此误差项不存在自相关性。

分别用四个主成分prin1,prin2,prin3,prin4做因变量,以9个原始自变量为自变量做线性回归,得到:

prin 1 = 8.630 * 10 7 0.367 * x 1 + 0.848 * x 2 + 0.807 * x 3 + 0.796 * x 4 0.868 * x 5 0.209 * x 6 0.328 * x 7 + 0.686 * x 8 + 0.613 * x 9

prin 2 = 2.706 * 10 6 + 0.897 * x 1 + 0.067 * x 2 + 0.0004 * x 3 + 0.009 * x 4 + 0.025 * x 5 + 0.763 * x 6 + 0.909 * x 7 + 0.654 * x 8 + 0.338 * x 9

prin 3 = 6.091 * 10 7 0.085 * x 1 + 0.507 * x 2 0.375 * x 3 + 0.0.583 * x 4 + 0.324 * x 5 + 0.273 * x 6 0.077 * x 7 0.011 * x 8 0.492 * x 9

prin 4 = 7.894 * 10 7 0.200 * x 1 0.058 * x 2 + 0.170 * x 3 0.002 * x 4 + 0.171 * x 5 + 0.500 * x 6 0.185 * x 7 0.189 * x 8 + 0.265 * x 9

还原后的主成分回归方程为:

y ^ * = 1.191 * 10 9 + 0.415 * x 1 * 0.069 * x 2 * 0.100 * x 3 * 0.077 * x 4 * 0.022 * x 5 * + 0.037 * x 6 * + 0.408 * x 7 * + 0.239 * x 8 * 0.002 * x 9 *

由主成分回归方程可以看到,对经营业绩影响最大的是营业收入( X 1 ),其次是业务及管理费用( X 7 ),营业收入每增加1%,银行净利润平均增加0.415%,而业务及管理费用每增加1%,银行净利润平均增加0.408%。

4. 小结

本文通过建立多元线性回归模型,并且利用主成分回归对模型进项改进,可以看出对经营业绩影响最大的是营业收入( X 1 ),其次是业务及管理费用( X 7 ),营业收入每增加1%,银行净利润平均增加0.415%,而业务及管理费用每增加1%,银行净利润平均增加0.408%。

本文存在的不足:

1) x 1 , x 6 , x 7 , x 8 对银行净利起正影响, x 2 , x 3 , x 4 , x 5 , x 9 起负影响。这与定性分析的结果不一致,可能是主成分回归不适用于对该模型进行改进,或者样本量太小。

2) 指标选取的局限性,影响银行经营业绩的因素有很多,很多因素没有考虑在内。

3) 研究方法的单一性。

致谢

衷心感谢这一路师兄师姐给予我帮助,给我提意见,帮助我解决写作过程中遇到的各种问题,耐心讲解。感谢家人一路以来的支持和鼓励。感恩所有的相遇。

参考文献

[1] 中国银行业协会行业发展研究委员会. 2020年度中国银行业发展报告[M]. 北京: 中国金融出版社, 2020.
[2] 张平. 关于上市商业银行经营业绩的分析与对策研究[D]: [硕士学位论文]. 青岛: 中国海洋大学, 2007.
[3] 曹晓俊. 对我国上市银行经营业绩的分析——基于主成分分析、因子分析和聚类分析的方法[J]. 宿州学院学报, 2016(7): 25-29.
[4] 屈磊. 国有银行业绩分析[J]. 枣庄学院学报, 2012(5): 36-40.
[5] 古文浩. 我国商业银行经营业绩评价指标分析[D]: [硕士学位论文]. 上海: 东华大学, 2004.
[6] 杨建海. 我国商业银行业绩评价研究[D]: [硕士学位论文]. 苏州: 苏州大学, 2006.
[7] 孙红彦, 吴书广, 赵涛. 基于因子分析法的我国商业银行综合业绩评价[J]. 金融发展研究, 2010(2): 58-61.
[8] 赵萍. 我国上市银行经营业绩分析——基于因子分析的研究[J]. 金融经济: 下半月, 2018(4): 140-142.
[9] 冯红梅. 互联网金融对商业银行经营业绩影响分析[D]: [硕士学位论文]. 济南: 山东大学, 2018.
[10] 刘志颖. 2016年上市银行业绩的多元统计分析[J]. 中国市场, 2017(5): 63-64.
[11] 何晓群, 刘文卿. 应用回归分析[M]. 北京: 中国人民大学出版社, 2015.