基于BP神经网络的农业企业信用风险测度模型研究
Research on Credit Risk Measurement Model of Agricultural Enterprises Based on BP Neural Network
DOI: 10.12677/mm.2024.1412364, PDF, HTML, XML,    科研立项经费支持
作者: 陈雨秋*:仲恺农业工程学院经贸学院,广东 广州;梁凯豪:仲恺农业工程学院数学系,广东 广州
关键词: 农业信用风险BP神经网络二元回归Agricultural Credit Risk BP Neural Network Binary Regression
摘要: 随着近年来农业企业面临的复杂金融环境,如何测度农业企业的信用风险是成为了愈来愈重要的问题。本文旨在探索一种基于BP神经网络的农业企业信用风险测度模型,选取了2023年共316家财务数据健全且具有代表性的农业企业,选取了财务结构、偿债能力、盈利能力、运营效率四个一级大类指标的17个二级指标构建各农业企业信用风险评估指标体系。使用BP神经网络和SVM支持向量机进行二元回归,分别对比了XGBoost二元回归模型、分类树模型(DT)、朴素贝叶斯模型(NB)、随机森林(RF)回归模型。结果显示BP神经网络模型对于企业信用风险测度指标拥有更好的回归能力,且在性能和精度上优于其他模型。
Abstract: With the increasingly complex financial environment faced by agricultural enterprises in recent years, measuring the credit risk of agricultural enterprises has become an increasingly important issue. This paper aims to explore a credit risk measurement model for agricultural enterprises based on BP neural networks. A total of 316 financially sound and representative agricultural enterprises’ data from 2023 were selected, and a credit risk assessment index system for agricultural enterprises was constructed, consisting of 17 secondary indicators across four primary categories: financial structure, debt-paying ability, profitability, and operational efficiency. Binary regression was conducted using BP neural networks and SVM support vector machines, and compared with XGBoost binary regression model, Decision Tree (DT) model, Naive Bayes (NB) model, and Random Forest (RF) regression model. The results show that the BP neural network model has better regression capability for enterprise credit risk measurement indicators and outperforms other models in terms of performance and accuracy.
文章引用:陈雨秋, 梁凯豪. 基于BP神经网络的农业企业信用风险测度模型研究[J]. 现代管理, 2024, 14(12): 3033-3040. https://doi.org/10.12677/mm.2024.1412364

1. 引言

随着市场竞争的日益激烈和全球金融环境的不确定性加剧,农业企业正面临日趋严峻的经营环境。特别是,在经济波动频繁、气候变化等不确定性因素加剧的大背景下,农业企业的信用风险问题变得更加复杂且具有高度不确定性。不同于传统行业,农业企业受多种因素的综合影响,包括自然条件、市场价格波动、政策环境变化以及国际贸易冲突,这些因素的叠加使得农业企业的信用风险评估更具挑战性。此外,农业企业一般规模较小、资产流动性较低、抗风险能力有限,一旦遭遇资金链断裂或融资困难,将直接影响农业生产稳定性和农村经济的可持续发展。因此,在当前形势下,如何科学、客观、有效地评估和测度农业企业的信用风险,已经成为金融机构、监管部门乃至政策制定者所关注的核心问题。

现有的信用风险评估体系通常基于制造业、服务业等较为成熟的行业模型,未能充分考虑农业企业的独特特征和风险构成。这种“一刀切”的评估方法不仅在农业行业适用性较低,还可能导致风险评估偏差,无法准确反映农业企业的实际风险水平。农业企业的信用风险在本质上是一种多层次、多维度的风险,需要综合考虑企业的经营模式、生产周期、财务健康状况、市场环境及政策影响等多方面因素。因此,构建针对农业企业的专门信用风险评估体系,不仅可以提高风险评估的科学性和准确性,还有助于优化信贷资源配置,为金融机构降低农业信贷风险、实现资源的有效利用提供重要依据。

在这种背景下,本研究拟从农业企业信用风险的特征出发,系统分析影响信用风险的关键因素,构建一套适用于农业企业的信用风险评估模型。通过该模型,可以更加精确地揭示农业企业信用风险的结构特征和动态变化规律,为金融机构在授信决策和风险管理方面提供数据支持和理论参考。研究的重点章节将围绕农业企业的信用风险现状、影响因素分析、风险评估模型的构建与验证展开,以期为相关领域的学术研究和实务应用提供理论基础和实证依据。

2. 文献综述

在农业金融视角下,银行需全面考虑中小农业企业信用风险,以有效地遏制风险的传递和扩散[1]。农业企业信用风险测度有助于促进节点企业之间的资金合作,快速而准确地评估风险,对农业供应链的高效发展和农业生产的顺利进行至关重要[2]

杨军等[3]使用Logistic模型,针对农业类中小企业,运用因子分析方法有效预测了供应链金融信用风险。刘玎琳等[4]通过改进后的KMV模型,设定三种不同违约情况,对我国农业上市公司的信用风险进行了测度与比较研究,结果显示农业上市公司的资产价值普遍高于股权价值。鲁仕宝等[5]运用信用理论评估农业基础设施投资主体的信用风险,发现信用变化指数对转置矩阵具有重要影响,进而影响着信用等级的变化。王瑶等[6]利用CreditMetrics模型计算了某农业银行信贷数据的核心参数,并据此测算出该银行贷款组合的风险等级及其分布。李光荣[7]构建了农业供应链金融信用风险致因分析系统框架,通过结构方程模型系统反映了其影响因素。李延敏等[8]的研究发现KMV模型能够识别参与农村金融联结企业的信用风险,为评价金融联结中介的风险提供了新思路。汪小华[9]提出了完善农业供应链企业信用评价体系的措施,包括创新信用风险分散机制及建立信用风险的预警机制,以应对农业供应链金融信用风险。霍丽君等[10]以农业类上市公司为样本,利用Matlab技术检验了模型识别上市公司信用风险的能力,结果显示基于期权定价理论的KMV模型能够较好地度量我国农业类上市公司的信用风险。

传统的信用风险测度方法往往依赖于统计模型,其局限性在于无法全面考虑到各种风险因素之间的复杂关联以及动态变化。机器学习模型可以通过对大量数据的学习和分析,增强在非线性问题处理上的能力,农业企业信用风险测度模型可以通过结合机器学习模型提高对农业企业信用风险的预测准确性和稳健性。

Chen B等[11]提出了一种基于门控递归神经网络的新的端到端体系结构SMAGRU,该网络通过捕捉时间序列特征赋予市场基准权重,从而提高了企业信用评级的精度和收敛速度。Cai S等[12]使用数据挖掘技术建立了P2P网络借贷信用风险评估模型,并使用Lending Club (LC)数据进行了实证评估,结果表明决策树算法可以提高初步筛选的准确性,而二项式逻辑回归算法表现良好。Dastile X等[13]提出了一个指导性的机器学习框架,认为分类器集合比单个分类器表现更好,为深度学习模型在信用评级方面的应用指出了新的方向。

Tsai C等[14]比较了四种不同类型的混合模型,结果显示基于逻辑回归和神经网络相结合的“分类 + 分类”混合模型具有最高的预测精度和最大的利润。Shen F等[15]结合长短期记忆(LSTM)网络的深度学习集成分类方法,开发了自适应Boost (AdaBoost)算法来处理不平衡信用数据,实验结果表明集成模型通常比其他型号更具竞争力。Guo S等[16]提出了一种新的基于统计技术和机器学习技术的多级自适应分类器集成模型,具有更好的性能和数据适应性。Babaev D等[17]提出了一种基于深度学习方法的银行业零售客户信用评分新方法,实证结果显示此评价方法显著优于基线。Lai L [18]的研究结果表明AdaBoost模型可以准确预测贷款违约,优于其他模型。Götze T等[19]发现在考虑的模型中,随机森林表现出最高的预测性能,其次是线性回归模型和神经网络。

综上,众多学者在企业信用风险方面做出了相应研究。近年来随着数据科学的发展,神经网络算法在各领域得到了使用,在企业信用风险评估上也有广泛应用。因此,本研究旨在探索一种基于BP神经网络的农业企业信用风险测度模型,通过结合BP神经网络在非线性问题处理上的优势,提高对农业企业信用风险的预测鲁棒性。

3. 指标体系与算法模型

3.1. 指标体系

当前,针对农业企业信用风险的测度模型尚未有统一的指标,因此需要参考其他的研究成果,并根据农业企业的实际情况进行归纳总结,构建合适的农业企业信用风险评估体系。这个模型需要考虑到农业企业的特殊性以及金融信用风险的多样性。该体系和模型旨在评估农业企业的财务状况、经营业绩以及其他相关因素,从而全面把握其金融信用风险水平。

吕等[20]采用了涵盖财务结构类指标、偿债能力类指标、盈利能力类指标、运营效率类指标在内的4个一级指标的14个二级指标进行风险评估,在XGBoost预测模型中具有良好的预测精度。陈等[21]在其研究中也在模型中也采用了类似的一级指标与二级指标测度农业供应链企业信用风险,结果表明,二元Logistic模型适用于此农业供应链金融信用风险评估体系。

综上所述,在该指标体系中,考虑选取包含多个维度的指标,涵盖财务结构类指标、偿债能力类指标、盈利能力类指标、运营效率类指标在内的4个一级指标。

财务结构类指标指以包括资产负债表和利润表中的各项指标,本文选取了资产负债率、产权比率、流动负债/负债合计、流动资产/总资产、在内的4个二级指标。在偿债能力类指标的选取中,本文选取了流动比率、速动比率、金融性负债率、现金比率在内的4个二级指标。主要用于评估企业的偿债能力,即企业是否有足够的流动性资产来偿还其短期债务。在盈利能力类指标的选取中,本文考虑选择净资产收益率ROE (平均)、总资产净利率ROA、营业利润同比增长率、净利润同比增长率、销售净利率这5个指标,能够反映企业资产的利用效率和盈利水平。在运营效率类指标的选取中,可以考虑选择存货周转率、流动资产周转率、总资产周转率、固定资产周转率这4个指标。

这些指标可以作为农业企业金融信用风险测度指标体系中运营效率类指标的选择。所选取的4个一级指标和17个二级指标见表1

Table 1. Characteristic variables for selecting credit factor indicators of agricultural enterprises

1. 农业企业信用因子指标选取特征变量

一级指标

二级指标

指标描述

财务结构类指标

资产负债率(X1)

总负债/总资产

产权比率(X2)

净资产/总资产

流动负债/负债合计(X3)

用于评估企业短期偿债能力

流动资产/总资产(X4)

反映企业资产中可迅速变现的部分

偿债能力类指标

流动比率(X5)

流动资产/流动负债

速动比率(X6)

(流动资产 − 存货资产)/流动负债

金融性负债率(X7)

反映企业对金融杠杆的依赖程度

现金比率(X8)

现金及现金等价物占流动负债的比例

盈利能力类指标

净资产收益率ROE(平均)(X9)

净利润/平均净资产

总资产净利率ROA(X10)

净利润/总资产

营业利润同比增长率(X11)

企业营业利润在同一时期内的增长率

净利润同比增长率(X12)

企业净利润在同一时期内的增长率

销售净利率(X13)

净利润/销售收入

运营效率类指标

存货周转率(X14)

销售成本/平均存货余额

流动资产周转率(X15)

销售收入/平均流动资产

总资产周转率(X16)

销售收入/平均总资产

固定资产周转率(X17)

销售收入/平均固定资产

3.2. 算法说明

3.2.1. BP神经网络模型

反向传播算法(Backpropagation Algorithm)是一种用于训练神经网络的常见方法。其基本思想是通过梯度下降来最小化神经网络的损失函数。在反向传播算法中,通过计算损失函数对网络参数的梯度,然后利用梯度下降方法更新参数,从而逐步优化网络的性能。

对于 N=L 层神经网络,初始化权重矩阵 { W [ l ] |l{ 1,2,,L } } 和偏置向量 { b [ l ] |l{ 1,2,,L } } 为随机值。

对于给定的输入样本 x= [ x 1 , x 2 ,, x n ] T ,计算每一层的加权输入 Z [ l ] 和激活输出 A [ l1 ] ,有:

Z [ l ] = W [ l ] A [ l1 ] + b [ l ] (1)

A [ l ] =g( Z [ l ] ) (2)

其中 A [ l ] =g( Z [ l ] ) 为激活函数, Z [ l ] 是第l层的加权输入。

在使用损失函数 J=J( A [ L ] ,y ) 来评估网络的输出与实际标签之间的差距:其中 A [ L ] 是网络的输出,y是真实标签。

根据链式法则,需要计算损失函数对每个权重和偏置的偏导数(即梯度):

J W [ l ] = 1 m J Z [ l ] A [ l1 ]T (3)

J b [ l ] = 1 m i=1 m J Z [ l ]( i ) (4)

其中m为训练样本数量, J Z [ l ] 可以根据 Z [ l ] 和损失函数的形式计算得到。之后,利用梯度下降法更

新网络参数以减小损失函数:

W [ l ] = W [ l ] α J W [ l ] (5)

b [ l ] = b [ l ] α J b [ l ] (6)

其中, α 是学习率,用来控制参数更新的步长。重复上述步骤直到达到停止条件,例如达到最大迭代次数或损失函数收敛到满意的程度,使得神经网络逐渐学习到输入样本的特征与输出标签之间的映射关系,实现对网络参数的优化。

3.2.2. SVM支持向量机

SVM是一种监督学习算法,用于分类和回归分析。它的目标是找到一个最优的超平面,将数据集中的样本点分隔开来,同时最大化分类边界(或间隔)。对于二分类问题,SVM的决策函数可以表示为:

f( x )=sign( w T x+b ) (7)

其中, x= [ x 1 , x 2 ,, x n ] T 为一个特征向量的列向量, x 1 , x 2 ,, x n 为输入样本的特征值。

权重向量 w= [ ω 1 , ω 2 ,, ω n ] T 表示超平面的法向量。b为偏置项,sign为逻辑函数。SVM的训练过程可以通过最小化带有约束条件的目标函数来完成:

min w,b 1 2 w 2 +C i=1 m ξ i

Subject to y ( i ) ( w T x ( i ) +b )1 ξ i , ξ i 0,i=1,2,,m (8)

其中, | w | 2 是权重向量 x ( i ) = [ x 1 ( i ) , x 2 ( i ) ,, x n ( i ) ] T 的范数,C是正则化参数, x i ( i ) 是松弛变量,用于允许一些样本位于错误的一侧或在超平面附近。 y ( i ) { 1,1 } 是样本的真实标签, x ( i ) = [ x 1 ( i ) , x 2 ( i ) ,, x n ( i ) ] T 是输入样本,m是训练样本数量。

这个优化问题可以通过拉格朗日乘子法和KKT条件转换为对偶形式,并且可以通过求解对偶问题来找到最优的 w= [ ω 1 , ω 2 ,, ω n ] T b。对偶问题的解可以通过核函数(Kernel Function)来表示,使SVM在非线性数据集上也能有效工作。

4. 实证分析

4.1. 数据来源

由于上市公司违约样本数目较少,本文选取了2023年共316家财务数据健全且具有代表性的非上市与上市农业债券发行企业作为样本。其财务数据来源于RESSET数据库,通过数据库导出其是否有违约情况,若有记为1,反之为0。

4.2. 信用风险评估

4.2.1. BP神经网络信用风险评估模型

在BP神经网络的二元回归问题中,本文设置了以下参数并进行取值:由于所求企业数目较少,因此隐层节点数不宜过多,防止过拟合的发生,本文取值为10。本文的学习率取值0.1,激活函数取Sigmoid,训练迭代次数取值为100。

本文采用的评价指标为AUC、KS值和Accuracy值3个评价指标来衡量模型的评价效果。经实验结果表明BP神经网络的评价Accuracy值为93.62%,且AUC、KS值都为0.6818,说明在样本中有93.62%被正确归类,且AUC、KS值较为接近1,能够较好地捕捉具有债务风险的企业。

4.2.2. SVM支持向量机信用风险评估模型

在本文的SVM支持向量机信用风险评估模型选用了高斯核函数(RBF核),同时也选择了AUC、KS值和Accuracy值3个评价来评价回归结果。回归结果对比见表2,其中,Accuracy值为89.36%,AUC、KS值都为0.5,效果略逊于BP神经网络模型。

Table 2. Comparison of regression results between SVM and BP models

2. SVM与BP模型回归结果对比

模型

Accuracy值

AUC

KS值

SVM支持向量机

89.36%

0.5

0.5

BP神经网络

93.62%

0.6818

0.6818

4.2.3. 其他对比模型

本文选择了XGBoost二元回归模型、分类树模型(DT)、朴素贝叶斯模型(NB)、随机森林(RF)二元回归模型用作对比,从而选择更好的回归模型。其具体结果见表3

根据上表对比模型结果,分类树模型(DT)与随机森林(RF)的Accuracy值较高,说明预测准确率较好,然而AUC与KS值略逊于BP神经网络。AUC在模型中可作为衡量企业债务违约风险分类能力的参考指标,KS值在模型中可作为衡量模型二元预测能力的指标之一,越接近1则说明预测效果越好。通过以上

Table 3. Comparison of regression results of various models

3. 各模型回归结果对比

模型

Accuracy值

AUC

KS值

XGBoost二元回归

51.06%

0.681

0.681

分类树模型(DT)

89.36%

0.6326

0.6326

朴素贝叶斯模型(NB)

48.94%

0.7333

0.7333

随机森林(RF)

89.36%

/

/

模型对比,可以认为BP神经网络在评价农业企业信用风险方面表现良好。模型有相对较高的AUC与KS值,说明其有较高的区分度与较好的二元分类能力。这些指标组合能够综合说明BP神经网络模型对于农业企业信用风险的判断能力。

5. 结论

本文以2023年共316家农业企业为研究样本,试图构建一种农业企业的信用风险评估体系。首先,本文选取了包括财务结构类、偿债能力类、盈利能力类、运营效率类四个一级指标中的17个二级指标作为输入变量,将企业是否违约作为输出变量。

实证过程中的模型采用了SVM支持向量机和BP神经网络模型,在对比模型中分别采用了XGBoost二元回归模型、分类树模型(DT)、朴素贝叶斯模型(NB)和随机森林(RF)二元回归模型。结果表明,BP神经网络模型的总体准确率较其他模型高,验证了模型的有效性。这为农业企业信用风险评估体系提供了一种新的方法。

基金项目

广东省自然科学基金项目(2018A0303130136, 2017A030310650)、广东省科技计划项目(2015A070704059, 2015A030402008)、广东省教育厅项目(2020KZDZX1120)、省级乡村振兴战略专项(粤农计[2018] 51号)、大学生创新创业训练计划项目(202211347036)、广东省农产品保鲜物流共性技术创新团队(2023KJ145)、广州市科技计划项目(201704030131)、广东省高校特色创新项目(自然科学) (2018KTSCX094)资助。本论文是粤港澳大湾区农产品数字化物流研究中心的成果之一。

NOTES

*通讯作者。

参考文献

[1] 付玮琼. 供应链金融视角下中小农业企业信用风险预警及防范研究[J]. 贵州社会科学, 2020(4): 158-168.
[2] 孙中叶, 徐晓燕. 农业供应链金融风险评估研究——基于GA-BP神经网络模型[J]. 技术经济与管理研究, 2021(8): 78-82.
[3] 杨军, 房姿含. 供应链金融视角下农业中小企业融资模式及信用风险研究[J]. 农业技术经济, 2017(9): 95-104.
[4] 刘玎琳, 赵湘莲, 田月红. 基于KMV模型的农业上市公司信用风险测度研究[J]. 数学的实践与认识, 2014, 44(12): 32-39.
[5] 鲁仕宝, 黄强, 王义民, 等. 农业水利基础设施建设投资主体的信用风险评估[J]. 系统工程理论与实践, 2010, 30(7): 1299-1304.
[6] 王瑶, 罗剑朝. 农业银行信用风险实证研究[J]. 广东农业科学, 2010, 37(4): 377-379.
[7] 李光荣. 农业供应链金融信用风险致因研究: 系统框架与实证分析——来自黄河中上游五省区的780份调查数据[J]. 财经理论与实践, 2020, 41(3): 17-24.
[8] 李延敏, 章敏. 农业产业化龙头企业信用风险评价的改进——基于农村金融联结视角[J]. 农林经济管理学报, 2016, 15(5): 532-538.
[9] 汪小华. 农业供应链金融信用风险的评价及控制研究[J]. 农业经济, 2015(12): 110-111.
[10] 霍丽君, 宋瑞敏, 申卓明. KMV模型在农业上市公司信用风险度量中的应用[J]. 财会月刊, 2011(5): 56-58.
[11] Chen, B. and Long, S. (2020) A Novel End-to-End Corporate Credit Rating Model Based on Self-Attention Mechanism. IEEE Access, 8, 203876-203889.
https://doi.org/10.1109/access.2020.3036469
[12] Cai, S. and Zhang, J. (2020) Exploration of Credit Risk of P2P Platform Based on Data Mining Technology. Journal of Computational and Applied Mathematics, 372, Article ID: 112718.
https://doi.org/10.1016/j.cam.2020.112718
[13] Dastile, X., Celik, T. and Potsane, M. (2020) Statistical and Machine Learning Models in Credit Scoring: A Systematic Literature Survey. Applied Soft Computing, 91, Article ID: 106263.
https://doi.org/10.1016/j.asoc.2020.106263
[14] Tsai, C. and Chen, M. (2010) Credit Rating by Hybrid Machine Learning Techniques. Applied Soft Computing, 10, 374-380.
https://doi.org/10.1016/j.asoc.2009.08.003
[15] Shen, F., Zhao, X., Kou, G. and Alsaadi, F.E. (2021) A New Deep Learning Ensemble Credit Risk Evaluation Model with an Improved Synthetic Minority Oversampling Technique. Applied Soft Computing, 98, Article ID: 106852.
https://doi.org/10.1016/j.asoc.2020.106852
[16] Guo, S., He, H. and Huang, X. (2019) A Multi-Stage Self-Adaptive Classifier Ensemble Model with Application in Credit Scoring. IEEE Access, 7, 78549-78559.
https://doi.org/10.1109/access.2019.2922676
[17] Babaev, D., Savchenko, M., Tuzhilin, A. and Umerenkov, D. (2019) E.T.-RNN: Applying Deep Learning to Credit Loan Applications. Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, Anchorage, 4-8 August 2019, 2183-2190.
https://doi.org/10.1145/3292500.3330693
[18] Lai, L. (2020) Loan Default Prediction with Machine Learning Techniques. 2020 International Conference on Computer Communication and Network Security (CCNS), Xi’an, 21-23 August 2020, 5-9.
https://doi.org/10.1109/ccns50731.2020.00009
[19] Götze, T., Gürtler, M. and Witowski, E. (2020) Improving CAT Bond Pricing Models via Machine Learning. Journal of Asset Management, 21, 428-446.
https://doi.org/10.1057/s41260-020-00167-0
[20] 吕慧如, 吴凯诗, 吴宇章. 基于XGboost模型的农业供应链金融信用风险测度研究[J]. 科技和产业, 2024, 24(4): 63-67.
[21] 陈琪, 王洪生, 赵庆功. 农业供应链金融视角下核心企业信用风险实证研究[J]. 科技和产业, 2021, 21(9): 82-88.