基于CatBoost模型的上市公司财务困境预测
Financial Distress Prediction of Listed Companies Based on CatBoost Model
DOI: 10.12677/AAM.2021.109306, PDF,   
作者: 张朋燕, 戴家佳:贵州大学数学与统计学院,贵州 贵阳
关键词: 变量筛选随机森林CatBoostXGBoost逻辑回归Variable Screening Random Forest CatBoost XGBoost Logistic Regression
摘要: 本文按照财务异常与财务正常的公司数量为1:2的比例选取了2019~2020年间63家被特殊处理的上市公司和126家财务正常的上市公司。从公司发展能力、经营能力、盈利能力、股本结构、人员变动等十个方面的51个变量中利用统计方法和随机森林方法筛选出17个重要变量,在此基础上首次运用CatBoost模型进行公司财务困境问题上进行建模和预测,并与之前学者经常使用的XGBoost、随机森林和逻辑回归这三种建模方法进行对比。实验结果显示CatBoost模型在特异性、准确率和AUC值方面都要优于其他三种模型,其中准确率达到了98.2%,在准确性方面要比近年广泛运用且预测效果较好的XGBoost模型高3.5%。
Abstract: According to the ratio of 1:2 between the number of abnormal and normal financial companies, this paper selects 63 specially treated listed companies and 126 normal financial listed companies from 2019 to 2020. From the 51 variables of the company’s development ability, operation ability, profitability, equity structure and personnel change, etc., 17 important variables are selected by using statistical method and random forest method. On this basis, CatBoost model is used to model and predict the company’s financial distress for the first time and it is compared with the three modeling methods of XGBoost, Random forest and Logistic regression that are often used by previous scholars. The experimental results show that CatBoost model is superior to the other three models in terms of specificity, accuracy and AUC value, of which the accuracy is 98.2%, which is 3.5% higher than XGBoost model, which is widely used in recent years and has good prediction effect.
文章引用:张朋燕, 戴家佳. 基于CatBoost模型的上市公司财务困境预测[J]. 应用数学进展, 2021, 10(9): 2923-2932. https://doi.org/10.12677/AAM.2021.109306

参考文献

[1] Daniel, M. (1977) Early Warning of Bank Failure: A Logit Regression Approach. Journal of Banking & Finance, 1, 249-276. [Google Scholar] [CrossRef
[2] Ohlson, J.A. (1980) Financial Ratios and the Probabilistic Prediction of Bankruptcy. Journal of Accounting Research, 18, 109-131. [Google Scholar] [CrossRef
[3] 邓晓岚, 王宗军, 李红侠, 杨忠诚. 非财务视角下的财务困境预警——对中国上市公司的实证研究[J]. 管理科学, 2006(3): 71-80.
[4] 刘可歆. 基于随机森林的互联网上市公司财务预警研究[D]: [硕士学位论文]. 天津: 天津财经大学, 2019.
[5] 苏玉敏. 基于随机森林与XGBoost的上市公司财务预警研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2019.
[6] 苗丰顺. 基于CatBoost算法的糖尿病预测方法[J]. 计算机系统应用, 2019, 28(9): 215-218.
[7] 王斌, 冯慧芬, 王芳, 等. 基于机器学习的CatBoost模型在预测重症手足口病中的应用[J]. 中国感染控制杂志, 2019, 18(1): 18-22.
[8] Altman, E.I. (1968) Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. The Journal of Finance, 23, 589-609. [Google Scholar] [CrossRef
[9] 王克敏, 姬美光. 基于财务与非财务指标的亏损公司财务预警研究——以公司ST为例[J]. 财经研究, 2006(7): 63-72.
[10] Platt, H. and Platt, M. (2002) Predicting Corporate Financial Distress: Reflections on Choice-Based Sample Bias. Journal of Economics and Finance, 26, 184-199. [Google Scholar] [CrossRef
[11] 马铭阳. 基于量子鸟群-人工神经网络的企业财务危机预警模型研究[D]: [硕士学位论文]. 大连: 东北财经大学, 2019.
[12] 吴世农, 卢贤义. 我国上市公司财务困境的预测模型研究[J]. 经济研究, 2001(6): 46-55.
[13] 田宝新, 王建琼. 基于财务与非财务要素的上市公司财务困境预警实证研究[J]. 金融评论, 2017, 9(5): 103-115, 126.
[14] 孙沛. 制造业上市公司财务危机预警研究[D]: [硕士学位论文]. 太原: 山西财经大学, 2019.
[15] 宋英瑞. 我国信息技术行业上市公司财务危机预警研究[D]: [硕士学位论文]. 武汉: 中南财经政法大学, 2019.
[16] 赵泽. 大数据背景下的M新能源公司财务危机预警研究[D]: [硕士学位论文]. 西安: 西安石油大学, 2020.
[17] 吴静. 基于集成算法的多分类财务危机预警[D]: [硕士学位论文]. 厦门: 厦门大学, 2019.
[18] 吴喜之, 张敏. 应用回归及分类——基于R与Python的实现[M]. 第2版. 北京: 中国人民大学出版社, 2020.