基于代价敏感逻辑回归的电信客户流失预测研究
Research on Telecom Customer Churn Prediction Based on Cost-Sensitive Logistic Regression
DOI: 10.12677/CSA.2022.129211, PDF,    科研立项经费支持
作者: 彭 科*, 彭 龑:四川轻化工大学计算机科学与工程学院,四川 宜宾
关键词: 代价敏感学习逻辑回归算法数据挖掘客户流失预测Cost-Sensitive Learning Logistic Regression Algorithm Data Mining Customer Churn Prediction
摘要: 针对电信客户流失数据集的多维特征和不均衡问题,本文给出了一种基于代价敏感的逻辑回归的电信客户流失预测模型。通过对不平衡样本集分别采用不同权重调整,将代价敏感学习与传统分类算法相结合,建立基于逻辑回归的电信客户流失预测模型,最后对实际电信客户流失进行验证。通过与其他分类器模型的对比显示此方法在各种评估指标上均有更好的表现,更加符合电信业预测客户流失的实际情况。
Abstract: Aiming at the multi-dimensional characteristics and imbalance of the telecom customer churn dataset, this paper presents a cost-sensitive logistic regression-based prediction model for telecom customer churn. By adjusting the unbalanced sample sets with different weights, combining cost-sensitive learning with traditional classification algorithms, a logistic regression-based tele-communication customer churn prediction model is established, and finally the actual telecommunication customer churn is verified. The comparison with other classifier models shows that this method has better performance in various evaluation indicators, which is more in line with the actual situation of predicting customer churn in the telecom industry.
文章引用:彭科, 彭龑. 基于代价敏感逻辑回归的电信客户流失预测研究[J]. 计算机科学与应用, 2022, 12(9): 2084-2093. https://doi.org/10.12677/CSA.2022.129211

参考文献

[1] 张力. 基于代价敏感的XGBoost算法在电信用户流失预测中的应用[D]: [硕士学位论文]. 广州: 暨南大学, 2020.[CrossRef
[2] 蒋国瑞, 司学峰. 基于代价敏感SVM的电信客户流失预测研究[J]. 计算机应用研究, 2009, 26(2): 521-523.
[3] 王乐, 韩萌, 李小娟, 张妮, 程浩东. 不平衡数据集分类方法综述[J]. 计算机工程与应用, 2021, 57(22): 42-52.
[4] 李赵飞. 基于代价敏感AdaBoost的贷款违约风险预测研究[D]: [硕士学位论文]. 南昌: 江西财经大学, 2021.[CrossRef
[5] 叶科挺. 基于代价敏感支持向量机与随机森林的个人信用风险评估研究[D]: [硕士学位论文]. 广州: 暨南大学, 2021.[CrossRef
[6] 冀慧杰, 倪枫, 刘姜, 陆祺灵, 张旭阳, 阙中力. 基于XGB-BFS特征选择算法的电信客户流失预测[J]. 计算机技术与发展, 2021, 31(5): 21-25.
[7] 刘定祥, 乔少杰, 张永清, 韩楠, 魏军林, 张榕珂, 黄萍. 不平衡分类的数据采样方法综述[J]. 重庆理工大学学报(自然科学), 2019, 33(7): 102-112.
[8] 向鸿鑫, 杨云. 不平衡数据挖掘方法综述[J]. 计算机工程与应用, 2019, 55(4): 1-16.
[9] 王学玲, 王建林. 基于代价敏感的AdaBoost算法改进[J]. 计算机应用与软件, 2013, 30(10): 123-125+138.
[10] 谷琼, 袁磊, 熊启军, 宁彬, 李文新. 基于非均衡数据集的代价敏感学习算法比较研究[J]. 微电子学与计算机, 2011, 28(8): 146-149+153. [Google Scholar] [CrossRef
[11] 万毅斌, 王绍宇, 秦彦霞. 基于代价敏感加权支持向量机的员工离职分类预测[J]. 智能计算机与应用, 2021, 11(12): 43-46+53.
[12] 张三妞, 张智斌. 基于改进粒子群的随机森林优化算法客户流失预测研究[J]. 现代信息科技, 2021, 5(22): 75-78. [Google Scholar] [CrossRef