1. 引言
我国城市商业银行在营销方面的展业模式多为粗犷式的电话营销、渠道营销、网点营销等,针对很多非潜在客户通过大量重复电话营销等方式激发贷款需求,造成客户满意度的下降,对商业银行名誉有消极影响。晋京(2024)提出城市商业银行需要加快数字化转型,实现由以“人”为营销主导向以“数”为营销主导转变,赋能城市商业银行高质量发展[1]。故商业银行急需更为精准化的贷款营销方案。个人客户的哪些影响因素促使他们有意愿进行贷款?这些因素多大程度上影响了客户的贷款意愿?如何基于这些因素进行客户分级,以找寻重点营销客户?目前关于客户细分的研究主要集中在电子商务[2]、能源电力[3]、民航运输[4]、财富管理[5]等领域,而关于城市商业银行个人信贷客户细分的定量研究较少。
鉴于此,本文通过收集城市商业银行信贷客户各类相关数据,如客户基础信息、持卡消费记录及信用记录等,再加以建立客户贷款需求因子分析体系,量化特征因子对分类结果的影响程度,辅以聚类分析,最终实现对潜在客户的分层分类。
2. 研究设计
2.1. 样本选择与数据来源
本文以银联商务交易信息中城市商业银行的持卡客户作为研究样本,以此进行城市商业银行个人信贷客户的客户细分研究。为应对数据存在的明显偏差和缺失,采取了以下措施:删除了缺失大量数据的因素类型;删除了缺失大量类别信息的客户;删除类别重复或包含关系的因素。最终得到301组原始观测数据。在数据来源方面,本次研究数据均来自于阿里云天池数据集。
2.2. 指标选取
借款人在商业银行产生信贷业务期间,商业银行会收集借款人信息并制作借款人信贷台账。比如:借款人姓名,电话号码等基本信息;收入、房产、负债等资产负债信息;还有其他相关信息。结合本研究的实际情况,本文主要选取信息指标包括:年龄、是否有房、是否有孩、高消费标志、借记卡数量、贷记卡数量、近180天交易总笔数、近180天交易总金额、近180天内放款机构数量、近180天内放款总笔数、近180天放款总金额、近180天内还款机构数量、近180天内成功还款机构数量、近180天内还款笔数、近180天内成功还款笔数、近180天内申请贷款机构数量、近180天内成功申请贷款机构数量、近180天内申请贷款笔数、近180天内成功申请贷款笔数19项信息指标作为解释变量,将这19项信息指标分为身份信息及财产情况、持卡信息、交易信息、放款信息、还款信息和申请贷款信息。指标选取理由见表1。
Table 1. Personal credit customer information factor selection reasons
表1. 个人信贷客户信息因子选取理由
个人信贷客户信息因子 |
选取原因 |
年龄 |
个人信贷客户的不同年龄层次对于信贷需求一般有较大不同。 |
是否有房 |
房产对于个人信贷而言属于重要的资产凭证和不动产抵押物,对于信贷申请能否通过有一定影响,也代表潜在的房产需求。 |
是否有孩 |
是否有孩子代表了个人对母婴类、教育类的消费的潜在需求。 |
高消费标志 |
高消费标志代表个人的消费习惯和爱好是否有潜在的高金额需要。 |
借记卡数量 |
借记卡数量间接代表个人不同需求场景的现金用途、对不同银行的持卡需求或不定数量和额度的信贷需要(银行往往会将部分信贷产品捆绑于借记卡上)。 |
贷记卡数量 |
贷记卡数量即信用卡数量,代表个人对消费信贷类产品以及潜在需求程度以及一定程度的日常消费习惯。 |
近180天交易总笔数 |
持卡交易笔数反映了客户的资金活跃度。 |
近180天交易总金额 |
持卡交易总金额反映了客户的流水情况也一定程度上体现了客户的收入情况。 |
近180天内放款机构数量 |
代表个人客户使用不同银行信贷产品的频次,体现了此个人客户单家银行能否满足其贷款需要和对多样化贷款产品用款的需求。 |
近180天内放款总笔数 |
代表个人客户用信贷产品的频次,体现了此个人客户对信贷产品的潜在需求和依赖程度。 |
近180天放款总金额 |
反映了客户的负债金额情况。 |
近180天内还款机构数量 |
体现了个人信贷客户对不同银行机构信贷产品的还款意愿。 |
近180天内成功还款机构数量 |
体现了个人信贷客户对不同银行机构信贷产品的还款能力。 |
近180天内还款笔数 |
体现了个人信贷客户的还款习惯和意愿。 |
近180天内成功还款笔数 |
体现了个人信贷客户的还款能力。 |
近180天内申请贷款机构数量 |
体现了个人客户对不同银行信贷产品的需求。 |
近180天内成功申请贷款机构数量 |
代表信贷市场中银行机构对个人客户的认可度。成功申请贷款机构数量越多,代表此个人客户的受认可度越高。 |
近180天内申请贷款笔数 |
体现了个人客户对信贷产品的需求度。 |
近180天内成功申请贷款笔数 |
体现了单家或多家银行对该个人客户信贷资质的认可度。 |
鉴于本研究的方法属性,对非数值变量进行赋值。其中身份信息及财产情况中所涵盖的是否有房信息中无房或者未知赋值0,有房赋值1;是否有孩信息中无孩或者未知赋值0,有孩赋值1;高消费标志信息中无高消费或者未知赋值0,有高消费赋值1。
对于是否有车的指标,在经过旋转后因子成分矩阵的效度检验后,最高分值仅为0.291,低于通常标准0.4,不具有可靠性和稳定性,故不予纳入指标。对于其他指标,如客户收入水平、客户信用评级等,对于研究对象不具有普及性,不纳入指标体系。原因在于:本次研究对象包含已有贷款客户和未贷款客户,对于仅持有借记卡的未贷款客户,金融机构较难以获取相关数据。但本次研究通过其他一定程度上反映相关信息的指标进行分析阐述,如:客户交易信息。
2.3. 数据预处理
在选取的19项指标中,部分身份信息及财产情况属于非数值类变量,而持卡信息、放款信息、还款信息和申请放款信息属于数值类变量。为了数据标准化,使得分析结果具有客观性和有效性,本文通过SPSS27.0采用Z-score法进行数据标准化。Z-score标准化法,也称标准差标准化法,作为一种国际上比较通用的数据标准化方法,它通过计算数据的标准差和均值,将原始数据转换为标准化的Z-score分值。具体来说,Z-score标准化法的公式为:
(1)
其中,
为个体的观测值,
为总体数据的均值,
为总体数据的标准差。通过这个公式,可以将不同量级的数据转化为统一量度的Z-score分值进行比较,提高了数据可比性,从而消除量级影响。此外Z-score标准化法也具有简单易行、直观识别异常值等诸多优点。
2.4. 模型构建和分析步骤
因子分析主要是用较少的不相关的变量代替众多的原始变量,把原始变量中多余的或者高度相关的变量去除掉。因子分析法在解决问题时有很多种提取因子的方法,比较常用的一种是主成分法提取因子,即根据变量对方差的解释程度来不断地选择公因子,而且要保证公因子之间没有相关性,直到选择出的公因子的数目和原始数据中变量的个数相同。但是在实际应用时,几个公因子就基本能够解释绝大部分的方差变动,那么也就会用这几个公因子来替代原始变量[6]。
因子分析法的基本模型描述如下[7]:
是可以观测的随机向量,其均值向量
,协方差矩阵为
。
是不可测的向量,其均值向量
,协方差矩阵
,即向量的各分量是互相独立的。
与F相互独立,且
,e的协方差矩阵是对角阵,即e的各分量之同是独立的,那么:
(2.1)
(2.2)
∙∙∙
(2.3)
这里,m < p,且
,即F和e是不相关的。我们称F为X的公因子。a为因子载荷,就是第p个变量与第m个因子的相关系数,反映了第p个变量在第m个因子上的重要程度。a的绝对值越大,则X与F的相依程度就越大。最后一个步骤是计算因子得分,然后得出排序来进行综合评价。设公因子F由变量X表示的线性组合为:
其中:
(3)
这个公式称为因子得分函数,用于计算每个公因子的得分。但是由于得分函数中方程的个数小于变量的个数,所以无法得出精确的因子得分,只能对因子得分进行估计。
其次,使用K-means聚类分析前,需要找到参数K,即聚类的个数的最优取值。关于如何选择合适的K本文主要通过对比法选定。在选定了聚类个数K之后,第二步是在数据集中找到一个点作为初始的聚类中心。通常来说,初始聚类中心是随机选取的。第三步,对于数据集中的每一个数据、找到与其最为相似的聚类中心,并将其归入该聚类。第四步,当所有数据都被处理过之后,更新K个聚类的聚类中心。第三步和第四步是聚类算法的一次迭代过程。不停地选代这一过程,直到聚类中心不再变化或者达到一定的选代次数之后,就得到了K-means的聚类结果[8]。
3. 实证结果分析
3.1. 信度检验
在进行相关因子分析前,需要对量表进行信度检验,以确保分析结果的一致性和可靠性。经过对301组数据进行检验后,表2显示克隆巴赫Alpha值为0.820,大于通常标准0.7。这说明量表数据的一致性和可靠性较为优秀,分析结果有较高的可信度和参考度。
Table 2. Scale reliability statistics
表2. 量表可靠性统计
可靠性统计 |
克隆巴赫Alpha |
项数 |
0.820 |
19 |
3.2. 效度检验
本次因子效度检验采取KMO和巴特利特检验方法,如表3所示,KMO值为0.740,大于0.5,且巴特利特球形度检验的显著性为0.000,小于0.05,因此在95%的置信水平下拒绝原假设,变量间存在相关性,适合进行因子降维分析。
Table 3. KMO and Bartlett tests
表3. KMO和巴特利特检验
KMO和巴特利特检验 |
KMO取样适切性量数。 |
0.740 |
巴特利特球形度检验 |
近似卡方 |
5398.756 |
自由度 |
171 |
显著性 |
0.000 |
3.3. 公因子方差
表4为变量的公因子方差表,提取方法为主成分分析法。第1列变量名,第2列是初始解的变量共同度第3列提取表示最终的变量共同度,即因子降维后的公因子对最初变量的解释度。如年龄的提取共同度为0.665,表明七个公共因子共同解释了“年龄”这个变量方差的66.5%。
Table 4. Common factor variance
表4. 公因子方差
公因子方差 |
|
初始 |
提取 |
Zscore:年龄 |
1.000 |
0.665 |
Zscore:是否有房 |
1.000 |
0.552 |
Zscore:是否有孩 |
1.000 |
0.842 |
Zscore:高消费标志 |
1.000 |
0.627 |
Zscore:借记卡数量 |
1.000 |
0.671 |
Zscore:贷记卡数量 |
1.000 |
0.644 |
Zscore:近180天交易笔数 |
1.000 |
0.751 |
Zscore:近180天交易金额 |
1.000 |
0.817 |
Zscore:180天内放款机构数量 |
1.000 |
0.837 |
Zscore:180天内放款总金额 |
1.000 |
0.747 |
Zscore:180天内放款总笔数 |
1.000 |
0.829 |
Zscore:180天内还款机构数量 |
1.000 |
0.872 |
Zscore:180天内成功还款机构数量 |
1.000 |
0.831 |
Zscore:180天内还款笔数 |
1.000 |
0.679 |
Zscore:180天内成功还款笔数 |
1.000 |
0.763 |
Zscore:180天内申请贷款机构数量 |
1.000 |
0.948 |
Zscore:180天内成功申请贷款机构数量 |
1.000 |
0.947 |
Zscore:180天内申请贷款笔数 |
1.000 |
0.941 |
Zscore:180天内成功申请贷款笔数 |
1.000 |
0.943 |
提取方法:主成分分析法。 |
3.4. 提取公共因子
表5为变量的总方差解释结果表。特征值小于1的意味着此类公共因子解释能力不如最初的指标,特征值大于1说明此类公共因子解释能力优于最初的指标,数值越大表明解释能力越强。下表中第一个公共因子的特征值为6.440,方差贡献率33.894%,说明该公共因子可以解释原始评价指标中33.894%的信息,是7个公共因子中贡献率最大的一个因子,按特征值大小排序之后的7个因子的贡献率分别是10.845%、9.696%、6.588%、6.191%、5.840%、5.400%。这7个公共因子解释了所有原始指标信息的78.454%,对原始数据有较充分的概括,且7个公共因子的特征值均大于1,因此从19个指标中提取7个主因子。并且从图1因子分析碎石图可以看出,曲线在第7个公共因子后趋于平缓,也可以说明其存在7个公共因子。
Table 5. Total variance interpretation
表5. 总方差解释
总方差解释 |
成分 |
初始特征值 |
提取载荷平方和 |
旋转载荷平方和 |
总计 |
方差百分比 |
累积% |
总计 |
方差百分比 |
累积% |
总计 |
方差百分比 |
累积% |
1 |
6.440 |
33.894 |
33.894 |
6.440 |
33.894 |
33.894 |
4.170 |
21.949 |
21.949 |
2 |
2.061 |
10.845 |
44.740 |
2.061 |
10.845 |
44.740 |
3.191 |
16.794 |
38.743 |
3 |
1.842 |
9.696 |
54.436 |
1.842 |
9.696 |
54.436 |
1.964 |
10.336 |
49.079 |
4 |
1.252 |
6.588 |
61.024 |
1.252 |
6.588 |
61.024 |
1.888 |
9.935 |
59.013 |
5 |
1.176 |
6.191 |
67.215 |
1.176 |
6.191 |
67.215 |
1.405 |
7.395 |
66.408 |
6 |
1.110 |
5.840 |
73.054 |
1.110 |
5.840 |
73.054 |
1.242 |
6.536 |
72.944 |
7 |
1.026 |
5.400 |
78.454 |
1.026 |
5.400 |
78.454 |
1.047 |
5.510 |
78.454 |
8 |
0.837 |
4.405 |
82.859 |
|
|
|
|
|
|
9 |
0.791 |
4.165 |
87.023 |
|
|
|
|
|
|
10 |
0.656 |
3.452 |
90.475 |
|
|
|
|
|
|
11 |
0.565 |
2.973 |
93.448 |
|
|
|
|
|
|
12 |
0.350 |
1.842 |
95.290 |
|
|
|
|
|
|
13 |
0.286 |
1.505 |
96.796 |
|
|
|
|
|
|
14 |
0.234 |
1.231 |
98.027 |
|
|
|
|
|
|
15 |
0.173 |
0.908 |
98.935 |
|
|
|
|
|
|
16 |
0.139 |
0.730 |
99.665 |
|
|
|
|
|
|
17 |
0.047 |
0.246 |
99.911 |
|
|
|
|
|
|
18 |
0.014 |
0.075 |
99.986 |
|
|
|
|
|
|
19 |
0.003 |
0.014 |
100.000 |
|
|
|
|
|
|
提取方法:主成分分析法。 |
Figure 1. Scree plot
图1. 碎石图
3.5. 因子解释
继续采用最大方差法旋转,得到标准化变量对公因子的贡献程度,即每个公因子代表哪些变量。在效度检验下,对于绝对值低于0.4的得分进行了剔除处理,保留各项绝对值大于0.4的得分项,以保证分析结果的可靠性和稳定性。经由效度检验排除的因子变量已在上文2.2指标选取处予以阐述。
由表6可知,公因子F1在申请贷款笔数、成功申请贷款笔数、申请贷款机构数量和成功申请贷款机构数量上有较高的载荷,主要反映客户的信贷产品需求度,故称为客户信贷需求度因子。
公因子F2在放款机构笔数、放款总笔数、放款总金额上有较高的载荷,主要反映客户正常使用信贷产品的频次和机构数量,称其为客户负债因子。
公因子F3在交易总笔数、交易总金额和高消费标志上有较高的载荷,主要反映客户的资金活跃度情况,也一定程度上体现了客户的收入情况,称其为客户资金活跃度因子。
公因子F4在还款机构数量、还款笔数、成功还款机构数量和成功还款笔数上有较高的载荷,主要反映偿债能力情况,因此称为客户偿债能力因子。
公因子F5在借记卡持有量和是否有房上有较高载荷,因此称为客户资产因子。
公因子F6在年龄和贷记卡持有量上有较高载荷,因此称为客户信贷接受度因子。
公因子F7在是否有孩上有较高载荷,因此称为客户子女养育因子。
Table 6. The component matrix after rotation
表6. 旋转后的成分矩阵
旋转后的成分矩阵 |
标准化变量 |
F1 |
F2 |
F3 |
F4 |
F5 |
F6 |
F7 |
Zscore:180天内申请贷款笔数 |
0.941 |
|
|
|
|
|
|
Zscore:180天内申请贷款机构数量 |
0.938 |
|
|
|
|
|
|
Zscore:180天内成功申请贷款机构数量 |
0.934 |
|
|
|
|
|
|
Zscore:180天内成功申请贷款笔数 |
0.933 |
|
|
|
|
|
|
Zscore:180天内放款总笔数 |
|
0.862 |
|
|
|
|
|
Zscore:180天内放款总金额 |
|
0.842 |
|
|
|
|
|
Zscore:180天内放款机构数量 |
|
0.820 |
|
|
|
|
|
Zscore:近180天交易金额 |
|
|
0.878 |
|
|
|
|
Zscore:近180天交易笔数 |
|
|
0.858 |
|
|
|
|
Zscore:高消费标志 |
|
|
0.484 |
|
|
−0.458 |
−0.417 |
Zscore:180天内还款笔数 |
|
|
|
0.799 |
|
|
|
Zscore:180天内还款机构数量 |
0.405 |
0.483 |
|
0.663 |
|
|
|
Zscore:180天内成功还款笔数 |
|
0.500 |
|
0.605 |
|
|
|
Zscore:180天内成功还款机构数量 |
|
0.548 |
|
0.561 |
|
|
|
Zscore:借记卡数量 |
|
|
|
|
0.747 |
|
|
Zscore:是否有房 |
|
|
|
|
0.694 |
|
|
Zscore:年龄 |
|
|
|
|
|
0.790 |
|
Zscore:贷记卡数量 |
|
|
|
|
0.492 |
0.513 |
|
Zscore:是否有孩 |
|
|
|
|
|
|
0.891 |
提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 |
旋转在8次迭代后已收敛。 |
3.6. 客户因子得分
表7为各序列数据的7项公因子得分情况,表明了各客户在7项公因子上的分别得分情况,如:A001客户在公因子上得分为−0.605。下文中K-means聚类分析将基于301位客户在各公因子上的得分情况进行分析。
Table 7. Customer factor score coefficient matrix
表7. 客户因子得分系数矩阵
客户因子得分系数矩阵 |
客户序号 |
F1 |
F2 |
F3 |
F4 |
F5 |
F6 |
F7 |
A001 |
−0.605 |
−0.75 |
−0.354 |
−0.726 |
−1.147 |
0.728 |
−0.297 |
A002 |
−1.201 |
0.953 |
−0.433 |
−0.644 |
−0.578 |
0.831 |
−0.316 |
A003 |
1.13 |
1.329 |
0.12 |
−0.104 |
−0.175 |
−0.196 |
0.049 |
A004 |
−0.697 |
−0.662 |
−0.223 |
−0.716 |
−0.267 |
1.928 |
−0.387 |
A005 |
−0.498 |
1.681 |
−0.223 |
0.095 |
−0.952 |
−0.586 |
−0.027 |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
A297 |
0.953 |
−0.669 |
−0.372 |
−0.523 |
−0.655 |
−1.094 |
0.122 |
A298 |
−0.193 |
−0.602 |
−0.504 |
−0.59 |
−0.11 |
−0.236 |
0.062 |
A299 |
−0.931 |
−0.435 |
−0.496 |
−0.714 |
0.41 |
−1.081 |
−0.37 |
A300 |
0.063 |
1.034 |
−0.016 |
2.065 |
−0.131 |
0.357 |
0.167 |
A301 |
−0.77 |
−0.308 |
−0.202 |
−0.684 |
−0.175 |
0.196 |
−0.077 |
提取方法:主成分分析法。 旋转方法:凯撒正态化最大方差法。 |
3.7. 聚类分析过程及结果
Figure 2. Second order clustering model summary and profile measurement
图2. 二阶聚类模型概要和轮廓测量
聚类分析包括k-means聚类、系统聚类、二阶聚类等。系统聚类通常在样本量较少时使用,使用范围小于200组,基于本量表数据在301组,不适用于分层聚类。故本文采取k-means聚类和二阶聚类进行分析,根据效果,择优选择。
首先通过SPSS27.0,基于量表的19项原始变量和301组客户数据进行二阶聚类,如图2所示聚类结果的轮廓数值小于0.5,虽处于良好区间,但可靠性上仍有较大不足,故不采纳二阶聚类分析结果。
其次通过SPSS27.0软件,并基于表7中综合因子得分矩阵结果,对共计301组数据进行k-means聚类分析。通过对比法,并兼顾客户维护的便利性,在合理的K值中选取最小值。在k = 2时,第5、6、7聚类结果不显著,分别为0.117、0.154、0.361。在k = 3时,第1、6聚类结果不显著,分别为0.246、0.324。在k = 4时,第7聚类结果不显著,为0.068。在k = 5时,第5聚类结果不显著,为0.088。当选定K值为6时,表8中ANOVA分析显著性均小于0.02,小于通常的0.05的标准,说明在拒绝原假设的情况下,统计结果具有显著性。这说明7个方面的公因子对聚类结果均发挥作用,以下所得到的聚类结果具有一定可信度。
Table 8. ANOVA analysis
表8. ANOVA分析
ANOVA |
|
聚类 |
误差 |
F |
显著性 |
均方 |
自由度 |
均方 |
自由度 |
客户信贷需求度因子 |
35.082 |
5 |
0.422 |
295 |
83.064 |
0.000 |
客户负债因子 |
2.921 |
5 |
0.967 |
295 |
3.019 |
0.011 |
客户资金活跃度因子 |
34.559 |
5 |
0.431 |
295 |
80.147 |
0.000 |
客户偿债能力因子 |
23.152 |
5 |
0.625 |
295 |
37.069 |
0.000 |
客户资产因子 |
33.298 |
5 |
0.453 |
295 |
73.573 |
0.000 |
客户信贷接受度因子 |
6.834 |
5 |
0.901 |
295 |
7.584 |
0.000 |
客户子女养育因子 |
52.687 |
5 |
0.124 |
295 |
425.063 |
0.000 |
由于已选择聚类以使不同聚类中个案之间的差异最大化,因此F检验只应该用于描述目的。实测显著性水平并未因此进行修正,所以无法解释为针对“聚类平均值相等”这一假设的检验。 |
表9作为初始聚类中心矩阵,在经历11次迭代并收敛后生成表10最终聚类中心矩阵。
Table 9. Initial cluster center
表9. 初始聚类中心
初始聚类中心 |
公因子 |
第1聚类 |
第2聚类 |
第3聚类 |
第4聚类 |
第5聚类 |
第6聚类 |
客户信贷需求度因子 |
0.07267 |
6.15817 |
−0.27441 |
−0.23928 |
−0.63658 |
−1.24818 |
客户负债因子 |
0.07018 |
−1.14892 |
−0.61610 |
2.76673 |
−0.93333 |
−0.43680 |
客户资金活跃度因子 |
7.02814 |
0.07367 |
−0.89912 |
−0.37097 |
4.68131 |
−0.48377 |
客户偿债能力因子 |
−1.18002 |
1.69955 |
9.05895 |
−0.31417 |
−0.18946 |
0.40818 |
客户资产因子 |
0.14296 |
0.90990 |
1.17647 |
−0.42251 |
1.53325 |
5.55564 |
客户信贷接受度因子 |
−2.70737 |
1.40746 |
−1.89923 |
−1.26464 |
−0.92772 |
1.74689 |
客户子女养育因子 |
−2.22070 |
0.20875 |
−0.33385 |
0.08684 |
7.17497 |
0.21231 |
Table 10. Final clustering center
表10. 最终聚类中心
最终聚类中心 |
公因子 |
第1聚类 |
第2聚类 |
第3聚类 |
第4聚类 |
第5聚类 |
第6聚类 |
客户信贷需求度因子 |
−0.13483 |
1.64168 |
−0.62048 |
−0.38455 |
−0.11859 |
−0.22996 |
客户负债因子 |
−0.62340 |
0.08018 |
−1.13717 |
0.07056 |
−0.24769 |
−0.04852 |
客户资金活跃度因子 |
3.90509 |
−0.06760 |
−0.80947 |
−0.20452 |
1.23141 |
0.05202 |
客户偿债能力因子 |
−0.13855 |
0.05595 |
3.94163 |
−0.07204 |
−0.51466 |
−0.32996 |
客户资产因子 |
−0.20549 |
−0.26077 |
0.91382 |
−0.34666 |
0.14020 |
1.83144 |
客户信贷接受度因子 |
−1.37175 |
0.02452 |
−0.47285 |
0.01086 |
−0.99900 |
0.46759 |
客户子女养育因子 |
−1.66296 |
−0.03016 |
−0.14183 |
−0.04180 |
6.84057 |
−0.18020 |
从上表10可以看出第5聚类得分总和结果最高,达到6.33224,下面依次为第3聚类的1.67365、第6聚类的1.56241、第2聚类的1.4438、第1聚类的−0.23189、第4聚类的−0.96815。
将6类聚类结果,根据聚类得分总和高低进行排序,划分为高价值客户、重点保持客户、重点发展客户、重点挽留客户、一般价值客户和一般发展客户[9]。高价值客户为第5聚类,重点保持客户为第3聚类,重点发展客户为第6聚类,重点挽留客户为第2聚类,一般价值客户为第1聚类,一般发展客户为第4聚类。
从表10中可见,高价值客户主要体现在客户子女养育因子占据较高比重。说明这类客户子女养育的资金需求较大,同时资金流水也较多,属于重点营销对象。
重点保持客户主要体现在客户偿债能力上占据较大比重。这说明客户有较强的偿债能力和较好的偿债习惯,客户发生不良信贷的风险较小。同时此类客户有一定资产水平,需要重点关注营销,培养客户忠诚度。
重点发展客户主要体现在客户资产因子占比较大。这说明这类客户有较好的资产实力,同时对于信贷产品也有一定认可,但需求度不高。这说明此类客户资质较好,但需要进行一定的信贷需求挖掘工作,进行有针对性的营销。
重点挽留客户主要体现在客户信贷需求度占比较大。这说明对于银行信贷产品有较大需求,但存在资产情况一般以及消费水平保守的问题。此类客户需要一定频次下进行各类优惠促销或提供附加值的针对性营销,以促成召回客户。
一般价值客户主要表现在客户资金活跃度因子上有较大占比,但其他6类公因子得分水平都较低,说明这类客户的资金流水较大,消费较为频繁,但整体资质一般。此类客户对于信贷产品价格较为敏感,需要较高频次的优惠打折活动等进行一般性营销。
一般发展客户碍于资产情况较为一般,信贷需求度也较低,使得整体7类公因子得分水平较于其他5类聚类结果得分都较为一般。这说明此类客户与城市商业银行来往业务较少,需要对此类用户进行邀新营销,注重其体验感。
4. 总结与启示
4.1. 结论
本文基于城市商业银行个人持卡客户数据进行研究并得出如下结论:
1) 我国城市商业银行个人信贷客户需求的营销因素主要有:客户信贷需求度因子、客户负债因子、客户资金活跃度因子、客户偿债能力因子、客户资产因子、客户信贷接受度因子、客户子女养育因子。以上7个因素主要促成了个人客户信贷需求意愿。
2) 本文通过聚类分析方法筛选,最终利用K-means聚类对城市商业银行的客户人群进行划分成6类客户细分人群,同时总结了这6类客户细分人群的消费行为特点。高价值客户的子女养育资金需求和资金活跃度都较高;重点保持客户有较强的偿债能力,信贷违约风险小;重点发展客户群体有较好的资产水平,但总体消费和信贷需求保持稳健保守的风格;重点挽留客户有着较高的信贷需求度,但由于资产情况一般,整体消费较为保守;一般价值客户表现为有着最高的资金活跃度,但其他资质较为一般;一般发展客户表现为各方面的影响因子表现得都较为一般,与城市商业银行业务往来较少。这6类细分客户人群基本囊括了城市商业银行个人信贷业务的客户群体。
4.2. 启示
本文研究对城市商业银行个人信贷精准营销策略有一定的启示作用,基于上述分析,现给出如下建议:
1) 银行应实行信贷客户分级营销策略
营销成本投入需要做到高价值客户 > 重点保持客户 > 重点发展客户 > 重点挽留客户 > 一般价值客户 > 一般发展客户[10]。针对高价值客户、重点保持客户可提供专属信贷服务、对客户需求进行市场渠道搭建、附加服务等多层次方式彰显银行对此类客户的重视,增强客户黏性,培养忠诚度;针对重点发展客户可深入挖掘个性化的信贷需求,主要进行定制化的信贷营销,提高客户对信贷的认可度;重点挽留客户可提供定期较大力度的利率折扣券、高消费折扣、礼品赠送等等,以提高客户留存度;针对一般价值客户,可以通过高频的短信 + 电话方式提醒发放免息券、利率折扣券礼品赠送、日常消费打折等方式,形成客户认可度;针对一般发展客户,主要可以通过定期短信通知发放免息券、体验卡、免单券等多样体验服务增强客户对城市商业银行信贷产品的认知,给予新客户优惠,提升客户好感度[11]。
2) 银行应实施信贷产品差异化、主题化
高价值客户、重点保持客户注重定制化信贷产品服务,如:资金额度充足,审批流程快速,灵活的还款方式等等。在保证预定收益率前提下,尽可能为其提供利率灵活、额度灵活、可循环的贷款方案。重点发展客户有较好的资产水平,但信贷需求需要挖掘,可为其提供定制化的信贷优惠政策,如:高消费的相关信贷额度提升和利率优惠,以促进其消费。重点挽留客户方面,信贷需求较大,但由于资产水平一般,更为注重低利率、长周期等等。故可以为重点挽留客户提供较长周期的低息还款产品或者定期利率打折产品。一般价值客户的对贷款产品的价格敏感度往往较高,需要为其提供高频次、多样化的利率打折产品。一般发展客户由于对城市商业银行的了解不足,可以为其提供新客户专项的信贷产品[12]。
其次,通过和对应场景领域品牌、商家合作等模式搭建潜在消费场景模式,如:装修、母婴、教育、电子产品、日常消费等多种消费场景[13],针对不同客户细分群体发放不同额度、不同利率的个人信贷产品,帮助个人客户搭建和规划个人消费管理,同时“主题化”下的个人信贷产品也能降低银行风险管理难度,有益于银行对于资金去向的监管。
基金项目
国家自然科学基金项目(12371508)。
NOTES
*通讯作者。