1. 引言
当前经济高速稳步发展,应市场需要金融信贷产品不断创新,尤其是互联网带来的金融科技的变革,各种信贷新渠道新产品层出不穷。从生命周期角度来看,这种新产品和新渠道投产初期即为信贷产品的初创期,也有称为信贷产品冷启动阶段。根据巴塞尔协议三的相关标准,建立评分模型需要大量的历史数据。一般来说,样本容量越大,尤其是“坏客户”比重越大,所建立模型的精度或预测能力就越高,模型也越稳健。信贷产品初创期数据积累少,无法构建量化监督模型,这是信贷产品风险控制的一大难题。许多金融工作者认为信贷产品的经营是风险经营,在产品投产初期如何控制风险是亟待解决的首要问题。对于各大股份银行尤其是农商行、城商行等,以及互联网、消费金融、小贷等新兴助贷公司而言,大数据风控能力已经成为其开展信贷业务的核心竞争力。
不同金融机构都有各自的风险容忍度指标,并且由于地域、客户、政策、产品特性等差异影响,新产品不可能照搬套用其它机构或本机构其它产品的模型,因此难以建立统一标准的贷前申请评分模型。从宏观层面来看,随着金融体系不断完善,征信体系建设也越来越迫切,包括人行征信中心在内的各大征信机构都在积极探索社会征信体系建设,这对于金融机构控制风险是利好消息。这些信用评分目前已经在市场上受到金融机构的青睐,有些机构直接使用征信评分作为准入授信的依据。当然这些评分在数据、模型以及场景上都有其局限性,因此各机构仍然积极建设专属量化评分模型。
2. 文献综述
信用评分技术随着消费信贷产业的规模扩大在迅速发展,传统的信用评分主要依托专家法、描述统计、推断统计等技术,随着机器学习、AI、云计算等新科技的崛起,这些新技术在信用评分领域取得较好的应用效果。对于信贷产品信用风险建模的文献研究较多,本文依据信贷产品投产初期数据积累少的特点针对性进行文献梳理。
陈建 [1] ,李延东 [2] 介绍信用评分模型的发展历程,他们认为信用评分模型经历三个历史阶段,即以客户分类为核心的信用分析,以预测模型为核心的信用评分模型,以决策模型为核心的信用评分模型,并介绍信用评分模型种类。朱晓明等 [3] 等对信用评分领域大量的模型和方法以及相关文献做了细致的分类和综合比较, 包括多元判别分析模型、数学规划法、Logistic回归分析和神经网络模型等。邓亦洲等 [4] 梳理了信用风险的度量技术,包括应用背景、优缺点等,指出专家评分技术需要相当数量的信用分析人员,带有很大主观性、指标重要性排序不明确等缺点。现在风险度量模型主要运用新的量化分析方法、度量模型和管理策略。优点是精细化的计算信用风险的变化和损失值。缺点是难免存在误差。隐含假定为转移概率在商业周期不同阶段之间是稳定的。姜明辉等 [5] 对个人信用评分模型的发展进行了梳理总结,介绍个人信用评分模型由统计学方法到非参数方法、运筹学方法再到人工智能方法的演变,由单一模型到组合模型的演进过程,并指出各模型实际应用中的优势及局限性。石勇 [6] 介绍信用评分卡发展的3个阶段,对于第一阶段专家型数据评分卡,以客户细分和客户行为刻画为主要目的的构建分析方法。其次介绍了人行信用评分、1号店在线等第三方评分及应用场景。他认为各评分结构利用的数据仍然只是大数据中的一小部分,许多数据源特别是分散在网络空间的社会数据没有得到充分应用。
对于无历史数据积累,尤其是没有好坏客户样本时,学者们通过构建无监督模型量化客户的信用风险。丁明智 [7] 、王亮 [8] 、冯振涛等 [9] 基于AHP构建商业银行个人信用综合评价模型,所不同的是构建的指标体系有所差异。覃可彪 [10] 认为构建AHP的信用评估模型克服单个方面指标的不足,可以充分反映个人的综合情况,但是在利用该模型过程中,有可能出现由于某一项或几项指标特别突出而抬高综合评价指数,得出信用状态良好的错误结论。所以,综合评价指数不能作为个人信用的唯一判断依据,实际应用中还需借助其他的技术手段和相关的重要信息进行最后的确认。李建平等 [11] 提出一种基于主成分线性加权的综合评价的信用评分方法。并应用该方法与银行现有评分进行比较,实证检验显示有较好的应用前景,与现有银行评分标准对比的研究表明,方法具有明显优势,具有较低的误判率。牛学成 [12] 为克服风险量化评价指标权重、数据质量等问题,提出基于因子分析-聚类分析的模型,因子分析检验初始指标有效性、确定权重计算违约概率,聚类分析以信用评分为基础,对客户进行信用等级判别,实证分析模型准确率与建模样本近似,模型准确度量借款人信用风险。在信用风险管理初始阶段,可以采用本评估模型作为信用风险评估的基本模型。
郭瑛琰 [13] 指出商业银行开发个人信用评分时,存在数据不平衡、拒绝偏差、指标体系缺陷等问题,因此通用评分作为商业银行客户个人信誉评分的重要补充,增强商业银行个人信贷业务决策的科学性。通用化评分根据数据来源不同,可以分为信用局信用评分、行业信用评分。多杰 [14] 介绍第三方征信芝麻信用的构建思想,指出第三方征信在法律、客户授权、商业模式、评分模型等存在偏向性。在此基础上提出信息共享、严控准入等措施规范第三方征信问题。刘新海等 [15] 介绍美国大数据替代评分的进展,指出商业银行可以选择与信用风险强相关的大数据征信,搜集了包括社保、公积金、民事裁决与执行、公共事业和通讯缴费记录等作为补充。利用大数据或者是替代数据对大量的传统征信缺失的消费者进行信用评估,都更加迫切和符合实际。赵德慧 [16] 指出第一批8家征信机构各自推出了独具特色的个人信用评分,但各家征信机构主要根据自身数据得出一个信用分,通用性太差。随后说明人行征信的权威性和应用价值,包括在风险管理和精准营销的应用。
在市场实践中,国内外金融机构均在积极探索如何解决这一问题的新途径,很多金融机构已经运用统计方法或者其他策略来控制风险,但是并没有公布使用效果和具体操作流程。本文在文献综述基础上归纳出信贷产品初创期申请评分建模的几种方案,讨论其适用场景及优缺点,抛砖引玉,为信贷部门新产品投产初期信用风险度量提供解决思路。
3. 建模方法研究
来自多家银行的数据表明,信贷产品上线早期不采取量化模型,而仅仅依托经办人员和系统规则很难综合评估客户的信用风险,从而识别出高风险客户,因此随着时间窗口的扩大较早以前没有经过量化评分决策而准入的客群不良率普遍较高。针对产品初创期基本无数据积累的特点,可以考虑以下几种建模方案。
3.1. 类产品模型
在一个新的信用产品推广的初期,可以找到与之相类似的产品,用类似产品的样本建模在初期也是一个不错的选择。当然这需要金融部门有类似的产品和相应数据积累,这种方法的优点是只需要按照原有思路调整建模,缺点是难以保证相同产品客户结构的一致性,毕竟相同产品相同渠道产品几率较低,企业不会开发重复同类产品,当客群结构不一致时,模型也会失真,因此这种方法需要慎用。少数银行使用这种方法作为参考,但是并不作为主模型决策使用。
3.2. 伪风险模型
开放准入条件,允许一部分客户进来,客户数量要达到建立分类模型需要的最低样本量,但是“坏客户”还没有那么多,这时候可以考虑人工标注好坏样本,选择一些有丰富经验的信审人员挑选出坏客户,利用标记样本建立临时的监督模型。这种方法建立的模型准确率会存在偏向性,只可以作为初期模型,后期需要继续完善。这种模型的缺点是代价较高,要求企业能承担一定的风险;此外需要人工标记样本,这种方法存在一定的操作风险,因此很少有金融机构采用此方法建模。
3.3. 综合评价模型
综合评价方法是将多个指标通过数学变换转化成一个综合指标,重点在于评估指标体系设计和权重的确定。金融机构可以组织专家,也可以借鉴成熟评分卡的相关变量确定信用风险综合评价指标体系,然后选择综合评价方法层次分析法、因子分析、灰色综合评价方法、TOPSIS评价法、DEA、模糊数学方法等确定各指标的权重,加权计算出每个申请人的风险评分。这种方法的优点是操作简单,权重确定主要是从数据角度出发,并非主观确定。缺点是指标体系建设需要专家级的信审人员,现实中专家级人员往往不够多。
3.4. 相似度模型
相似度模型主要采用聚类算法,选择好特征,将好坏客户分成不同的群体,当然我们要基于一定假设,即我们选择的模型能区分好坏客户。这种方法比较粗糙,直接将坏客户作为异常样本识别出来。聚类分析按照业务规则进行判别,拟合正常行为的分布,寻找离正常数据分布较远的异常值数据。通过聚类分析可以助于我们分析用户的特点,查找各群体内的异常客户。
聚类分析的基本思想是根据样本的多个属性指标,寻找一个统计量度量样品之间的相似程度,以该统计量为分群的标准,将相似程度较大的样品聚为一类,把另一些相似程度较大的样品聚为另一类。关系密切的聚合到一个小的分类单位。关系疏远的聚合到一个大的分类单位,直到划分为合理的群体为止。
具体步骤是将样品分类,然后在每个聚类中寻找在某种意义上与该聚类中的大多数样品不同的样品。首先,通过快速聚类将样品进行初步归类,选择规模较大、群体相似度较高的群对应的种子(也就是选择聚类种子时剔出异常点);然后,以这些种子作为初始化的聚类种子对样品再次进行聚类,这样就将距离较远的群体或个体聚到每个大类下,再选出离质心距离较远的个体作为离群点。这一步往往只能依靠研究人员的经验和关键指标在不同类别上的显著性检验来确定。
3.5. 第三方通用评分
当前中国信贷市场高速发展,信用服务面临利好,市场化信用服务机构正通过各种方式解决数据问题,在推动数据共享的进程中,政府及各行业领头企业发挥着不可或缺的作用。从数据来源和特点看,第三方评分主要有以下几种。一是政府权威机构的信用服务,许多文献中定义为信用局评分,在我国主要是中国人民银行征信中心提供的征信报告,基本融合国内所有银行的信贷数据及政府数据,包括信用卡贷记卡信用记录和综合征信1000分,包括公积金、水电煤燃等公共信息;二是政府授权的征信服务机构,如首批获得个人征信牌照的八家征信金融机构,芝麻信用,前海征信、鹏元征信等,基本融合客户基本属性、行业特征等数据,形成的信用评分服务。此外还有行业巨头的征信服务,如电信旗下甜橙征信开发的甜橙分,中国联通的沃信用分,京东信用分等;三是市场上数据服务公司的信用服务,此类公司融合多渠道数据源形成的信用评分,比较知名的有同盾科技、百融金服等。
从目前使用覆盖率上看,人行征信分和芝麻信用分覆盖人群多,覆盖面广,是最受金融机构欢迎的第三方信用产品。直接用“通用化评分”对客户进行信用评级操作简单,但是需要一定的成本,由于数据孤岛的存在,不同评分都依托特定场景,行业或场景针对强。
4. 评分模型的迭代更新
就我国目前的状况而言,存在征信体系不够发达、消费信贷产品单一、消费信用分析专家还不多等问题,这些问题都会影响以上方案的有效性。因此金融机构可以根据选择使用多种方法综合控制信用风险,例如可以运用第通用评分和专家评分等构建融合模型或矩阵模型共同决策,通过相似度模型作为辅助模型识别出异常客户。其次,要基于跨行业联防联控理念,以客户提供信息为基础,利用海量数据和智能模型的关联分析,对申请人的风险倾向做出更多的信息评估,运用于授信和客户定价,为银行提供更精准的信贷决策方案。
信用评分模型的迭代更新伴随着产品的生命周期进行,产品使用的模型随着各阶段数据情况不断迭代出新的模型。产品成长期,有少量的标签样本,可以利用判别模型和生成模型之间形成对抗学习,实现两个神经网络模型的交互信息均衡,来部分解决建模样本不完备和不均衡的问题,提高对申请模型的识别能力。产品成熟期,“好、坏客户”量级达到最基本的建模要求(坏客户的数据至少需要800个),可以建立监督模型。具体做法是通过分析内部信息并引入外部信息等,衍生大量反映客户行为特征和资信能力的变量,并运用先进的数理统计技术整合各种变量信息,建立机器学习分类模型对客户的信用表现做出预测,作为决策的依据。信用评分模型迭代情况取决于产品各阶段数据积累程度,从最初的专家模型和无监督模型,到自学习、自适应学习、半监督学习和对抗学习模型,再到分类监督模型。在产品不同时期依据其数据质量和数量,数据广度和深度选择合适的模型,才能科学的规避金融机构的模型风险,降低客户的信用风险。
参考文献