1. 国内个人征信模型发展现状
国内首个征信机构为上世纪30年代的中华征信所,其现代意义上的个人征信从1998年萌芽启动至今只有不到20年的时间。2015年1月5日,央行发布《关于做好个人征信业务准备工作的通知》一文中同意八家社会机构为个人征信业务试点机构 [1] 。2016年7月17日朗迪金融科技峰会在上海举行,会上指出,世界前五大互联网金融机构中蚂蚁金服以市值600亿美元排名第一。2018年2月22日,央行公布百行征信有限公司的个人征信业务申请已获央行许可 [2] 。随着央行颁发首张个人征信牌照,个人征信业务也被各金融机构逐渐重视并迅猛发展。但由于发展时间较短,个人征信产业发展还较为混乱,更缺少针对于大学生的征信业务,以至于大学生难以在各金融机构中贷款,只能选择校园贷等不正规不合法的贷款软件或机构,从而造成许多贷款纠纷与问题。
2. 互联网信息下征信数据的特点
2.1. 八家征信机构的数据来源(见表1)

Table 1. Data sources of eight credit reporting agencies
表1. 八家征信机构的数据来源
2.2. 征信数据的特点
从以上八个机构的数据来源中可以看出,人们的网络行为多样,也因此提供了海量的相关信息,这些信息不仅能反映出用户的特质还能对用户的行为作出预测,因此分析用户的互联网行为能够帮助评估个人信用更加的公正。八个机构的分析数据普遍信息量大且参数众多,而且用户行为数据呈碎片化且实时动态变化。
网络行为信息是结构化的,但诸如音乐、图片等多媒体信息,尚未实现结构化,因为互联网行为产生的信息大多都是文本信息。虽然八大机构可以根据海量互联网数据进行行为分析,但是由于目前各征信机构尚未取得央行征信系统的准入接口,不能获取各级部门产生的如税务、工商等基本数据,同时,各征信机构之间互不相通,分割了市场的信息链 [4] 。
2.3. 大数据 + 人工智能 + 征信
大数据征信相关产品的设计,多从“横向”、“纵向”两个维度进行扩展。在横向扩展中,用户覆盖面广,其数据维度能够有效转化为结构化,同时对数据进行标签化、提升稳定性与时效性的设计,从而从多角度衡量用户行为,进行用户征信分析 [5] 。而在纵向扩展中,选取大数据模型导入历史交易记录,分析用户的历史交易行为特征。“大数据 + 征信”通过引入更多维度的数据,从而打破了各平台与征信机构数据互相隔离的现象,化解“数据孤岛”难题,为充分发挥大数据平台弹性计算的优势,实现数据共享的构想 [6] 。
“人工智能 + 征信”则扩展了金融创新与转型升级的应用空间。人工智能一方面可以通过金融前端为客户输送更精准实时便捷的服务,另一方面,在后端的信息安全、资产管理、资产评估以及反欺诈方面也持续发挥着重大作用。
因此,持续推进智能化的信用评价体系,进一步探索大数据处理与人工智能技术在征信方面的应用,将会使得征信数据成为各平台机构的核心竞争力 [7] 。
3. 基于互联网行为的大学生信用评价模型
3.1. 基于5C模型的网络行为识别
无论是社会行为还是网络行为,其都是在动机下产生的,只有当人们产生某种需求时,才会产生相应的动机。因此基于5C模型,我们将大学生的互联网行为进行归类(如表2)。

Table 2. Network identification based on 5C model
表2. 基于5C模型的网络识别
征信系统的组成部分:
1) 收集信息。包括静态信息与动态信息。静态信息如个人认证,学历认证等基本资料,而动态信息如网络购物、资产信息。这些信息都是即时更新的,随着行为的发生不断变化。
2) 处理信息。将收集来的信息转化为评估指标,在评估细则中获得其相应的分数,得到个人信用水平。
3) 使用信息。将所有收集处理的信息汇总,得到最终的个人信用分,将这些分数作为评估大学生信用的参考依据。
3.2. 应用AHP-模糊综合评价方法评估
3.2.1. 运用层次分析法确定指标权重
决策层与决策对象分为最高层、中间层和最低层。在确定各层次各因素之间的权重时,两两相互比较,对此时采用相对尺度,以尽可能减少性质不同的诸因素相互比较的困难,从而提高准确度。如对某
一准则,对其下的各方案进行两两对比,并按其重要性程度评定等级。即
。
对应于判断矩阵最大特征根
的特征向量,经归一化后记为W (即层次单排序),而确认W时,则需要进行一致性检验。其中,n阶一致阵的唯一非零特征根为n;n阶正互反阵A的最大特征根
,当且仅当
时,A为一致矩阵。由于 连续的依赖于aji,则
比n大的越多,A的不一致性越严重,一致性指标用CI计算,CI越小,说明一致性越大。用
数值的大小来衡量A的不一致程度。定义一
致性指标为:
,CI = 0,则说明有完全的一致性;CI接近于0,有满意的一致性;CI越大,不一致越严重。为衡量CI的大小,引入随机一致性指标
。一般情况下,矩阵阶数
越大,则出现一致性随机偏离的可能性也越大 [8] 。
以其中B1-C权重处理为例,采用几何中心平均值来处理多位专家的数据,平均后的部分数据不符合判断矩阵的数据规则,则处理为最为接近的符合要求的数值,具体结果如下所示:(见表3)
综上其具体确定的评估模型指标体系如下所示:(见表4)
3.2.2. 运用模糊综合评价对其进行定性定量指标的评定
确定定性指标时,将每种评定分为A~E五类,A类表示该项因素有助于用户履行信用责任,能够显著证明用户具有良好信用,B类为该项因素有助于用户履行信用责任,能够证明用户具有良好信用,C类是该项因素对于用户履行信用责任没有明显作用,D项表明该项因素不利于用户履行信用责任,证明用户存在信用风险,E项则为该项因素明显不利于用户履行信用责任,显著证明用户存在信用风险。
在定量指标中,由前面所写基于5c模型的分类下的各个评定信息,根据划分相应的区间给出相应分数,如一大学生绩点为3.7,属于80~90分区间,则将给予26~39区间中的分数,依此类推,最终得到最后个人评定总分。
3.2.3. 小结
使用AHP模糊综合评价的方法进行基于互联网用户行为的大学生信用评价是可行的,利用AHP两两比较出其因素的重要性,得到各层次因素的权重;利用模糊综合评价分析大量模糊性用户互联网行为,最大限度降低了主观因素带来的负面影响,比普通的评价体系更为科学。
4. 总结
网络用户行为与其他社会行为一样,都能够反映出用户的个人信息需求,当前的互联网技术及其应用形成了一个丰富的大数据环境,而这些数据足以支持个人征信体系数据的需求。采用AHP模糊综合评价法可以使构建的模型进行计算并得出评估结果,以相应指标为基础,借助1~9比例标度法以及专家分析获得判断矩阵,求得权重,再根据模糊综合评价做出多层级模糊综合评价。
运用数据可视化技术,透过大数据的视角,将用户由孤立的个体整合为由交易、投机关系组成的神经元信息网络图谱,于每一个网络节点中可以继续向下透视分解,从而实现智能化信用评价体系的构建。
互联网征信当下还处于起步阶段,只能借助以往的理论以及模型技术来发展自身,然而网络行为与社会行为仍然存在差异,这些差异将会影响评估结果的有效性,因此,必须加强对这一问题的持续研究。
NOTES
*共同为第一作者。
#通讯作者。