1. 引言
交通运输事业是国民经济的大动脉和先行官,历来被视作党和国家工作的重中之重。2019年,中共中央、国务院印发《交通强国建设纲要》,将交通强国提升为国家重要发展战略,正式开启了中国智慧交通新时代。这一战略不仅为中国车险业务带来了历史性的发展机遇,也提出了前所未有的挑战。自1979年复业以来,中国车险业务经历了多次改革,但其商业模式尚未实现根本性变革[1]。保险条款内容、精算定价逻辑、防灾防损机制和市场进出机制等核心要素仍停留在三四十年前,难以有效满足智慧交通新时代的风险保障需求。车险经营模式的变革已迫在眉睫。
目前,车险定价和客户画像研究主要基于过去的理赔数据。未来在车联网时代,将更加关注驾驶员的行为因素,如驾驶时间、路线、急刹车和急加速等行为对风险的影响[2]。车险定价将逐步过渡到基于车联网的精准营销和定价阶段。
提升经济社会的网络化、数字化、智能化水平,加快经济发展与治理模式重构,是新型经济形态的要求[3]。产业数字化,即利用数字技术提高传统产业的产出和效率,包括车联网、两化融合、工业互联网、智能制造、平台经济等新型产业、新模式和新业态。如今,人工智能和大数据分析的高速发展正在变革保险公司的传统业务方法和运营管理模式,并逐步提升行业结构。车联网与保险业务的结合,是保险科技的前沿领域。传统的车险价格模型和用户画像建立方法主要依赖于司机性别、年龄、车型、事故次数等因素[4],而大数据技术可以将历史数据与实时数据相结合,扩展到整个系统。
保险公司通过互联网大数据获取的驾驶数据来评估保险费率,可以降低理赔成本,提高驾驶安全性。“车联网 + 车险”作为信息化、工业化与保险行业的深度融合领域,对于促进保险行业的创新发展具有重要意义。在多数车险公司经营困难的背景下,更需要推进“车联网 + 车险”的融合发展[4],寻找车险发展的新突破和新机遇。
完善的客户信息画像是深度挖掘客户信息的基础工程,有助于保险公司全面分析客户需求,实现智能化营销,提升获客率和客户留存率,增强产品设计的竞争力和科学性,并定量分析业务经营各环节的风险点。信用信息画像是构建客户信息画像的重要组成部分,对构建智能化业管和风控系统具有重要意义。通过基于车联网获取的驾驶数据进行客户画像分析,可以更精准地评估驾驶风险,不仅能够形成差异化的营销策略,丰富车险产品线,还能提供差异化的客户服务,提升用户体验。对社会而言,利用车联网进行监测,既能降低道路安全隐患,又能对生态环境产生积极影响,实现社会共赢[5]。
在数据技术的推动下,包括信用信息在内的客户信息画像将成为保险公司适应新常态、谋求新发展的重要基础和有力推手。传统的车险定价模式往往基于一些静态因素,如驾驶员的年龄、性别、驾驶经验以及历史出险记录等,这些因素虽然在一定程度上能够反映驾驶员的风险水平,但它们无法全面捕捉到驾驶行为的动态变化。为了解决这一问题,本文首先对车联网车险的发展现状进行梳理,并分析了客户画像构建中常用的技术手段。通过这些理论支撑,本文进一步探讨了如何利用车联网技术获取的驾驶行为数据,运用K-means聚类算法对客户进行更为细致的分类。这种基于行为数据的动态分析,能够更准确地评估每位驾驶员的风险水平,从而为车险费率的厘定提供更为科学的依据。
本文的研究不仅关注于技术层面的创新,更着眼于车险行业的长远发展。通过基于车联网的客户画像分析,保险公司能够为不同的客户提供更加个性化的车险产品,这不仅能够满足客户的个性化需求,提升客户黏性,也能够更好地控制风险,实现保险公司的可持续发展。
2. 数据来源与研究设计
2.1. 数据来源
本研究的数据来源于北京车网互联科技有限公司,采集某市200名驾驶员的驾驶行为信息,其中女性驾驶员76人,男性驾驶员124名,年龄为20~60岁,平均年龄42岁;本研究选取驾驶员一年来的驾驶数据[6],数据包括年度行驶千公里数、方向角、百公里平均速度、超速次数(时速大于120 km/h且超过10%以上)、急加速及急减速次数、总驾驶评分。
2.2. 指标体系
2.2.1. 传统车险客户画像指标体系
传统车险客户画像往往基于静态指标客户比如驾驶员年龄,性别,理赔记录、车辆类型等进行分析刻画。如图1所示。
如图1所示,仅以上述静态指标确定的客户画像或确定保费仍有许多不足,随着车联网技术的不断发展,车险客户画像指标体系也在不断完善。
2.2.2. 基于车联网的车险客户画像指标体系
除了驾驶员自身情况对于驾驶行为的影响,如驾驶员年龄、性别、违章次数、出险次数外,驾驶行为和路况天气等也是影响车辆行驶安全的因素。随着车联网技术的发展,该系统能对汽车整体的运动状态进行即时采集,例如:车速、转向角度、车辆百公里急加速、急减速次数等数据。
Figure 1. Static metrics of traditional auto insurance customer profile
图1. 传统车险客户画像静态指标
车联网客户画像指标体系如下:
(1) 驾驶员性别
通过有关数据显示,在道路交通事故中男性司机的数量远大于女性。男性司机具有易怒、冒险性、竞争性,而女性司机的事故率比男性司机要低。例如,在美国,35岁至65岁之间的男性司机的机动机动车辆保险费率为1,女性司机的保险费率为0.9 [7]。
(2) 驾驶员年龄
驾驶员年龄对交通事故的危险程度也有一定的影响。调查显示,年轻的驾驶员的交通事故率比年长的驾驶员高。年轻的驾驶员发生交通事故的概率更高,且随着年龄的增长呈下降趋势,40岁至50岁是发生交通事故率最低的年龄段,随后略有上升[7]。
(3) 百公里超速行驶次数
超速是诱发危险事故发生的又一重要因素。世界卫生组织的研究表明,机动车辆的速度每提高百分之五,发生交通道路事故的概率会提升两倍之多。如图2所示。当车速超过80 km/h时,事故相对
Figure 2. Plot of the effect of travel speed on the relative risk of traffic accidents [8]
图2. 行驶速度对交通事故相对危险性的影响曲线图[8]
危险性猛增,由此可见超速对于危险事故的发生有着重要的影响。
(4) 百公里急加速、急减速次数
急加速、急减速时,速度陡增陡降大幅度变化,对行驶安全有很大影响,容易发生追尾等事故,所以对于急加速、急减速次数的测量,也能很好地反映驾驶员的驾驶习惯和危险发生的概率。
(5) 驾驶过程中的方向角大小
拐弯时的方向角大小也可以很好地反应驾驶员的驾驶水平,如拐弯时方向角过大可能会造成车辆侧翻的风险。
(6) 总驾驶评分
按照《中华人民共和国道路交通管理条例》第28条规定,GPS导航系统按以下规定设置限速实时监控:
因此,本文在分析驾驶行为优劣、评估驾驶员驾驶安全性方面可提供四个维度的数据。利用大数据工具对OBD采集的数据进行深入分析,对量化的驾驶行为进行评分。具体梯度评分依据如表1~5所示。
Table 1. Scoring by mileage
表1. 按里程评分
序号 |
年行驶里程(千公里) |
评分 |
1 |
5以下 |
100 |
2 |
5~10 |
95 |
3 |
10~20 |
90 |
4 |
20~30 |
80 |
5 |
30~50 |
70 |
6 |
50以上 |
60 |
Table 2. 100 km speeding count score (120 km/h)
表2. 百公里超速次数评分(120公里/小时)
序号 |
百公里超速次数(次) |
评分 |
1 |
0 |
100 |
2 |
1~2 |
90 |
3 |
3~4 |
80 |
4 |
5~6 |
70 |
5 |
7~8 |
60 |
6 |
依次类推 |
-- |
Table 3. 100-kilometer rapid acceleration event count scores
表3. 百公里急加速事件次数评分
序号 |
百公里急加速事件次数 |
评分 |
1 |
0 |
100 |
2 |
1~2 |
95 |
3 |
3~4 |
90 |
4 |
5~6 |
85 |
5 |
7~8 |
80 |
6 |
依次类推 |
-- |
Table 4. 100-kilometer rapid deceleration event count scores
表4. 百公里急减速事件次数评分
序号 |
百公里急减速次数 |
评分 |
1 |
0 |
100 |
2 |
1~2 |
95 |
3 |
3~4 |
90 |
4 |
5~6 |
85 |
5 |
7~8 |
80 |
6 |
依次类推 |
-- |
Table 5. Data weights
表5. 数据权重
数据维度 |
年度行驶里程 |
百公里超速次数 |
百公里急加速次数 |
百公里急减速次数 |
权重 |
10% |
40% |
25% |
25% |
为了定量评价驾驶员驾驶水平,根据其驾驶行为确定驾驶行为评分,将上述数据按表5给予相应的权重,用权重加权上述评分得到总驾驶评分。结合驾驶员的驾驶行为数据得出的不同驾驶员的得分,得分越高代表驾驶员驾驶行为更安全。
3. 实证结果分析
根据所获取的数据,先进行相关性分析,根据与车险费率相关性较高的变量进行客户细分画像的建模;根据与总驾驶评分相关性较高的变量进行客户驾驶风险画像的建模。
Figure 3. Heat map for correlation analysis
图3. 相关性分析热力图
根据图3相关性分析热力图可以看出,与车险费率相关性较强的变量有总驾驶评分、车辆总价和百公里超速次数;与总驾驶评分相关性较强的变量有行驶里程、百公里急加速次数和百公里超速次数。用相关性较强的变量进行聚类分析。
3.1. 客户细分画像
将200位客户的数据形成200行12列的数字矩阵,每一行代表一位客户的信息,每一列代表一个属性。如公式所示。
(1)
K-means聚类分析根据数据之间的相似程度进行聚类,抽象为数字矩阵后即为两个行向量之间的距离来确定,距离越近,相似程度越大。如客户
与客户
的距离可以用如下方式表示,本文采用欧式距离来刻画客户之间的相似程度[9]。
(2)
K-means算法选取了适当的质心,使得每个类内样本与质心的距离尽可能短,从而保证了簇内样本的相似性。本文使用最小化类内误差平方和SSE来作为优化算法的量化目标。
(3)
其中
表示聚类数量,
表示第
个簇中含有的样本个数,
表示第
个簇的质心,
表示第
个簇中,第
个样本与质心的距离。
根据相关性分析,选取和保费相关性高的变量进行聚类分析,保证聚类分析类别之间存在显著性差异,本文选取矩阵百公里超速次数、车辆总价、驾驶评分、保险费率进行K-means聚类。
在实践操纵中通过查看最小的总体SSE,每个聚类中的个案以及计算聚类质心,根据类间相异类内相似的原则,反复实验评估和验证[10],确定客户细分画像的最优聚类数为3。
运用K-means算法进行聚类分析的结果如表6所示。
Table 6. Clustering results
表6. 聚类结果
|
聚类类别 |
F |
P |
类别1 (n = 100) |
类别2 (n = 94) |
类别3 (n = 5) |
百公里超速次数 |
1.0 ± 0.0 |
2.0 ± 0.0 |
3.0 ± 0.0 |
|
0.000*** |
车险费率 |
10673.774 ± 825 |
8454 ± 718.5 |
15569 ± 2566 |
285 |
0.000*** |
车辆总价 |
27.34 ± 4.852 |
23.883 ± 6.51 |
41.6 ± 6.98 |
27 |
0.000*** |
驾驶评分 |
84.23 ± 3.4 |
79.02 ± 3.3 |
84.7 ± 4.83 |
57 |
0.000*** |
注:***、**、*分别代表1%、5%、10%的显著性水平。
表6结果显示的结果包括,均值和标准差结果、F检验结果、显著性水平P值。根据显著性水平分析,对于变量百公里超速次数、车险费率、车辆总价、驾驶评分显著性水平P值均小于0.05,说明这些变量在聚类分析划分的类别之间存在显著性差异。根据这些聚类指标将客户分为三类,频数和所占百分比大小,如表7、图4所示。
下面对三个客户细分群体进行分析,并提出相应的建议:
Table 7. Frequency of each cluster
表7. 各聚类频数
聚类类别 |
频数 |
百分比 |
聚类1 |
100 |
50.251% |
聚类2 |
94 |
47.236% |
聚类3 |
5 |
2.513% |
合计 |
199 |
100% |
Figure 4. Pie chart of clustering percentages
图4. 聚类占比饼图
1. 客户群体1
分组特征:① 客户数为100,占比为50.125%,该群体的平均费率为10673.774元,车辆平均总价为27.34万,总体平均驾驶评分为84.23,百公里的超速次数平均约为1次。② 此类客户群体的车辆属于中等价位,驾驶评分较高,百公里超速次数也属于正常水平。
服务策略:对于驾驶行为较好的,且占总体客户比例较大的客户群体来说,应当增加这部分客户的黏性,对驾驶评分高的客户可以进行一定的折扣奖励,从而提升这部分客户的续保率、延长客户的生命周期。
2. 客户群体2
分组特征:分组特征:① 客户数为94,占比为47.236%,该群体的平均费率为8454元,车辆平均总价为23.88万,总体平均驾驶评分为79.02,百公里的超速次数平均约为2次。② 此类客户群体的车辆属于较低价位,驾驶评分较低,百公里超速次数属于正常水平。
服务策略:可以看出此类客户的驾驶行为并不是很好,但是保费相对较低,可以对此类客户中驾驶行为较差的客户提升相应的保费,规范其驾驶行为,从而筛选出驾驶习惯优良的客户,达到降低赔付水平的效果。
3. 客户群体3
分组特征:① 客户数为5,占比为2.513%,该群体的平均费率为15,569元,车辆平均总价为41.6万,总体平均驾驶评分为84.7,百公里的超速次数平均约为3次。② 此类客户群体的车辆属于最高价位,驾驶评分最高,百公里超速次数较高。
服务策略:此类客户的数量占比较小,由于其车辆的价位很高导致其相应保费很高,但这类客户的驾驶评分是这三类中最好的。对于这类客户可以采取私人定制方法根据每个车主的情况,适当降低保费。
3.2. 客户驾驶风险画像
通过相关性分析热力图显示,与驾驶员驾驶评分相关性较大的变量为,百公里急加速次数、百公里超速次数、行驶公里数。对这些变量进行聚类分析,能很好地体现驾驶员驾驶的风险因素。用相同的聚类方法对其进行处理,结果如表8所示。
Table 8. Cluster analysis significance levels
表8. 聚类分析显著性水平
|
聚类类别 |
F |
P |
类别1 (n = 100) |
类别2 (n = 59) |
类别3 (n = 41) |
百公里超速次数 |
1.0 ± 0.0 |
2.0 ± 0.0 |
3.0 ± 0.0 |
|
0.000*** |
行驶里程 |
4.257 ± 1.815 |
4.722 ± 1.259 |
2.77 ± 1.433 |
19 |
0.000*** |
百公里急加速次数 |
4.11 ± 1.154 |
6.237 ± 1.15 |
1.927 ± 0.721 |
195 |
0.000*** |
驾驶评分 |
82.148 ± 1.68 |
76.73 ± 1.72 |
88.043 ± 1.9 |
513 |
0.000*** |
注:***、**、*分别代表1%、5%、10%的显著性水平。
根据显著性水平分析,对于变量百公里超速次数、行驶里程、百公里急加速次数、驾驶评分显著性水平P值均小于0.05,说明这些变量在聚类分析划分的类别之间存在显著性差异。
根据这些聚类指标将客户分为三类,频数和所占百分比大小,如表9、图5所示。
Table 9. Frequency table for each cluster
表9. 各聚类频数表
聚类类别 |
频数 |
百分比 |
聚类1 |
100 |
50.0% |
聚类2 |
59 |
29.5% |
聚类3 |
41 |
20.5% |
合计 |
200 |
100% |
Figure 5. Pie chart of clustering percentages
图5. 聚类占比饼图
下面对三个客户驾驶风险聚类群体进行分析,并提出相应的建议:
1. 客户群体1
分组特征:① 客户数为100,占比为50%,平均行驶里程为4.257,百公里超速次数约为1次,百公里急加速次数平均为4次,平均总驾驶评分为82.148。② 此类客户群体的驾驶评分属于中等水平,有一定的驾驶风险,主要表现在百公里的超速次数。
风险管理策略:对于这部分客户,可以对一段时间内超速次数明显降低的客户给予一定的奖励,通过车联网车险产品获取活跃客户并且保持交流互动,如能配合优质服务,即可提升客户续保率、延长客户生命周期,同时可为开展其他销售活动提供机会。
2. 客户群体2
分组特征:① 客户数为59,占比为29.5%,平均行驶里程为4.722,百公里超速次数约为2次,百公里急加速次数平均为6次,平均总驾驶评分为76.73。② 此类客户群体的驾驶评分较低,有很大的驾驶风险,主要表现在百公里的超速次数、急加速次数。
风险管理策略:可以看出此类客户的驾驶行为不是很好,针对高风险驾驶者,保险公司可以根据风险画像,为客户制定驾驶行为改进协议,鼓励此部分驾驶人员减少超速行驶,这样既能减少车辆出险的概率从而降低车险的赔付,又可以很好地保障驾驶员的安全,减少交通事故的发生。
3. 客户群体3
分组特征:① 客户数为41,占比为20.5%,平均行驶里程为2.77,百公里超速次数约为3次,百公里急加速次数平均为2次,平均总驾驶评分为88.043。② 此类客户群体的驾驶评分最高,驾驶风险较低,百公里的超速次数、急加速次数都较低。
风险管理策略:对于这部分客户,保险公司应当提升他们的用户黏性,对其进行一定的驾驶行为鼓励。同时可以以此类客户为核心建立车联网客户交流平台,提供关于驾驶行为的分享、讨论,引导客户关注参与。在带动用户活跃度的同时也可以很好地传递良好的驾驶行为,降低保险公司整体的风险。
3.3. 基于车险细分画像和驾驶风险画像的产品设计
基于车联网数据的客户细分画像和驾驶风险画像的研究,为车险进行产品创新提供了可能,如车险行业,驾驶科技行业,和交通管理部门。具体应用如下:
(1) 场景化的车联网车险的设计
除了传统的里程、车速、刹车加速次数等场景外,还设计了超速、拥堵、高峰期次数,长距离次数等场景,这些都可以作为车联网产品设计的潜在设计维度。目前已有的“里程保”产品多采用车辆行驶里程这一指标作为保险设计依据。车险公司可以设置与拥堵次数或平均车速相关的“拥堵险”,设计与经常高速驾驶相关的“高速公路驾车险”,与节假日驾车相关的“节假日车险”等,根据不同用户的实际需求设置多样化的保险产品[11]。
(2) 规范驾驶行为的产品设计
车辆驾驶画像提供了关于场景变量、车辆、时间三个维度的驾驶行为的多级描述,可以设计成实时更新的软件APP提供给消费者,消费者可以随时从数据角度主观感知自己的驾驶状况[12]。本发明还可以为保险公司提供驾驶行为报告,对于高风险驾驶者以及新手用户,保险公司可以根据车辆驾驶画像以及风险分析等方法为其制定客制化的驾驶行为改进协议,如鼓励其在夜间行驶时减少车速过高的驾驶情景,不仅可以降低车辆出险几率进而降低车险赔偿,还可以充分保证驾驶员以及车辆乘客的安全。
(3) “绿色驾驶”产品设计
在全球能源问题日益严重,大气环境污染日益引起人们关注的今天,“低碳经济”,“绿色经济”等旨在降低化石燃料耗用,减少温室气体排放,实现社会可持续健康发展的理念逐渐被世界各国所关注。政府,交管部门与保险公司,车联网科技等部门可加大合作力度,基于汽车网络画像相关数据设计“绿色行车”系列方案,如鼓励车主在高频近距出行时减少不必要的近距出行或代之以公共交通,鼓励拥堵系数较高的车主错峰出行或合理规划行车路线,对低油耗系数较高的汽车车主实行个性化返还计划等,并对车主提出部分保险金返还方案,期能实现“绿色行车,一路畅通”的健康道路生态。在相关行业产品设计过程中,不仅需要不同行业之间进行广泛的协同与交流,全方位为车联网相关产品增加服务维度,同时还要充分考虑车联网数据的真实准确以及产品可能带来的社会影响[13]。重点加强与相关公司产品和市场部门的合作,协调各利益相关方的利益,完善相关产品设计中的行为激励机制设计,充分利用车联网大数据带来的“红利”,构建消费者–商家–监管部门多方共赢的商业模式。对新上市的产品进行谨慎的分析论证,提升产品的满意度。
4. 结论与建议
由于车险综改、新车销量下降等诸多因素的综合作用,车险转型已步入深水区,中国车险市场以往一直处于粗放的竞争格局,手续费高、高返点竞争失序是行业常态,导致车险经营成本高居不下[1]。
本文认为以车联网技术作为支撑点,通过客户画像精细化设计产品和定价,是不断提升车险企业经营效率,迈向高质量发展的必由之路。通过梳理了国内外车联网车险发展现状,以及客户画像常用的技术手段,对基于车联网的车险客户画像有了较为深入的理解。其次,本文结合真实数据进行客户画像的分析,对不同的客户群体提出车险费率厘定和风险管理的建议。并基于客户画像对车联网车险产品的设计提出了自己的看法。既能满足客户的需求,不断提升客户黏性,也能满足保险公司对于风险控制的要求。由于客户数据收集的困难性,本文引入的驾驶行为因素还不够丰富,对于实现车、人、时间、环境、天气的五维综合客户画像分析还有所欠缺。
随着大数据、互联网、人工智能等技术的不断发展,以科技支撑的车险行业将会飞速发展,基于车联网数据的客户画像也将更加完善。不仅结合驾驶行为,而且会结合路况天气等综合因素形成更加立体全面的客户画像,为实现一人一车一价的精准定价和风险评估建立坚实的基础。通过车联网保险平台,将保险公司、车主、经销商等连接起来,在增强客户与保险公司的交流的同时,还可以在整个用车周期为客户提供一套完整的保险方案。此外,基于车联网的保险平台还能提供道路救援、车辆驾驶监控、提醒驾驶人注意驾驶中出现的驾驶问题,预防可能发生的危险,给用户带来独特的、新颖的驾驶体验。车联网车险服务范围将不断扩大,车联网保险作为智能网络服务方式,将建立一体化智能交通服务系统。
对于数据安全方面面临的问题,车联网数据系统可以结合区块链技术,进一步加强对于数据安全的保护,让客户的数据安全得到进一步的保护。未来,希望随着车联网技术的进步,车险行业可以得到进一步的发展,交通事故发生率也能大大降低,促进保险科技的发展。