1. 引言
近年来,随着数字经济的快速发展,我国劳动力市场结构正经历深刻变革,灵活就业逐渐成为吸纳就业的重要形态[1]。国家统计局数据显示,截至2021年,全国灵活就业人员规模已达2亿人,占全部就业人口的约26%。灵活就业在缓解就业压力、促进产业创新的同时,也对传统社会保障体系提出了新的挑战[2]。尤其在住房公积金制度领域,原有以单位职工为核心的制度框架难以覆盖灵活就业群体,导致其在住房保障、贷款政策及权益享有等方面存在一定制度短板。住建部自2021年起在重庆、成都、广州、深圳、苏州、常州等城市开展灵活就业人员参加住房公积金制度试点,鼓励灵活就业群体自愿缴存并享受相应权益。各地公积金中心积极探索制度创新与技术赋能路径,推动住房公积金制度向普惠化、包容化方向发展。
在数字化治理背景下,利用大数据与人工智能技术对公积金缴存群体进行精细化分析,已成为公共服务优化的新趋势。客户画像技术通过对用户的基础属性、行为特征与信用风险的多维建模,为政策制定、产品设计和风险管理提供数据支撑[3]。该技术在银行、保险等金融领域得到广泛应用,实现了从“人找服务”到“服务找人”的转变。Kanoje,Girase和Mukhopadhyay指出,用户画像技术已广泛应用于各种电子商务应用,如在线客户细分、网络用户识别、自适应网站、欺诈或入侵检测、个性化、电子市场分析、推荐以及个性化信息检索和过滤[4]。用户画像可以辅助预测用户需求,从而改善用户浏览体验并实现有价值数据精准投送[5]。国内研究起步稍晚但发展迅速。魏晓光等(2025)构建银行客户画像体系用于信用风险识别[6];谢小芹等(2021)基于成都高新区“政务守信通”信用画像剖析政府数字化转型机制[7];王法硕等(2016)利用数字画像创新公共服务供给方式,使得公共服务供给更加精准化、个性化、均等化[8];章明等(2020)提出画像驱动的智能风险防控平台,精准识别风险群体[9]。如何基于客户画像精准识别灵活就业群体特征,构建个性化、公平化的公积金服务体系,已成为提升政策精准度与群众满意度的重要课题。
总体而言,现有文献普遍认可用户画像在公共服务精细化、风险防控与政策定向中的价值,但其在住房公积金制度中的研究仍较为匮乏。基于此,本文以Q市灵活就业人员住房公积金数据为基础,构建融合基础属性、行为特征与风险指标的客户画像体系,从数据驱动视角探讨公积金制度的优化路径,重点围绕政策决策支持、产品精准推送与风险识别管理展开,为住房公积金数字化治理和灵活就业保障体系创新提供实证支撑与理论参考。
2. 用户画像简述及构建思路
2.1. 用户画像定义及在商业银行的应用
用户画像是基于用户的基本属性、社会属性、行为属性与心理特征等多维信息,利用大数据技术抽象出的标签化虚拟模型。其核心在于通过“打标签”的方式,以高概括、易理解的特征刻画个体差异,从而识别用户特征、预测行为并挖掘潜在需求。在数字化环境中,用户画像已成为精准服务与智能决策的重要基础工具。
金融行业是最早应用用户画像技术的领域之一。商业银行依托海量客户与交易数据,运用大数据和机器学习算法,构建覆盖信用评估、风险识别与客户服务的全方位画像体系,实现从群体化营销向个性化服务转变。其应用场景涵盖产品设计、精准营销、授信审批、风险预警及客户关系管理等环节。银行可通过客户消费记录、行为轨迹与信用信息预测潜在贷款需求,实现产品精准推送;通过客户征信与交易特征开展风险评估与异常预警,从而在提高运营效率的同时,优化客户体验,形成“数据驱动–精准服务–风险控制”的业务闭环。
2.2. 用户画像在公共服务行业的构建思路
本文借鉴商业银行成熟的客户画像构建经验,将用户画像体系引入公共住房公积金服务领域,依据灵活就业人员业务特征构建分析框架。其应用主要体现在以下几个方面:一是用户统计。依据客户的基本属性及缴存、提取、贷款等行为特征进行分类与分布分析,为公积金中心提供基础统计支持。二是数据挖掘。围绕业务目标,利用用户标签构建预测或聚类模型,提升人群识别与业务精准度。三是精准营销。基于历史特征与交易记录,识别潜在客户和潜在需求,针对特定群体开展多渠道推广。四是服务产品优化。通过分析产品使用者画像,理解其心理动机与行为习惯,完善产品设计与运营机制,或开发更契合客户需求的新产品与政策。五是风险识别。依托用户画像标签与阈值规则,建立风险监控与评估体系,实现实时预警与风险防范。
本文以Q市公积金中心提供的灵活就业人员脱敏数据为基础,从整体数据分析、基础属性分析、行为属性分析、特征用户分析与风险属性分析五个维度开展用户画像构建。基础属性分析以性别、年龄、学历、收入等人口学变量揭示群体特征;行为分析聚焦缴存、提取及贷款行为;长尾用户分析则针对开户未缴存、持房或购房需求等特殊群体进行深度挖掘。考虑到数据维度有限,部分贷款行为暂无法纳入分析,但整体框架可随数据完善进一步扩展。该分析思路可推广至其他城市住房公积金中心及公共服务机构,为提升服务精准度与智能化水平提供方法参考。
3. 分析示例
3.1. 样本数据
本文采用Q市公积金中心自2021年8月灵活就业人员业务开展以来至2022年5月的全量灵活就业人员数据作为分析样本。数据源共涉及账户数26606个:其中正常账户26430个,占比99.3%;累计缴存账户共26020个,占比97.8%,累计缴存公积金总额约2.14亿元;有提取行为的用户1423个,占比5.3%,近24个月累计提取金额约693.64万元,提取金额占比为3.2%。样本数据涵盖字段如下:
(1) 有效字段25个:性别、年龄、职业、学历、婚姻状况、个人收入、账户状态、账户性质、信息来源、委托银行、缴存产品选择、办理机构、缴存类型、当前缴存方式、当前连续汇缴期数、近6个月合计汇缴金额、近12个月合计汇缴金额、近24个月合计汇缴金额、累计缴存金额、近6个月提取次数、近12个月提取次数、近24个月提取次数、近6个月提取金额、近12个月提取金额、近24个月提取金额;
(2) 待清洗字段3个:家庭月收入(为空填充为0)、房屋套数(空值填充为0)、当前每周期缴存金额(空值样本删除);
(3) 未使用字段8个(无效字段,重复字段):常住地、是否有缴存补贴、近6个月补缴期数、近12个月补缴期数、近24个月补缴期数、第一次提取记录首次汇缴月份数、是否销户、销户后提取余额。
本文根据以上字段数据,利用描述性统计、规则制定、对比分析、机器学习等方法,利用BI可视化工具展示结果,交叉分析灵活就业人员的基础属性、行为属性等特征,对灵活就业人员的特点进行挖掘分析。
3.2. 基础属性分析
数据分析结果显示,灵活就业人员以35岁以下的年轻群体为主,80、90后占比超过60%,男性略多于女性,表明年轻人更易接受公积金新政策并主动参与缴存。从婚姻结构看,未婚群体缴存人数略高于已婚群体,其中28岁以下未婚者占比明显较高,而28岁以上两者基本持平。
在学历结构方面,公积金缴存者中高学历(大专及以上)人群占比约40%,平均年龄约30岁,75%以上年龄在35岁以下,主要从事律师、设计、摄影、剪辑等脑力劳动岗位。低学历(大专以下)人群占比超过50%,平均年龄约37岁,其中半数以上年龄大于35岁,25%以上超过47岁,主要集中在餐饮、装修、家政、建筑及个体工商户等体力劳动行业,体力型就业比例高达70%。
综合来看,灵活就业人员可分为三类典型群体:一是30岁左右高学历的脑力劳动者;二是同龄低学历的个体工商户与外卖、快递从业者;三是35岁以上、以体力劳动为主的中低学历群体。这种分层特征为公积金服务差异化设计提供了重要依据。
3.3. 用户行为分析
3.3.1. 缴存产品客群分析
Table 1. Product preferences of flexible workers of different age groups (TGI)
表1. 不同年龄段灵活就业人员产品偏好(TGI)
缴存产品选择 |
TGI-00后 |
TGI-90后 |
TGI-80后 |
TGI-70后 |
TGI-60后 |
一次性趸缴型 |
93.23 |
96.87 |
104.74 |
114.08 |
68.50 |
按月缴存型 |
116.20 |
118.88 |
107.83 |
62.94 |
26.01 |
自由缴存型 |
92.49 |
87.93 |
90.78 |
118.16 |
177.81 |
缴存产品选择 |
TGI-00后 |
TGI-90后 |
TGI-80后 |
TGI-70后 |
TGI-60后 |
数据显示,灵活就业人员可选择自由缴存型、按月缴存型和一次性趸缴型三种产品,其中自由缴存型最受欢迎,后两者选择人数接近。为分析出不同基本属性特征的灵活就业人员对产品的偏好情况,在此针对不同基本属性特征群体计算每个产品的Target Group Index (下文缩写“TGI”,目标群体指数),计算公式为:TGI指数 = [目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例] * 标准数100。TGI可反映目标群体在特定研究范围内的强势或者弱势,在此TGI指数大于100,代表该属性用户对产品更具倾向性,数值越大偏好越强;TGI小于100,则说明该属性用户对产品的偏好程度相对较弱。TGI分析结果表明(表1),自由缴存型产品普适性较高,尤其受中老年群体青睐;按月缴存型更受年轻群体偏好。
研究发现“年龄”和“家庭月收入”两特征与缴存产品选择关联性较强。为了更好地识别不同产品的客群喜好,本文将客群分成了三类:中老年客群、青壮年低收入客群、青壮年高收入客群。结果如表2所示,45岁以上中老年群体偏好自由缴存型,占比57%;45岁以下且月收入低于6000元的青壮年低收入群体对三类产品偏好相近,但自由缴存型略占优势;45岁以下且月收入高于6000元的青壮年高收入群体则明显偏好按月缴存型产品。总体来看,自由缴存型用户以中老年和低收入群体为主,按月缴存型集中于高收入青壮年群体,而一次性趸缴型多被中低收入青壮年选择。
Table 2. Differences in preferences for deposit products among different customer groups
表2. 不同客群对缴存产品的偏好差异
群体 |
描述 |
产品偏好 |
中老年客群 |
1. 年龄大于45岁的缴存用户 2. 近九成学历在高中以下 3. 一半为个体工商户 |
偏好自由缴存型产品,占比达57% |
青壮年低收入客群 |
1. 年龄低于45岁 2. 家庭月收入低于6000元 3. 近一半为高学历用户 4. 近三成的职业无法分类,需进一步细分 |
三种产品占有率相当,但自由缴存型更胜一筹 |
青壮年高收入客群 |
1. 年龄低于45岁 2. 家庭月收入高于6000元 3. 近四成为高学历用户 4. 近三成的职业无法分类,需进一步细分 |
偏好按月缴存型产品 |
3.3.2. 用户渠道分析
Figure 1. Information sources and distribution of entrusted banks for flexible employment personnel
图1. 灵活就业人员业务信息来源、委托银行分布
用户渠道如图1所示,灵活就业人员主要通过支付宝、微信小程序获取公积金政策信息,仅0.3%通过柜台办理。用户多选择本地银行,国有银行以建设银行和农业银行为主,股份制银行中招商银行吸引高学历用户(占比约24%)。建议后续可与上述银行和机构探索推广方式,形成可借鉴、可复制的制度措施。
3.3.3. 缴存行为分析
如表3和图2所示,一次性趸缴型用户占比28.3%,缴存额占比73.6%,基数180元者超25%,超过半数不足1000元,25%顶格缴存;自由缴存型超50%基数为180元,95%以上不足1000元,连续缴纳期数较长;按月缴存型超半数基数大于500元,25%以上超过1200元,缴存期数稳定,金额集中。三类产品中,一次性趸缴型差异最大,自由缴存型居中,按月缴存型最稳定。
Table 3. Different contribution bases for self-employed individuals (unit: yuan)
表3. 灵活就业人员不同缴存基数(单位:元)
产品类型 |
自由缴存型 |
按月缴存型 |
数量 |
1814 |
8165 |
平均值 |
319.54 |
956.22 |
标准差 |
1954.40 |
1031.59 |
最小值 |
0 |
180 |
5%分位 |
0 |
180 |
25%分位 |
0 |
200 |
50%分位 |
180 |
500 |
75%分位 |
200 |
1199 |
95%分位 |
1000 |
3500 |
最大值 |
76200 |
3500 |
Figure 2. Analysis of the number of consecutive contribution periods for different products for self-employed individuals
图2. 灵活就业人员不同产品连续缴存期数分析
3.3.4. 提取行为分析
以近24个月提取次数分析,如果次数大于等于1,则说明存在提取行为。数据样本有26604个,有提取情况的用户只有1423个(约占5.3%),总提取金额6936382元。选择自由缴存型产品的用户中,有提取行为的用户占比最高,达到87.4%,其他两个产品都在8%以下。其中男性用户占比64%,未婚占比62%。而在年龄分布上,男性用户高度集中在30岁左右,而女性除了主要分布在30岁附近外,另外在50岁附近提取的概率也小幅上升。
3.4. 长尾用户分析
3.4.1. 异常用户分析
账户状态为“封存”和“开户未缴”的用户,均可视为异常用户。经统计分析,当前异常用户共729个,占比约2.7%。异常用户存在三方面特点:第一,断缴或开户未缴的男性高峰主要集中在30岁左右,在27岁附近最多,超过65%的人未婚,96%以上没有房产,本来这部分人在这个年龄段更多集中在按月缴存型产品中,但是却购买了自由缴存型产品;第二,购买自由缴存型的产品的男性群体中还有不少人的年龄在50岁左右,但是这部分年龄段的人发生封存或开户未缴的概率却很低;超过42岁异常用户分布密度明显降低;第三,女性在50岁左右断缴或者开户未缴概率明显上升。
3.4.2. 用户持有房产情况分析
提供的样本数据中,有房的用户有759个,占总用户的2.9%,说明缴存公积金的灵活就业人员主要以无房产的用户为主。持有房产的客户超过86%已婚,其中超过一半选择了自由缴存型产品,用户状态异常的比例达到4%,高于平均的2.7%。在30岁左右持有房产且已婚的客户,购买了自由缴存型产品的男性封存或开户未缴的概率较高(图3)。
Figure 3. Analysis of users who own real estate
图3. 持有房产的用户情况分析
4. 基于客户画像的灵活就业人员公积金服务优化路径设计
灵活就业人员公积金服务优化应以客户画像为基础,针对不同群体的特征与行为制定精准服务路径,以提升缴存意愿和缴存稳定性,同时降低风险。具体优化路径如下。
4.1. 精准推广策略
针对不同年龄段与学历群体优化推广策略。微信小程序侧重大龄低学历用户,通过简明直观的信息提示提升缴存参与;支付宝针对年轻高学历群体,提供政策解读、缴存模拟和优惠方案,强化在线便捷体验。
依托本地银行及国有银行的区域网络和管理经验,推广灵活就业人员公积金业务,覆盖新市民及青年灵活就业群体。股份制银行如招商银行可提供个性化缴存服务、补贴及优惠,吸引高学历人群,提高缴存稳定性和金额。
与灵活用工平台、高校及职业技能培训机构合作,实现高聚集群体线上宣传与业务导流,扩大缴存覆盖面和参与率。
4.2. 缴存产品优化
根据客户画像提供个性化产品推荐。30岁左右未婚男性用户可优先推荐按月缴存型产品,降低断缴风险;一次性趸缴型低基数用户可引导改为按月缴存或自由缴存型产品,提高缴存金额与稳定性。
开户即设定缴存基数门槛,线上提交时提供弹窗提示,引导用户选择适合的缴存产品;一次性趸缴型产品提高最低基数标准,确保缴存金额合理,防止低额零散缴存。
4.3. 政策调整与支持
拓展提取场景,逐步放开灵活就业人员公积金提取场景,使其与在职职工政策趋同,满足租购房及住房改善需求;一次性趸缴型产品提取优化,允许部分提取而不终止缴存协议,鼓励连续缴存;代际互助机制,引入父母或子女住房公积金共享,提高中老年群体缴存意愿。
4.4. 风险管控与信用体系建设
根据缴存、提取和贷款行为建立信用评分体系,提供优先贷款额度、保障性住房等激励,支持主观不违约的断缴用户宽限政策,提升缴存稳定性;评估灵活就业人员与在职职工资金池分割的可行性,建立存贷比等监控指标体系,防范资金流动性风险,保障住房公积金正常运行。
5. 研究结论与研究展望
本研究基于重庆市灵活就业人员公积金缴存数据,从客群画像、行为特征、产品选择及信息获取渠道等维度,对灵活就业人员的缴存行为进行了系统分析。研究发现,灵活就业人员群体呈现明显的年龄、学历和收入差异:年轻、高学历者倾向按月缴存型和自由缴存型产品,中老年、低学历群体偏好自由缴存型产品;一次性趸缴型产品缴存金额集中、稳定性较高,但整体接受度一般。缴存金额与缴存期数在不同产品间差异显著,按月缴存型产品最为集中与稳定,自由缴存型产品变动较大,趸缴型产品差异最显著。业务信息获取方面,微信小程序更多吸引大龄低学历群体,支付宝则偏向年轻高学历用户,柜台办理比例极低。银行类型对客户结构亦有影响,股份制银行吸引高学历人群,国有银行服务经验丰富、覆盖面广。本研究进一步提出了基于客户画像的服务优化策略,包括精准推广渠道与内容、产品个性化引导、政策调整、风险管理及信用体系建设等,以提升缴存参与度与稳定性。
未来研究可从以下几方面展开:其一,可拓展样本覆盖范围,纳入全国不同城市的灵活就业人员数据,以验证不同地区政策差异对缴存行为的影响。其二,可结合动态追踪数据,深入分析灵活就业人员的缴存意愿变化及断缴行为原因,为个性化产品设计提供依据。此外,可评估新兴渠道如灵活用工平台、高校及职业培训机构对缴存推广的实际效果,以及代际互助机制在不同群体中的适用性。其三,应进一步构建缴存与贷款行为的风险预测模型,完善灵活就业人员信用体系,为公积金制度的可持续发展提供数据支撑与政策参考。通过上述研究,可为优化灵活就业人员公积金管理和服务体系提供更科学的理论与实践依据。
NOTES
*通讯作者。