基于结构–关系互学多维协同注意力网络的抖音电商用户流失预测分析
Churn Prediction for Douyin E-Commerce Users Based on a Structure-Relation Mutual Learning Network with Multi-Dimensional Collaborative Attention
摘要: 短视频与直播电商的兴起使抖音等平台成为重要的在线消费入口,但高获客成本与用户易流失并存,急需有效的用户流失预测方法。针对传统模型难以同时刻画个体行为特征与用户间关系结构的问题,本文提出一种结构–关系互学多维协同注意力网络(SRML-MCA),用于抖音电商用户流失风险预测。该模型由两个分支组成:结构分支(SFE)以年龄、收入、RFM指标、停留时长、浏览页数、Newsletter订阅等多维行为与属性特征为输入,学习用户个体表示;关系分支(RFE)基于兴趣标签、品类偏好和地域信息构建用户关系图,在图神经网络上捕捉相似用户的群体模式,并通过互学式多维协同注意力在两分支之间进行信息交互和权重重分配,得到兼具个体差异与关系结构的综合表示。本文选取阿里巴巴天池大赛抖音电商用户特征数据集,在缺乏长期行为日志的现实条件下,基于最近登录天数与购买频次构建标准化综合风险得分,并以其中位数为阈值划分高低流失风险,形成二分类标签。实验结果显示,在五折交叉验证下,SRML-MCA在Accuracy、Precision、Recall、F1和AUC等指标上均优于逻辑回归、随机森林、XGBoost、GCN和GAT等基线模型,AUC达到0.9992,F1达到0.9839,且标准差较小,表明该模型具有较强的判别能力与稳定性。研究表明,将结构特征与关系特征通过互学协同注意力进行深度融合,是提升抖音电商用户流失预测效果、支撑平台精细化运营的有效途径。
Abstract: The rise of short-video and live-streaming e-commerce has positioned platforms like TikTok (Douyin) as critical gateways for online consumption. However, these platforms face the dual challenges of high customer acquisition costs and high user churn rates, creating an urgent need for effective user churn prediction methods. To address the limitation of traditional models—which struggle to simultaneously capture individual behavioral characteristics and relational structures among users—this paper proposes a Structure-Relation Mutual Learning with Multi-dimensional Collaborative Attention network (SRML-MCA) for predicting user churn risk in Douyin e-commerce. The model consists of two branches: The Structure Feature Encoder (SFE) takes multi-dimensional user attributes and behavioral features—including age, income, RFM metrics, session duration, page views, and newsletter subscription—as input to learn individual-level representations. The Relation Feature Encoder (RFE) constructs a user relation graph based on interest tags, category preferences, and geographic information, leveraging graph neural networks to capture group-level behavioral patterns among similar users. A mutual-learning multi-dimensional collaborative attention mechanism enables dynamic interaction between the two branches, allowing adaptive reweighting of features and neighbors. This yields a unified user representation that integrates both individual distinctiveness and relational context. We evaluate our approach on the Douyin e-commerce user feature dataset from the Alibaba Tianchi Competition. Under realistic constraints—specifically, the absence of long-term behavioral logs—we define a standardized composite risk score based on days since last login and purchase frequency, using its median as the threshold to create a binary churn label (high vs. low risk). Experimental results under 5-fold cross-validation show that SRML-MCA consistently outperforms baseline models—including Logistic Regression, Random Forest, XGBoost, GCN, and GAT—across metrics such as Accuracy, Precision, Recall, F1, and AUC: it achieves an AUC of 0.9992, an F1-score of 0.9839, and exhibits low standard deviation, demonstrating both strong discriminative power and high stability. This study demonstrates that deeply integrating structural and relational features through a mutual-learning collaborative attention mechanism is an effective strategy for enhancing churn prediction accuracy in Douyin e-commerce, thereby supporting data-driven, fine-grained user retention strategies.
文章引用:陈进. 基于结构–关系互学多维协同注意力网络的抖音电商用户流失预测分析[J]. 电子商务评论, 2025, 14(12): 6651-6662. https://doi.org/10.12677/ecl.2025.14124657

1. 引言

近年来,随着短视频与直播电商的迅猛发展,抖音等内容平台逐渐成为消费者获取商品信息和完成在线购物的重要渠道。与传统搜索式电商不同,抖音电商以“内容驱动消费”为核心,用户在浏览视频或观看直播过程中被动接触商品,其购买行为高度依赖算法推荐与内容运营。在此模式下,平台虽投入大量资源获取新用户,但用户一旦沉默或流失,往往难以有效召回。因此,如何及早识别具有流失风险的用户、面向性地实施精细化运营,已成为平台提高用户生命周期价值与市场竞争力的关键问题。

用户流失预测作为客户关系管理中的经典任务,早期研究多依赖规则评分模型或传统机器学习方法。

在电商用户流失领域,国内外已有较为系统的实证与方法研究。围绕电商用户精细运营,赵煜[1]基于机器学习与集成模型研究电商用户画像与标签预测,在用户价值分层和流失预测任务中显著提升了多项评价指标,为精准营销和用户留存提供了画像层面的技术支撑;Jahan等[2]构建了一个集客户细分、流失预测与推荐于一体的综合留存分析框架,在真实电商数据上验证了CatBoost等机器学习模型在流失预测中的有效性,并强调通过特征排序和用户分群联合优化平台留存策略的重要性;Wu等[3]提出PCA-AdaBoost组合模型,将改进后的RFM特征、主成分分析与集成学习相结合,以应对电商场景中高维度且类别不平衡的数据问题,在Kaggle电商数据集上取得了更高的预测精度和稳定性;吴君阳[4]通过将COX比例风险模型与深度神经网络融合,构建深度生存分析模型,既刻画了非会员用户的整个“生存周期”,又提高了对流失风险的解释能力;也有研究从管理实践视角出发,以具体平台为案例分析客户流失的影响因素与管理对策,为企业在服务质量优化、个性化运营和会员体系设计等方面提供经验借鉴[5];徐远纯等[6]提出加权熵并改进ID3算法,构建更准确的决策树模型用于客户流失分析;Idris等[7]结合特征选择与集成学习,构建了智能的电信用户流失预测系统;张玮等[8]融合CART与自适应Boosting算法,有效提升了流失趋势的预测精度;王重仁与韩冬梅[9]则将社交网络特征引入XGBoost模型,在互联网金融场景中显著优于Logistic回归、支持向量机和随机森林等基线方法。然而,上述方法在抖音电商这类高维、高频、多模态交互的复杂场景中存在明显局限:其一,通常将用户视为独立个体,仅使用聚合后的静态数值特征(如最近登录时间、购买频次、总消费金额等),难以刻画动态演化的行为模式;其二,忽视用户在兴趣偏好、品类倾向、地域属性等方面形成的隐含关系网络,无法捕捉“群体性流失”等协同风险信号。

近年来,深度学习和图神经网络(GNN)在用户行为建模中取得显著进展。一方面,基于RNN、Transformer等的序列模型可从长行为序列中自动学习时序表示;另一方面,GCN、GAT等图神经网络通过在用户–商品或用户–用户关系图上传递消息,有效建模社交影响与兴趣扩散。但现有工作往往割裂处理这两个视角:或仅关注个体行为序列而忽略关系结构,或仅在图上使用简单节点特征而未充分利用丰富的行为指标,缺乏对结构信息与关系信息的统一建模与协同优化机制。

针对上述问题,本文面向抖音电商场景,提出一种结构–关系互学的多维协同注意力网络,用于用户流失风险预测。一方面,模型的结构分支以用户的数值行为特征和静态属性为输入,包括RFM特征、站内停留时长、浏览页数、消费金额、Newsletter订阅状态等,通过深度神经网络学习个体层面的高维表示;另一方面,关系分支基于兴趣标签、品类偏好与地域信息构建用户关系图,利用图神经网络建模相似用户间的群体行为模式。进一步地,本文设计多维协同注意力机制,实现两分支的动态互引导:结构分支根据邻域上下文调整对不同行为特征的关注权重,关系分支则依据个体价值信号筛选更具影响力的邻居节点,从而融合个体差异性与群体关联性,生成更具判别力的用户综合表征。

2. 数据来源与处理

2.1. 数据来源

本文实验数据来自阿里巴巴天池大赛提供的抖音电商用户特征数据集,覆盖了一段时间内平台活跃用户的基本属性、站内行为和消费记录。原始数据以用户为粒度,每一行对应一个用户画像,包含User_ID及多类特征字段,如年龄、性别、地域、兴趣偏好、收入水平、登录与消费行为等。相较于传统只包含交易记录的电商数据,该数据集在行为与兴趣维度更为丰富,有利于从多视角刻画用户的价值与流失风险。数据集字段具体说明如表1所示。

Table 1. Description of dataset fields

1. 数据集字段说明

变量类型

变量名

详细说明

取值范围/示例

因变量

Label

用户流失风险状态

0:低流失风险、1:高流失风险

解释变量(人口属性)

Age

用户年龄

整数(约18~65岁)

Gender

性别

男/女

Location

居住地类型

城市/郊区/农村

Income

收入水平

数值型(单位:元)

解释变量(兴趣偏好)

Interests

抖音内容兴趣标签

运动、时尚、技术等

Product_Category_Preference

偏好商品品类

服饰、美妆、电子等

解释变量(交易行为)

Last_Login_Days_Ago

上次登录以来的天数

连续数值(1~29天)

Purchase_Frequency

用户购买频率

整数(0~20次)

Average_Order_Value

平均客单价

连续数值(单位:元)

Total_Spending

总消费金额

连续数值(单位:元)

解释变量(站内行为)

Time_Spent_on_Site_Minutes

站内累计停留时长

连续数值(单位:分钟)

Pages_Viewed

浏览页面数量

整数(衡量内容消费量)

Newsletter_Subscription

是否订阅平台推送

TRUE:已订阅、FALSE:未订阅

2.2. 数据处理

在数据预处理阶段,首先对异常样本和明显缺失关键信息的用户进行剔除;对数值型特征(如年龄、收入、金额、时长等)进行标准化,以消除量纲差异;对类别型特征(性别、地域、兴趣、品类偏好、Newsletter订阅状态等)采用嵌入编码方式映射到低维连续空间,便于在深度模型中联合学习。

由于该数据集仅提供了观测窗口内的用户特征快照,并未给出后续较长时间跨度上的真实登录和消费行为,因而无法直接依据“未来是否回访/购买”构造标准的流失标签。为在这一现实约束下开展用户流失预测研究,本文采用基于相对活跃度的近似标签构造策略,将“最近登录时间”与“购买频次”两个行为指标综合起来刻画用户的流失风险,其中最近登录时间分布如图1所示。具体做法如下:首先选取最近登录天数Last_Login_Days_Ago和购买频次Purchase_Frequency两个特征,采用Z-score标准化得到标准化变量 L ˜ F ˜ 。其中 L ˜ 越大表示用户距离上次登录的时间越久, F ˜ 越小表示购买行为越不活跃。基于此,定义用户的综合流失风险得分如式(1)所示,即同时考虑“登录是否长时间未更新”和“购买是否明显减少”两个维度,最近登录时间越久且购买频次越低,风险得分越高,说明用户越可能处于即将流失或高流失风险状态。

ris k score = L ˜ F ˜ (1)

在得到所有用户的风险得分后,本文采用样本中位数作为划分阈值,将用户自动划分为高风险与低风险两组:当某用户的 ris k score 高于全体用户的中位数时,将其标记为高流失风险用户,记作label = 1;当 ris k score 不高于中位数时,将其标记为低流失风险用户,记作label = 0。由于阈值选取为中位数,两类样本在数量上大致均衡,有利于后续二分类模型的稳定训练和评估。

在完成标签构造后,本文将上述得到的label作为二分类任务的监督变量,其余特征作为输入特征。人口属性、兴趣与品类偏好、消费金额相关指标、站内停留时长与浏览页数、Newsletter订阅状态等均作为模型的结构特征输入。同时,这些特征中的兴趣、品类、地域等信息还用于构建用户间的关系图,为结构–关系互学多维协同注意力网络的关系分支提供图结构输入。通过这种方式,模型在训练时既能够学习单个用户的价值与活跃模式,也能够捕捉具有相似属性和行为的用户群体在流失风险上的集体特征。

Figure 1. Days since the user’s last login

1. 用户上次登录以来的天数

为构建“结构–关系互学多维协同注意力网络”用于抖音电商用户流失预测,需要先明确数值特征之间的统计结构,以指导后续特征建模与注意力设计。基于此数据集,本文对主要数值字段(年龄、收入、最近登录天数、购买频次、客单价、总消费、停留时长、浏览页数)做了相关性分析,其相关矩阵如图2所示,核心发现与建模启发如下:

价值信号的多尺度差异:客单价与总消费呈显著正相关(约0.68),说明高客单用户往往贡献更高的总金额;但客单价与购买频次存在明显负相关(约−0.53),即“高额低频”是典型高价值模式。协同注意力网络应在结构分支中同时输入客单价、总消费与购买频次,并在关系分支刻画相似用户的消费水平,使互学机制能突出“客单升高但频次下降”这一潜在流失信号。

财务能力与行为活跃度:收入与停留时长、总消费均表现为中等正相关(约0.33),表明高收入用户在站内停留更久且消费更多。模型可将收入、停留时长视为结构特征,同时在关系图中连接同兴趣或同地域的高收入用户群,通过协同注意力强调“高收入但停留骤降”或“浏览活跃但消费停滞”等异常组合,用于提前识别风险用户。

Recency的弱单变量效应:最近登录天数与其他变量相关性极弱,说明其单独预测能力有限。借助互学网络,可将Recency作为结构输入,同时在关系分支中引入“社交/兴趣邻域的平均活跃度”,通过注意力对比“用户自身vs群体”的活跃偏差,从而增强Recency在特定情境下的权重。

行为维度的相对独立性:停留时长、浏览页数与消费指标相关度较低,提示内容消费与交易行为存在多样路径。协同注意力需在结构分支建模时间/页面序列,在关系分支利用兴趣–品类共现图捕捉关系模式,再通过互学机制让模型自适应地决定这些弱相关特征在不同用户群体中的重要性,挖掘非线性流失信号。

类别属性的关系建模价值:性别、地区、兴趣与品类偏好虽未直接进入相关矩阵,但它们可构成关系图中的节点或边属性(如兴趣共现、地区相似、品类消费路径)。在协同注意力框架中,结构分支处理上述数值行为特征,关系分支基于这些类别属性学习用户之间的相似性或影响力,互学机制则在两种视角之间传递注意力权重,使模型能够识别“某兴趣群组整体流失”或“特定地区用户消费骤降”等关系型风险。

综上,通过对数值字段的统计分析,明确了流失预测所需的关键特征组合、潜在的多尺度矛盾信号以及适合构图的关系属性,为“结构–关系互学多维协同注意力网络”提供了扎实的数据依据。模型可据此将价值指标、活跃指标和关系属性分别输入结构与关系分支,并利用互学注意力动态聚焦那些同时呈现“高价值 + 高风险”特征的用户,提升抖音电商用户流失预测的准确性和可解释性。

Figure 2. Correlation matrix of numerical features

2. 数值字段相关矩阵

3. 结构–关系互学的多维协同注意力网络

Figure 3. Model architecture diagram

3. 模型结构图

本节介绍用于抖音电商用户流失预测的结构–关系互学多维协同注意力网络(SRML-MCA)。该模型将用户个体行为特征与用户间关系结构统一建模,通过互学式协同注意力实现两类信息的互补与融合,从而提升流失风险判别的准确性与稳定性。下面依次介绍结构分支、关系分支以及多维协同注意力机制的具体实现方式。模型结构图见图3

3.1. 结构–关系互学网络

结构–关系互学习网络(Structure-Relation Mutual Learning, SRML [10])是一种深度神经网络架构,最初设计用于少样本图像分类任务。SRML通过双分支结构同时学习数据的结构特征和关系特征,两分支分别遵循RENet中SCR和CCA模块[11]的相同结构。并通过互学习策略实现两个分支的知识交换。

3.1.1. 结构–关系互学网络整体架构

SRML网络由三个核心组件构成:1) 共享嵌入模块(Shared Embedding Module),用于生成基础特征表示。2) 结构特征提取分支(Structural Feature Extraction, SFE),学习数据内部的结构信息。3) 关系特征提取分支(Relational Feature Extraction, RFE),学习数据间的关联关系。在原始SRML中,这些组件处理的是图像特征图;在本研究中,我们通过特征重塑将表格数据转换为2维特征图格式,从而应用SRML架构。

给定输入特征 Z (H×W×C) 。其中H为特征图的高度,W为特征图的宽度,C为特征图的通道数,通过特征重塑将表格数据转换为2维特征图以对应此输入。SRML网络通过共享嵌入模块提取特征,共享嵌入模块 f 0 将原始输入映射到统一的特征空间,生成基础表示 Z s (支持集)和 Z q (查询集):

Z s = f o ( X s ), Z q = f o ( X q ) (2)

其中, f 0 是共享嵌入函数,将输入特征 X s X q 映射为输出特征 Z s Z q

3.1.2. 结构特征提取分支

结构特征提取(SFE)分支负责获取数据内部的结构信息。在图像任务中,它捕获空间结构;在表格数据任务中,它捕获特征之间的依赖关系。该分支采用自相关计算(Self-Correlation Computation)和自相关表示(Self-Correlation Representation, SCR)模块来表示特征图内部的空间依赖关系。对于表格数据,通过特征重塑得到的2维特征图同样具有空间结构,因此可以应用相同的自相关机制。

自相关计算:对于输入特征 Z ( H×W×C ) ,先通过ReLU激活和 L 2 归一化处理得到归一化后的特征,然后提取局部邻域特征,生成6维自相关张量:

Z ˜ =ReLU( Z ), Z ¯ = Z ˜ / Z ˜ 2 (3)

C self =Unfold( Z ¯ ) (4)

C self = C self Z ¯ (5)

其中, Unfold( ) 是PyTorch的Unfold操作,可将每个空间位置的邻域展开。得到的自相关张量通过逐元素相乘与 Z ¯ 结合。 为逐元素相乘运算,将每个位置的邻域特征与中心位置特征相乘,增强局部相关性。

接下来,SCR模块通过3D卷积对自相关张量进行降维和特征提取:

F intra =SCR( C self ) (6)

最后,通过残差连接与原始特征融合得到最终的特征:

F intra = F intra +Z (7)

3.1.3. 关系特征提取分支

关系特征提取(RFE)分支专注于学习数据之间的关系。在用户流失预测任务中,使用自相关方式( Z s = Z q )计算同一用户特征内部不同位置之间的关系模式,从而捕获用户特征的内部关联结构。该分支通过4维相关映射(4D Correlation Map)和交叉注意力(Cross-Attention)机制实现。

在用户流失预测任务中,使用同一用户的特征作为 Z s Z q ,经过降维归一化得到 Z ¯ s Z ¯ q 。然后计算4维相关映射中位置(i, j, k, l)的相似度分数:

C 4D ( i,j,k,l )= Z ¯ s ( i,j ) Z ¯ q ( k,l ) (8)

其中, Z ¯ s ( i,j ) 为支持集特征在位置(i, j)的特征向量, Z ¯ q ( k,l ) 为查询集特征在位置(k, l)的特征向量。

接下来,CCA模块通过可分离的4维卷积对得到的分数进行降维处理:

C refined =CCA( C 4D ) (9)

由于使用自相关方式( Z s = Z q ),注意力权重反映了特征内部不同位置之间的关联强度,因此计算如下:

A s ( i,j )=Softmax( k,l C refined ( i,j,k,l )/τ ) (10)

A q ( k,l )=Softmax( i,j C refined ( i,j,k,l )/τ ) (11)

其中, A s ( i,j ) 为支持集位置(i, j)的注意力权重, A q ( k,l ) 为查询集位置(k, l)的注意力权重, Softmax( ) 为Softmax函数,将相似度转换为概率分布(和为1), τ 为参数。

最终的关系特征通过注意力加权得到:

f inter = i,j A s ( i,j ) Z s ( i,j ) (12)

3.1.4. 互学习策略

SRML网络采用跨知识集成(Between-Knowledge-Ensemble, BKE)学习策略,通过KL散度[12]损失促进SFE和RFE两个分支的知识交换。

用两个分支各自得到的特征,与每个类别权重做一次匹配(点积),得到结构分支和关系分支的相似度分数 s intra s inter ,然后转换为概率分布:

P intra =Softmax( s intra /τ ), P inter =Softmax( s inter /τ ) (13)

BKE损失定义为两个分布之间的双向KL散度,具体计算公式如下:

L BKE =KL( P intra P inter )+KL( P inter P intra ) (14)

3.2. 多维协同注意力

多维协同注意力(Multidimensional Collaborative Attention, MCA) [13]是一种轻量级注意力模块,采用三分支架构,分别在宽度维度W、高度维度H和通道维度C加入注意力,并通过轻量化的“挤压–激励(squeeze-excitation)”流程完成多维协同增强,最后将三路增强结果进行融合输出。对于输入特征 Z ( H×W×C ) (通过特征重塑得到的2维特征图),三个分支并行处理,最终通过平均聚合得到增强后的特征:

F= 1 3 ×( F W + F H + F C ) (15)

其中, F W F H F C 分别是宽度维度分支、高度维度分支以及通道维度的输出。

MCA模块的核心创新在于压缩变换中的自适应组合机制。传统的注意力方法通常固定使用平均池化或标准差池化,而MCA通过可学习的权重 α β 自适应地平衡两种池化方式的重要性,使得模型能够根据不同的特征提取阶段自动调整池化策略,从而提升对特征描述的判别能力。

3.3. 构建结构–关系互学的多维协同注意力网络

在结构化特征建模中,不同特征组对流失风险的贡献并不均衡,且特征之间存在复杂依赖关系。多维协同注意力(MCA)通过在多个维度上学习注意力权重,实现对关键特征与关键特征交互的自适应强调,从而增强表征判别性。因此,本文提出了结构–关系互学多维协同注意力网络,基于此网络建立用户流失预测模型,该模型将SRML的双分支学习能力与MCA的多维注意力机制相结合,对表格数据的用户特征进行建模分析。

3.3.1. 结构–关系互学的多维协同注意力网络整体架构

原本直接输入SRML两个分支的特征图,经表格编码与重塑后,先经过MCA模块,在通道、高度和宽度三个维度上进行注意力增强,再把MCA输出的增强特征作为新的输入送入原SRML的结构分支和关系分支,其余流程与SRML一致。

3.3.2. 表格特征编码

对于用户特征数据,本文将其分为数值特征 x n R d n 和分类特征 x c Z d c ,通过多层感知机将数值特征映射到嵌入空间:

e n =MLP( x n ) R d e (16)

通过嵌入层将分类特征映射到低维连续空间:

e c i =Embedding( x c i ) R d e / d c (17)

其中, x c i 为第i个分类特征, Embedding( ) 将类别ID映射为连续向量。

再将所有分类特征的嵌入向量拼接后得到:

e c =[ e c 1 ; e c 2 ;; e c d t ] (18)

最后将数值特征和分类特征的嵌入通过融合层结合,得到嵌入特征 e

e=F( e n , e c ) (19)

其中, F( ) 为融合函数。

3.3.3. 特征重塑与多维协同注意力增强

为了应用MCA模块,需要将1维特征向量重塑[14]为2维特征图。通过投影层将嵌入特征映射到目标尺寸:

f 2 =P( e ) (20)

其中,P为嵌入函数。再应用MCA模块增强特征表示:

f M =M( f 2 ) (21)

MCA模块通过三个维度的协同注意力,能够更好地捕获特征之间的依赖关系,提升特征的判别能力。

3.3.4. 结构–关系互学双分支特征提取融合及分类

经过MCA增强的特征通过适配层调整维度后,输入到SRML的双分支架构中。

SFE提取用户内部的结构特征,通过自相关计算和SCR模块建模特征的空间依赖关系,提取特征为:

F intra =SFE( f M ) (22)

RFE则提取用户间的关系特征,学习用户之间的关联模式,提取特征为:

F inter =RFE( f M , f M ) (23)

这里使用自相关方式计算关系特征,即用同一个用户的特征计算其内部的关系特征。

将SFE和RFE分支的特征进行池化和融合,然后通过全连接层进行分类[15]。最终输出0或1,0代表其为低流失风险用户,1代表其为高流失风险用户。

3.4. 评价指标

为全面评估所提出的结构–关系互学多维协同注意力网络在抖音电商用户流失预测任务中的表现,本文从准确性、鲁棒性与排序能力三个维度选取以下指标。设二分类混淆矩阵中真正例、假正例、真负例、假负例分别为TPFPTNFN,则各指标定义如下:

1) 准确率(Accuracy)

衡量模型整体分类正确的比例,在样本分布相对平衡的情况下,准确率能够直观反映模型总体识别能力:

Accuracy= TP+TN TP+FP+TN+FN (24)

2) 精确率(Precision)

在被判定为流失的用户中,真正流失的比例。精确率越高,说明模型在“发出流失预警”时的可信度越高:

Precision= TP TP+FP (25)

3) 召回率(Recall)

在真实流失用户中,被模型成功识别的比例。召回率越高,表示模型对潜在流失的覆盖更充分,是衡量“漏报”风险的重要指标:

Recall= TP TP+FN (26)

4) F1值(F1-score)

精确率与召回率的调和平均,兼顾“误报”和“漏报”。当需要在精准干预与覆盖率之间取得平衡时,F1值能够提供更综合的判断:

F1=2* Precision×Recall Precision+Recall (27)

5) AUC (Area Under ROC Curve)

受试者工作特性曲线下的面积,衡量模型区分正负类的排序能力。AUC在[0, 1]之间取值,越接近1,表示模型对随机抽取的一对“流失/未流失”用户能够更高概率地给出正确排序,能够在不同阈值下稳定反映模型性能。

此外,训练过程中还监控交叉熵损失(Loss),用于衡量预测概率与真实标签之间的差异。综合使用Accuracy、Precision、Recall、F1与AUC,可从整体准确性、预警可信度、覆盖率与排序能力等多个角度评价模型效果,便于全面刻画流失预测效果。

4. 实验结果及分析

为检验所提出的结构–关系互学多维协同注意力网络的有效性,本文选取随机森林、逻辑回归、梯度提升树(XGBoost)、图卷积网络(GCN)、图注意力网络(GAT)等典型方法作为对比模型。在此数据集上采用五折交叉验证实验设计,具体做法为:将样本随机划分为5个大小近似的子集,每次轮流选取其中1折作为测试集,其余4折作为训练集,重复训练与测试5次,并对各轮结果取算术平均与标准差。为保证可比性,所有对比模型均采用相同的数据划分和训练配置。记录Accuracy、Precision、Recall、F1和AUC等指标的均值及标准差。相关结果见表2

从整体结果看,传统机器学习模型中,随机森林表现相对较好,明显优于逻辑回归和XGBoost,说明采用非线性集成方法对样本数据的拟合能力更强。深度学习模型方面,引入图结构后的GCN在各项指标上均优于随机森林,表明在用户关系图上传播信息有助于提高流失预测性能。进一步地,基于注意力机制的GAT在所有指标上实现上升,且标准差极小,体现出在图结构上引入注意力权重后,模型对关键邻居和重要关系的刻画更加精细。在此基础上,本文提出的SRML-MCA进一步在GAT的基础上取得小幅但稳定的提升,同时比单独的SRML效果更好。综上,说明本文提出的结构–关系互学多维协同注意力网络在高基线水平下仍能带来增量收益,并显著提高结果的稳定性。

Table 2. Comparison of model experimental results

2. 模型实验结果对比

模型

Accuracy

Precision

Recall

F1-score

AUC

随机森林

0.9370 ± 0.0166

0.9328 ± 0.0256

0.9417 ± 0.0099

0.9371 ± 0.0160

0.9816 ± 0.0084

逻辑回归

0.9030 ± 0.0317

0.9113 ± 0.0271

0.8913 ± 0.0461

0.9009 ± 0.0336

0.9713 ± 0.0116

XGBoost

0.9190 ± 0.0107

0.9265 ± 0.0165

0.9094 ± 0.0143

0.9177 ± 0.0110

0.9742 ± 0.0081

GCN

0.9410 ± 0.0097

0.9343 ± 0.0306

0.9498 ± 0.0227

0.9413 ± 0.0088

0.9820 ± 0.0080

GAT

0.9820 ± 0.0103

0.9782 ± 0.0156

0.9859 ± 0.0102

0.9820 ± 0.0102

0.9988 ± 0.0008

SRML

0.9830 ± 0.0136

0.9823 ± 0.0216

0.9839 ± 0.0102

0.9830 ± 0.0135

0.9992 ± 0.0009

SRML-MCA

0.9840 ± 0.0080

0.9840 ± 0.0102

0.9839 ± 0.0081

0.9839 ± 0.0081

0.9992 ± 0.0009

5. 结论

本文面向抖音电商场景中的用户流失预测问题,结合短视频电商数据“高频交互、强关系依赖”的特点,提出了一种结构–关系互学多维协同注意力网络(SRML-MCA)。模型通过结构分支刻画用户的个体行为特征与价值特征,通过关系分支在用户关系图上建模兴趣、品类与地域等维度形成的多层网络结构,并在此基础上设计互学式多维协同注意力机制,使两类信息在表示学习过程中实现动态交互与权重分配,从而获得兼具个体差异和群体模式的用户综合表示。本文基于阿里巴巴天池抖音电商用户特征数据集,系统构建了包含人口属性、兴趣偏好、交易行为及站内交互行为在内的多维特征体系。考虑到数据仅提供观测窗口内的特征快照而缺乏长期行为日志,本文提出基于“最近登录天数–购买频次”标准化组合的综合风险得分,并以中位数为阈值构造高流失风险与低流失风险的二分类标签,为在真实业务约束下开展流失预测研究提供了一种可行思路。实验结果表明,在五折交叉验证框架下,SRML-MCA在多数指标上均优于多种基线模型,且标准差较小,表现出良好的泛化能力和结果稳定性。总体而言,本文工作为短视频电商平台在用户流失预测与精细化运营方面提供了一种有效的建模框架,对如何在缺乏完整行为序列的情况下综合利用结构特征与关系特征具有一定的参考价值。后续研究可在两个方向进一步拓展:一是结合更长时间跨度的行为日志,引入时间动态图和序列注意力机制,刻画流失过程的动态演化;二是将该框架推广到复购预测、客户分层等其他核心业务任务,构建统一的结构–关系协同建模体系。

总体来看,本文方法在抖音电商用户流失预测任务上取得了较为理想的效果,但仍存在不足之处。首先,流失标签是依据“最近登录间隔”和“购买频率”两个行为变量构造的标签,而非平台人工审核结果,因此难免受到观测窗口设定和特征选择的影响。其次,数据中包含较多高维、偏稀疏的类别特征和兴趣标签,虽然结构–关系互学和多维协同注意力在一定程度上提升了特征表达能力,但对于极少出现的长尾兴趣,模型的刻画能力仍存在局部不足。最后,相比传统的浅层模型,本文网络在结构上略显复杂,训练与推理的计算成本相对更高。后续工作可在结合更多行为与反馈信号细化流失标签的基础上,尝试引入针对长尾特征的增强建模,并配合模型压缩技术降低计算成本,从而在保证预测效果的同时,进一步提升模型的鲁棒性与部署效率。

参考文献

[1] 赵煜. 基于机器学习的电商用户画像算法研究及应用[D]: [硕士学位论文]. 西安: 西安石油大学, 2025.
[2] Jahan, I. and Sanam, T.F. (2024) A Comprehensive Framework for Customer Retention in E-Commerce Using Machine Learning Based on Churn Prediction, Customer Segmentation, and Recommendation. Electronic Commerce Research. [Google Scholar] [CrossRef
[3] Wu, Z., Jing, L., Wu, B. and Jin, L. (2022) A PCA-AdaBoost Model for E-Commerce Customer Churn Prediction. Annals of Operations Research, 350, 537-554. [Google Scholar] [CrossRef
[4] 吴君阳. 基于购买行为的电商非会员用户流失分析[D]: [硕士学位论文]. 上海: 上海财经大学, 2022.
[5] 韦伟. H公司电商平台客户流失管理优化对策研究[D]: [硕士学位论文]. 南宁: 广西大学, 2024.
[6] 徐远纯, 盛昭瀚, 柳炳祥. 一种基于决策树的客户流失危机分析方法[J]. 计算机与现代化, 2004(8): 1-4.
[7] Idris, A., Khan, A. and Lee, Y.S. (2013) Intelligent Churn Prediction in Telecom: Employing mRMR Feature Selection and RotBoost Based Ensemble Classification. Applied Intelligence, 39, 659-672. [Google Scholar] [CrossRef
[8] 张玮, 杨善林, 刘婷婷. 基于CART和自适应Boosting算法的移动通信企业客户流失预测模型[J]. 中国管理科学, 2014, 22(10): 90-96.
[9] 王重仁, 韩冬梅. 基于社交网络分析和XGBoost算法的互联网客户流失预测研究[J]. 信息技术与网络安全, 2017, 36(23): 58-61.
[10] Li, X., Wang, L., Zhu, R., Ma, Z., Cao, J. and Xue, J. (2025) SRML: Structure-Relation Mutual Learning Network for Few-Shot Image Classification. Pattern Recognition, 168, Article ID: 111822. [Google Scholar] [CrossRef
[11] Kang, D., Kwon, H., Min, J. and Cho, M. (2021) Relational Embedding for Few-Shot Classification. 2021 IEEE/CVF International Conference on Computer Vision (ICCV), Montreal, 10-17 October 2021, 8802-8813. [Google Scholar] [CrossRef
[12] Joyce, J.M. (2025) Kullback-Leibler Divergence. In: Lovric, M., Ed., International Encyclopedia of Statistical Science, Springer Berlin Heidelberg, 1307-1309. [Google Scholar] [CrossRef
[13] Yu, Y., Zhang, Y., Cheng, Z., Song, Z. and Tang, C. (2023) MCA: Multidimensional Collaborative Attention in Deep Convolutional Neural Networks for Image Recognition. Engineering Applications of Artificial Intelligence, 126, Article ID: 107079. [Google Scholar] [CrossRef
[14] Ghosh, S., Das, N. and Nasipuri, M. (2019) Reshaping Inputs for Convolutional Neural Network: Some Common and Uncommon Methods. Pattern Recognition, 93, 79-94. [Google Scholar] [CrossRef
[15] Yang, J., Yang, J., Zhang, D. and Lu, J. (2003) Feature Fusion: Parallel Strategy vs. Serial Strategy. Pattern Recognition, 36, 1369-1381. [Google Scholar] [CrossRef