基于动态时序图神经网络的信用卡欺诈检测方法研究
Credit Card Fraud Detection Approach Based on a Dynamic Temporal Graph Neural Network
DOI: 10.12677/csa.2025.1511295, PDF, HTML, XML,    科研立项经费支持
作者: 李 峰:河北金融学院河北省金融科技应用重点实验室,河北 保定;河北金融学院金融科技学院,河北 保定;李惠先, 陈 雪:河北金融学院金融科技学院,河北 保定;韩祝华*:河北金融学院统计与数据科学学院,河北 保定
关键词: 欺诈检测图神经网络动态图时序分析循环记忆模块Fraud Detection Graph Neural Networks Dynamic Graphs Temporal Analysis Recurrent Memory Module
摘要: 信用卡欺诈是金融科技领域的重大挑战。现有基于静态快照的图神经网络方法难以有效捕捉欺诈行为在连续时间上的动态演化模式。当前研究多将动态交易流离散化为静态图,导致时序信息丢失和检测延迟。本文提出一种新的动态时序图神经网络模型(DTGNN-FD)。该模型采用连续时间动态图范式,通过门控记忆机制和时间感知注意力来持续更新用户表征,从而对流式交易进行实时风险建模。在两个真实金融欺诈数据集上的实验表明,所提模型在F1-Score和Recall等关键指标上优于多种基线模型,表现出识别复杂时序模式的潜力。本研究为实时信用卡欺诈检测提供了一种有效的解决方案。
Abstract: Credit card fraud poses a significant challenge in the field of financial technology. Existing graph neural network methods based on static snapshots struggle to effectively capture the dynamic temporal evolution of fraudulent behaviors. Current research often discretizes dynamic transaction flows into static graphs, resulting in loss of temporal information and detection delays. This paper proposes a novel Dynamic Temporal Graph Neural Network model for fraud detection (DTGNN-FD). The model adopts a continuous-time dynamic graph paradigm, which utilizes a gated memory mechanism and temporal-aware attention to continuously update user representations, enabling real-time risk modeling of streaming transactions. Experiments on two real financial fraud datasets show that the proposed model outperforms multiple baseline models in key metrics such as F1-Score and Recall, demonstrating the potential to identify complex temporal patterns. This study provides an effective solution for real-time credit card fraud detection.
文章引用:李峰, 李惠先, 陈雪, 韩祝华. 基于动态时序图神经网络的信用卡欺诈检测方法研究[J]. 计算机科学与应用, 2025, 15(11): 173-184. https://doi.org/10.12677/csa.2025.1511295

1. 引言

随着电子支付技术的飞速发展与普及,信用卡已成为全球范围内主流的非现金支付工具之一。根据2024年支付体系运行数据,全国银行卡交易业务量高达5642.29亿笔,总金额达992.53万亿元,其中消费业务3571.78亿笔,金额133.73万亿元[1],凸显了信用卡在日常经济活动中不可或缺的地位。然而,在支付体系高效运转的背后,信用卡欺诈风险亦随之攀升,严重威胁银行资产安全与用户权益。截至2024年末,信用卡逾期半年未偿信贷总额达1239.64亿元[1],尽管占比保持低位,但其绝对规模及潜在的欺诈关联仍不容忽视。

信用卡欺诈检测本质上是一个典型的极端类别不平衡二分类问题。欺诈交易仅占全部交易的极小部分,例如公开基准数据集中的欺诈样本比例常低于0.5% [2]。这种分布不均导致传统机器学习模型倾向于将少数类(欺诈)误判为多数类(正常),召回率低下。此外,欺诈行为表现出显著的概念漂移特性:欺诈者为规避检测,会持续演化攻击模式,使得基于历史数据训练的模型性能随时间衰减[3]。更为复杂的是许多欺诈行为,特别是团伙欺诈并非孤立事件,其内部存在复杂的关联网络。传统模型仅基于独立的交易特征进行分析,难以捕捉这种隐藏在交易流中的协作信号。

为应对上述挑战,研究者们已探索了多种技术路径。早期研究大多依赖于专家系统[4]和传统的机器学习模型[3],如逻辑回归、支持向量机和随机森林。这些方法虽在一定程度上有效,但严重依赖繁琐的特征工程,且难以适应快速变化的欺诈模式。近年来,深度学习[5]与图神经网络(Graph Neural Network, GNN) [6]的兴起为解决该问题提供了新思路。深度学习模型能自动从原始数据中学习高层次特征表示,而GNN尤其擅长处理关系数据,通过聚合邻居信息建模交易实体(用户和商户)之间的复杂交互,有效识别出欺诈团伙中隐蔽的协同行为。

尽管已有研究取得了显著进展,但现有方法在全面应对信用卡欺诈检测的三大核心挑战(类别极度不平衡、概念漂移和复杂关联模式挖掘)时仍存在局限[7]。例如,多数GNN模型在聚合信息时易受邻居中大量正常样本的干扰,导致对欺诈节点的表示学习不充分;而单纯依靠过采样(如SMOTE [8])或代价敏感学习[3]来处理不平衡问题,有可能引入噪声或降低模型泛化能力。

基于此,本文提出一种新型动态时序图神经网络模型(Dynamic Temporal Graph Neural Network for Credit Card Fraud Detection, DTGNN-FD)。该模型采用连续时间动态图范式,通过门控记忆机制和时间感知注意力来持续更新用户表征,从而对流式交易进行实时风险建模。通过在真实交易数据集上的实验,验证了所提模型在召回率(Recall)、准确率(Precision)和F1分数等关键指标上相较于现有主流基线方法的优越性。

2. 相关工作

信用卡欺诈检测的研究历程,伴随着机器学习技术的发展而不断演进。从早期的专家系统和传统统计模型,到如今的深度学习和动态图神经网络,其核心目标始终是在极度不平衡的数据流中,精准且及时地识别出欺诈模式。本节将从三个层面回顾相关研究工作:首先阐述基于传统机器学习与深度学习的欺诈检测方法;其次聚焦于基于图神经网络的静态与离散动态图欺诈检测模型;最后重点分析与本文最为相关的、处理连续时间动态图的神经网络模型,并指出其应用于金融欺诈场景的局限性,从而为本研究提供理论依据。

2.1. 基于传统机器学习与深度学习的欺诈检测

早期信用卡欺诈检测系统严重依赖由领域专家制定的硬规则,如交易金额阈值、境外交易标记、短时间内高频交易触发等。这类方法虽简单直观且可解释性强,但规则维护成本高、灵活度低,极易被欺诈者针对性地规避,难以应对新型和复杂的欺诈模式。

随着数据量的增长,传统机器学习模型成为主流解决方案。这类方法将欺诈检测视为一个典型的二分类问题,通过特征工程提取用户和交易的行为特征,利用分类算法进行判别。常用的模型包括逻辑回归[9]、支持向量机[10]、随机森林[11]以及梯度提升决策树[12]等。为了应对类别不平衡问题,代价敏感学习[13]和采样技术常被集成到这些模型中。然而,这些方法存在明显局限:其一,特征工程高度依赖专家知识,难以捕捉非线性及深层次的特征交互;其二,它们通常将交易视为独立同分布的样本,忽视了交易序列中蕴含的时序依赖关系以及用户商户之间的复杂关联。为捕捉交易行为的时序动态,研究者引入了深度学习中的序列模型。循环神经网络(RNN) [14]及其变体,如长短期记忆网络(LSTM) [15],被用于对用户的历史交易序列进行建模,以学习其正常的消费行为模式,并检测偏离该模式的异常交易。此类方法能够有效利用上下文信息,比独立建模的方法有显著提升。然而,RNN类模型固有的顺序处理机制存在训练速度慢、难以捕捉长期依赖以及无法并行化等缺点。此外,与传统机器学习方法类似,纯序列模型依然难以有效建模跨用户、跨商户的复杂交互关系,而这正是识别有组织团伙欺诈的关键。

2.2. 基于图神经网络的欺诈检测

图神经网络的兴起为解决上述“关系建模”的挑战提供了强大工具。通过将用户和商户(或卡片、终端等)抽象为图中的节点,将交易行为抽象为边,可以自然地构建一个异质信息网络,从而显式地捕捉实体间的交互。

早期的GNN方法主要基于静态图设计。它们通常在一个固定的时间窗口内聚合所有历史交易,构建一个静态图,然后应用诸如图卷积网络(GNN) [16]、图注意力网络(GAT) [17]等模型来学习节点嵌入,最终基于节点嵌入进行欺诈分类。例如,毕蓓等人[18]提出了一种基于异构图注意力网络构建的谣言监测模型,通过不同层级的注意力机制得到最终的节点表示。这些方法能够有效地聚合邻居信息,发现通过传统方法难以察觉的欺诈团伙,因为它们的行为在局部图拓扑上会表现出异常。然而,静态图模型存在根本性缺陷:金融交易本质是一个持续不断的动态流,用户的行为模式和欺诈模式会随时间演变。静态图无法反映这种动态性,其表示是历史信息的“平均快照”,难以对最新发生的交易做出快速、准确的响应,无法满足实时欺诈检测的低延迟要求。

为了引入时间维度,许多研究转向了离散动态图或基于时间快照的方法。这类方法将连续时间轴划分为若干个时间窗口(如按天或小时),在每个窗口内构建一个静态图快照,然后使用RNN或时序卷积网络(TCN) [19]通过这些快照序列,以学习节点表示的时序演化,如图1所示。离散化方法虽然部分引入了时序信息,但其弊端显著:首先,时间窗口的大小是超参数,窗口太大导致信息丢失,窗口太小导致噪声增加;其次,切割时间窗是一种粗粒度的近似,无法精确建模交易发生的精确时刻和间隔,而细微的时间差可能包含重要线索;最后,序列化处理多个快照的计算开销巨大,难以应用于高频交易的实时场景。

Figure 1. Example of discrete dynamic graph networks

1. 离散动态图示例

2.3. 动态图神经网络

近年来,连续时间动态图神经网络(CTDGNN) [20]的发展为更精细地建模动态交互提供了可能。这类模型将每次交互(如一条交易)视为一个在特定时间点发生的事件(事件流视图),无需预先划分时间窗,从而能够保留完整的时序信息。

TGAT [21]模型是一个代表,它利用自注意力机制和函数时间编码,直接对节点在任意时间点的表征进行建模,能够较好地处理连续时间。TGN [22]是一个综合性的框架,它引入了记忆模块来存储节点长期的历史状态。每次交互发生时,相关的节点记忆会被更新,并用于生成当前时刻的节点嵌入。TGN统一了多个早期模型的思想,并在多个基准数据集上展现了优越性能。尽管连续时间动态图神经网络在社交网络和推荐系统等领域取得了显著成功,但其在金融欺诈检测场景的直接应用仍面临诸多独特挑战。首先,金融交易事件蕴含高维复杂特征(如金额、MCC码等),远超社交交互的简单边信息,对模型的特征融合能力提出更高要求;其次,欺诈模式的概念漂移速度极快,要求模型具备更强的自适应与遗忘机制;再者,支付场景的毫秒级实时性要求与复杂模型的计算开销之间存在矛盾;最后,现有模型对节点状态动态性关注较多,而对欺诈团伙中动态关系网络的细粒度建模能力仍显不足。

本文提出的DTGNN-FD模型,正是在充分吸收上述CTDGNN模型核心思想的基础上,针对金融交易数据的高维特征、极端不平衡性、快速概念漂移和实时性要求进行了针对性优化与创新,以期更好地解决信用卡欺诈检测这一特定领域的难题。

3. 本文方法

针对现有方法在应对信用卡交易数据流中的极端类别不平衡、快速概念漂移及复杂动态关联模式等方面的不足,本章提出了一种新颖的动态时序图神经网络欺诈检测模型(Dynamic Temporal Graph Neural Network for Fraud Detection, DTGNN-FD)。该模型旨在对连续到达的交易流进行实时风险建模,通过融合门控记忆机制与时间感知注意力,能够较为精准捕捉用户行为的时序演化规律与欺诈模式的隐蔽关联。

3.1. 问题定义

将信用卡交易生态系统建模为一个持续增长的连续时间动态图:

G( t )=( V,ε( t ) ) (1)

其中: V 是静态的节点集合,包含所有用户(Users)和商户(Merchants)。 ε( t ) 是随时间 t 不断增长的边集合。每一条边代表一笔交易,是一个五元组:

e k =( u k , i k , t k , x k , y k )ε( t ) (2)

u k V 表示发起交易的用户节点。

i k V 表示接收交易的商户节点。

t k + 表示交易发生的时间戳。

x k d 表示该笔交易的特征向量(如交易金额、货币类型、商户类别码MCC、地理位置编码等)。

y k { 0,1 } 表示该交易的标签(0为正常,1为欺诈),在模型训练阶段已知,预测阶段未知。

模型目标:给定截至时间 t 的所有历史交易 ε( t ) ,当一条新交易 e new =( u,i,t,x,? ) 发生时,模型需实时计算其欺诈概率 P( y=1| e new ,ε( t ) ) ,并依据设定的阈值做出二分类决策。

3.2. 模型总体框架

DTGNN-FD模型的整体架构如图2所示,其核心是一个基于消息传递范式的循环处理流程。每当一条新交易 e k 到达时,模型执行以下四个核心步骤:

1) 记忆更新:根据新交易 e k ,使用门控机制(GRU)及时更新相关节点(用户u和商户i)的记忆状态 s u ( t k ), s i ( t k ) ,以捕获其长期行为模式的最新快照。

2) 消息生成:结合源节点记忆、目标节点记忆、交易特征及时间编码,生成此次交互的消息向量 m k ,该消息封装了此次交易的语义信息。

3) 时间感知聚合:为节点ui分别采样其历史交互邻居,并利用一种新颖的时间衰减注意力机制聚合这些历史交互消息。注意力权重是时间间隔的函数,确保越近的交互影响越大。

4) 预测与输出:利用聚合后的节点嵌入进行最终表征,通过一个多层感知机(MLP)分类器输出该交易的欺诈概率。

该框架以流式方式处理交易,无需时间窗划分,适用于实时欺诈检测场景。

3.3. 节点记忆模块

为克服RNN类模型在处理长序列时的梯度消失或爆炸问题,并有效捕获节点的长期依赖行为,DTGNN-FD为每个节点( vV )维护一个记忆向量 s v ( t ) m 。该记忆向量随着节点参与交互而动态更新,是节点行为历史的压缩表征。当新交易 e k 发生时,首先为交互双方节点生成更新消息:

m u update = ϕ msg ( s u ( t k ), s i ( t k ), x k ,Δt ) (3)

m i update = ϕ msg ( s i ( t k ), s u ( t k ), x k ,Δt ) (4)

其中 s u ( t k ) 代表节点 u t k 时刻之前的记忆状态, ϕ msg 是一个可学习的消息函数(MLP), Δt 可选项,表示距上次更新的时间间隔。随后,采用一个门控循环单元(GRU)来更新节点记忆:

s u ( t k )= GRU u ( s u ( t k ), m u update ) (5)

s i ( t k )= GRU i ( s i ( t k ), m i update ) (6)

GRU的遗忘和更新门机制使其能够选择性地保留历史信息并融入新信息,从而有效建模用户行为的演变,并对抗概念漂移。

Figure 2. The overall framework of DTGNN-FD

2. DTGNN-FD总体架构

3.4. 时间编码与消息生成

精确的时间信息对于欺诈检测至关重要(例如,深夜的高额消费异常概率更高)。文中采用函数式时间编码方法[23],将时间戳 t 映射到一个高维空间:

Φ( t )= [ cos( ω 1 t+ θ 1 ),sin( ω 1 t+ θ 1 ),,cos( ω d t+ θ d ),sin( ω d t+ θ d ) ] T (7)

其中 ω 1 ,, ω d θ 1 ,, θ d 是可学习的频率和相位参数。对于交易 e k ,我们生成其消息向量 m k ,该消息将用于后续的邻居聚合:

m k =MLP( s u ( t k )|| s i ( t k )|| x k ||Φ( t k ) ) (8)

其中 || 表示向量拼接操作。此消息不仅包含了交易本身的特征 x k ,还融入了交易发生时双方节点的状态 s u s i 以及精确的时间上下文 Φ( t k ) ,信息高度浓缩。

3.5. 时间感知的消息聚合

传统的图注意力机制忽略了交互发生的时间先后,而这在欺诈检测中至关重要(例如,刚发生的可疑交易比一周前的同类交易更具参考价值)。DTGNN-FD的创新之一是引入了时间衰减的注意力机制。

对于目标节点 v (以用户 u 为例),首先从其所有历史交互中采样一组最近的邻居交互 N u ( t k ) 。对于每一个历史交互 e j =( u, i j , t j , x j , y j ) N u ( t k ) ,我们计算其与当前时间 t k 的注意力系数:

α j = exp( σ( a T [ m j ||ψ( t k t j ) ] ) ) e j N u ( t k ) exp( σ( a T [ m j ||ψ( t k t l ) ] ) ) (9)

其中: m j 是历史交互 e j 的消息向量。 ψ( Δt )=exp( δΔt ) 是一个指数时间衰减核函数, δ 是可学习的衰减率参数。 Δt= t k t j 越大, ψ( Δt ) 越小,表示久远的历史交互重要性越低。 a 是注意力机制的参数向量, σ 是LeakyReLU激活函数。

随后,节点 u t k 时刻的聚合表征 h ˜ u ( t k ) 由其邻居消息的加权和得到:

h ˜ u ( t k )= e j N u ( t k ) α j m j (10)

此聚合过程充分考虑了时间临近性,使模型能够动态聚焦于最相关、最新的历史信息。

3.6. 预测与模型训练

最终,将节点的最新记忆状态与聚合后的邻居表征相结合,形成节点的最终嵌入,用于预测:

h u ( t k )=MLP( s u ( t k )|| h ˜ u ( t k ) ) (11)

对于交易 e k =( u,i, t k , x k ) 的欺诈概率预测,我们综合了用户端和商户端的信息:

y ^ k =σ( MLP pred ( h u ( t k ) h i ( t i ) x k ) ) (12)

其中 σ 是Sigmoid函数,输出在[0, 1]之间。

为应对极端类别不平衡,模型采用加权二元交叉熵损失函数进行训练:

= 1 | | k=1 | | [ λ y k log( y ^ k )+( 1 y k )log( 1 y ^ k ) ] (13)

其中 λ>1 是一个超参数,用于增大少数类(欺诈样本)在损失函数中的权重,迫使模型更加关注对欺诈样本的正确分类。整个模型通过反向传播和时间反向传播进行端到端的训练。

3.7. DTGNN-FD与TGN的架构对比分析

尽管TGN (Temporal Graph Network)框架为连续时间动态图建模提供了通用且强大的基础,其在金融欺诈检测这一特定场景下的直接应用仍存在若干局限性。DTGNN-FD模型在充分吸收TGN核心思想(如记忆模块和基于事件的更新机制)的基础上,针对信用卡欺诈检测任务的高维特征、极端类别不平衡、快速概念漂移和实时性要求,进行了一系列具体、细微的改进。两者的核心差异对比如下:

1) 消息生成机制的精细化:TGN的消息函数通常仅融合源节点记忆、目标节点记忆和简单的边特征。而DTGNN-FD在消息生成环节(公式(4))显式引入了高维交易特征向量 x k 和经过函数式编码的精确时间上下文 Φ( t k ) 。这种设计使模型不仅能够充分利用金融交易中丰富的语义信息,而且对交易发生的具体时刻保持高度敏感,这对于捕捉细微的欺诈模式至关重要。

2) 时间感知聚合策略的创新:TGN在聚合历史信息时,通常采用与时间无关的注意力机制或简单最近邻采样。DTGNN-FD则提出了一种时间衰减注意力机制(公式(9))。该机制通过一个可学习的指数衰减核函数 ψ( Δt )=exp( δΔt ) 来动态计算注意力权重,确保模型能够自动聚焦于时间上更临近的交互事件。这一改进直接针对欺诈行为的概念漂移特性,使模型能更快地遗忘过时信息并对新兴攻击模式做出响应,从而有效降低检测延迟。

3) 针对类别不平衡的损失函数优化:作为一个通用框架,TGN通常使用标准交叉熵损失进行训练。然而,信用卡欺诈数据中正负样本的极端不平衡会导致模型严重偏向多数类。DTGNN-FD在训练阶段(公式(13))采用了加权二元交叉熵损失函数,通过超参数 λ>1 显著增大欺诈样本的损失权重。这一细微但关键的技术选择迫使模型在训练过程中更加关注对少数类的正确分类,从而在召回率这一欺诈检测的核心指标上获得显著提升。

4) 预测阶段的信息融合策略:在生成最终预测时,DTGNN-FD (公式(11))将节点的最新记忆状态 s u ( t k ) 与经过时间感知聚合的邻居表征 h ˜ u ( t k ) 进行拼接,共同输入预测MLP模型。这种设计增强了对节点自身行为演变与其局部动态关联模式的协同建模能力,有助于更全面地评估交易风险,特别是在识别需要协同行为的团伙欺诈时更具优势。

综上所述,DTGNN-FD并非TGN的简单应用,而是针对金融欺诈检测场景的独特挑战进行了优化。这些架构上的改进虽细微,但共同作用,显著提升了模型在真实欺诈数据集上的性能表现,特别是在F1-Score和Recall等关键指标上实现了对TGN等基线模型的超越。

4. 实验与分析

为全面评估所提出的动态时序图神经网络欺诈检测模型(DTGNN-FD)的性能,在两个真实的金融欺诈数据集上,与多类基线模型进行对比,并通过消融实验深入探究模型各核心模块的贡献。

4.1. 数据集与实验设置

4.1.1. 数据集

实验选用两个公开的、具有显著类别不平衡特性的金融欺诈检测基准数据集,其具体统计信息如表1所示。

Table 1. Statistical information related to the datasets

1. 数据集统计信息

数据集

总交易数

欺诈交易

欺诈率

时间跨度

特征维度

IEEE-CIS

1,000,000

5000

0.50%

6个月

200

Creditcard

284,807

492

0.17%

12个月

29

IEEE-CIS Fraud Detection Dataset:该数据集由Vesta Corporation提供,收录了来自大型在线电子商务平台的真实交易数据。其时间跨度长达数月,包含丰富的交易特征(如交易金额、产品类型、设备信息等)以及匿名的用户和商户标识。欺诈率极低,约为0.5%,高度契合真实世界的信用卡欺诈场景。

Creditcard Dataset:Kaggle平台提供的用于信用卡欺诈检测的公开数据集,包含2013年欧洲持卡人的交易记录,已通过PCA处理特征维度。

4.1.2. 基线模型

为进行全面对比,选择了三类共7种具有代表性的基线模型,如表2所示:

Table 2. Introduction to the baseline models

2. 基线模型的相关说明

类别

模型

说明

非图模型

XGBoost

一种高性能梯度提升决策树模型,是广泛使用的欺诈检测基准。

LSTM

长短期记忆网络,对用户历史交易序列建模,捕捉时序依赖。

静态图神经网络模型

GCN

图卷积网络,在静态图上通过图卷积聚合邻居信息。

GraphSAGE

通过采样和聚合邻居特征生成节点嵌入,适用于大规模图。

GAT

图注意力网络,通过注意力机制区分不同邻居的重要性。

动态图神经网络模型

TGN

当前最先进的连续时间动态图神经网络之一,集成了记忆模块和时序聚合。

JODIE

通过两个互动的RNN预测用户和项目的未来嵌入。

4.1.3. 实验设置

数据划分:严格按照时间顺序划分训练集(前70%)、验证集(中间15%)和测试集(后15%),以模拟真实的流式数据场景并避免时间信息泄露。

下采样:在训练过程中,对多数类(正常样本)进行下采样,以缓解类别不平衡问题,同时保证每个batch中正负样本比例约为1:3。

超参数设置:通过网格搜索法在验证集上优化所有模型的超参数。DTGNN-FD的关键超参数设置如下:记忆向量维度为128,时间编码维度为64,GRU隐藏层维度为128,注意力头数为4,时间衰减系数δ初始化为0.1。

模型训练:使用Adam优化器,学习率设置为0.001,采用早停策略防止过拟合。所有实验均重复5次并报告平均结果,以确保稳定性。

4.2. 整体性能对比

所有模型在两个数据集上的性能对比结果如表3所示。可以得出以下结论:

1) 图模型普遍优于非图模型:GCN、GAT等静态图模型和TGN、JODIE等动态图模型在绝大多数指标上均显著优于XGBoost和LSTM。这充分证明了利用交易实体间的关联信息对于欺诈检测,特别是团伙欺诈检测的巨大价值。

2) 动态图模型优于静态图模型:在GNN模型内部,TGN、JODIE和本文提出的DTGNN-FD的性能全面优于GCN、GraphSAGE和GAT。这表明了对时序动态性进行建模的必要性。静态图模型是历史信息的“平均快照”,难以捕捉最新的行为变化,导致检测延迟和性能下降。

3) DTGNN-FD达到最佳性能:本文提出的DTGNN-FD模型在F1-Score和Recall这两个核心指标上,在两个数据集上均取得了最佳性能。特别是在IEEE-CIS数据集上,DTGNN-FD的F1-Score比最强的基线模型TGN提高了2.1%,Recall提高了1.8%,如图3所示。这验证了DTGNN-FD通过其门控记忆机制和时间感知注意力聚合策略,能够更有效地捕捉用户行为的动态演化规律和欺诈模式的隐蔽关联,从而做出更及时、更准确的预测。

Table 3. Performance comparison of all models on two datasets (%)

3. 所有模型在两个数据集上的性能对比(%)

模型

IEEE-CIS Dataset

Creditcard Dataset

Precision

Recall

F1-Score

Precision

Recall

F1-Score

XGBoost

75.2

68.5

71.7

78.9

70.1

74.2

LSTM

76.8

71.3

73.9

80.2

72.6

76.2

GCN

81.4

75.2

78.2

83.5

76.8

80.0

GraphSAGE

82.1

76.0

78.9

84.1

77.5

80.7

GAT

83.5

77.8

80.6

85.3

79.1

82.1

JODIE

85.2

80.1

82.6

86.7

81.3

83.9

TGN

87.6

83.4

85.4

88.5

84.2

86.3

DTGNN-FD

88.9

85.2

87.5

89.8

85.9

87.8

Figure 3. DTGNN-FD achieves the best performance on both datasets

3. DTGNN-FD在两个数据集上均取得最佳性能

4.3. 消融实验

为验证DTGNN-FD中各个核心组件的有效性,我们在IEEE-CIS数据集上进行了系统的消融实验,结果如表4所示。

W/O Memory:移除门控记忆模块,将节点历史信息用零向量或静态嵌入代替。结果显示,F1-Score和Recall显著下降,这证明了记忆模块对于捕获节点长期行为模式和对抗概念漂移至关重要。

W/O Temporal Attention:将时间感知注意力聚合替换为普通的均值聚合或与时间无关的注意力聚合。性能明显下滑,这表明显式的建模时间临近性(越近的交互越重要)能极大地提升模型性能,是DTGNN-FD的核心创新之一。

W/O Time Encoding:移除函数式时间编码模块。性能损失表明,将连续时间戳映射为高维向量,为模型提供丰富的时序上下文信息,对于区分不同时间段的行为模式(如深夜交易)非常重要。

Table 4. Ablation experiment results on the EIEE-CIS dataset (%)

4. 在IEEE-CIS数据集上的消融实验结果(%)

模型变体

Precision

Recall

F1-Score

DTGNN-FD (Full)

88.9

85.2

87.5

W/O Memory

85.1

80.3

82.6

W/O Temporal Attention

86.8

82.1

84.4

W/O Time Encoding

87.2

83.5

85.3

5. 结论与未来工作

5.1. 结论

信用卡欺诈检测作为金融科技领域一项持续且严峻的挑战,其核心难点在于如何在极端类别不平衡、快速概念漂移和复杂动态关联的流式交易数据中,实现高精度、低延迟的风险识别。为此,本文提出了一种动态时序图神经网络欺诈检测模型(DTGNN-FD),该模型采用连续时间动态图范式,摒弃传统时间窗划分策略,实现对每笔交易的实时处理。通过门控记忆机制为节点维护动态更新的记忆向量以捕获行为模式演化并对抗概念漂移,采用时间感知注意力聚合机制确保模型聚焦最近发生的交互以提升对短期欺诈攻击的响应能力,并构建端到端的流式学习框架集成记忆更新、消息生成、时间聚合与预测功能,满足低延迟要求。在两个真实金融欺诈数据集(IEEE-CIS和Creditcard)上的实验表明:DTGNN-FD模型在整体性能上显著优于各类基线模型,与TGN相比在F1-Score和Recall指标上最高提升2.1%和1.8%,消融实验证实各核心模块(记忆模块、时间感知注意力及时间编码)均为模型不可或缺的组成部分。

5.2. 未来工作

尽管DTGNN-FD模型在信用卡欺诈检测方面展现出显著优势,未来研究仍可从四个方向深入拓展:首先,需增强模型的可解释性,通过集成图解释技术提取关键子图模式和特征,构建可视化的欺诈判定证据链以提升透明度;其次,将模型扩展至异构图结构,引入设备、IP地址等多类型实体节点,实现对复杂欺诈网络的深层关联推理;再者,优化计算效率,研究在线学习机制与模型轻量化技术(如动态采样、记忆压缩),平衡性能与实时性需求;最后,深化团伙欺诈检测能力,探索基于动态图的社区发现算法,从单笔交易识别升级为协同作案团伙的实时挖掘。

致 谢

感谢2025年度河北省金融科技应用重点实验室课题《基于图神经网络的信用卡异常交易行为识别研究》对本研究内容的经费和设备支持。

基金项目

河北省金融科技应用重点实验室课题,2025005。

NOTES

*通讯作者。

参考文献

[1] 中国人民银行支付结算司. 2024年支付体系运行总体情况[EB/OL].
http://www.pbc.gov.cn/zhifujiesuansi/128525/128545/128643/5589365/index.html, 2025-02-14.
[2] 卓佩妍, 张瑶娜, 刘炜, 等. CTGANBoost: 基于CTGAN与Boosting的信贷欺诈检测研究[J]. 计算机科学, 2024, 51(S1): 619-625.
[3] 蒋洪迅, 江俊毅, 梁循. 基于机器学习的信用卡交易欺诈检测研究综述[J]. 计算机工程与应用, 2023, 59(21): 1-25.
[4] Masuda, B. (1993) Credit Card Fraud Prevention: A Successful Retail Strategy. Crime Prevention Studies, 1, 121-134.
[5] 丁卫星. 基于深度学习技术的信用卡交易欺诈侦测研究[D]: [硕士学位论文]. 上海: 上海交通大学2025-09-24.
[6] 陈安琪, 陈睿, 邝祝芳, 等. 基于图神经网络的不平衡欺诈检测研究[J]. 计算机工程, 2023, 49(11): 150-159.
[7] 琚春华, 陈冠宇, 鲍福光. 基于kNN-Smote-LSTM的消费金融风险检测模型——以信用卡欺诈检测为例[J]. 系统科学与数学, 2021, 41(2): 481-498.
[8] 陈荣荣, 詹国华, 李志华. 基于XGBoost算法模型的信用卡交易欺诈预测研究[J]. 计算机应用研究, 2020, 37(S1): 111-112, 115.
[9] 周瑜, 顾宏. 面向不平衡数据的逻辑回归偏标记学习算法[J]. 大连理工大学学报, 2017, 57(2): 184-188.
[10] 萧嵘, 王继成, 张福炎. 支持向量机理论综述[J]. 计算机科学, 2000, 27(3): 1.
[11] 方匡南, 吴见彬, 朱建平, 等. 随机森林方法研究综述[J]. 统计与信息论坛, 2011, 26(3): 32-38.
[12] 段大高, 盖新新, 韩忠明, 等. 基于梯度提升决策树的微博虚假消息检测[J]. 计算机应用, 2018, 38(2): 410-414, 420.
[13] 厍向阳, 车子豪, 董立红. 基于特征融合和代价敏感学习的图像标注方法[J]. 计算机工程与设计, 2021, 42(11): 3114-3120.
[14] 杨祎玥, 伏潜, 万定生. 基于深度循环神经网络的时间序列预测模型[J]. 计算机技术与发展, 2017, 27(3): 35-38, 43.
[15] Ordóñez, F.J. and Roggen, D. (2016) Deep Convolutional and LSTM Recurrent Neural Networks for Multimodal Wearable Activity Recognition. Sensors, 16, Article 115. [Google Scholar] [CrossRef] [PubMed]
[16] 邵睿. 基于注意力机制和多通道图卷积网络的方面级情感分析方法研究[D]: [硕士学位论文]. 长春: 东北师范大学, 2024.
[17] 张玉慧, 陈黎, 琚生根, 等. 基于图注意力网络的多意图识别与语义槽填充联合模型[J]. 软件学报, 2024, 35(12): 5509-5525.
[18] 毕蓓, 潘慧瑶, 陈峰, 等. 基于异构图注意力网络的微博谣言监测模型[J]. 计算机应用, 2021, 41(12): 3546-3550.
[19] 李大舟, 于广宝, 高巍, 等. 基于时序卷积网络的词级语言模型研究与应用[J]. 计算机工程与设计, 2021, 42(2): 449-454.
[20] 彭梓航, 张全贵, 金海波, 等. 基于时间块动态图神经网络的序列推荐方法[J]. 计算机应用研究, 2025, 42(8): 2312-2319.
[21] 袁子轩, 张峰, 许岗, 等. 融合MAML和TGAT的机会网络动态链路预测模型[J]. 小型微型计算机系统, 2024, 45(12): 2957-2963.
[22] Yue, M., Liu, H., Chang, X., Zhang, L. and Li, T. (2024) TGN: A Temporal Graph Network for Physics Prediction. Applied Sciences, 14, Article 863. [Google Scholar] [CrossRef
[23] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, Ł. and Polosukhin, I. (2017) Attention Is All You Need. arXiv: 1706.03762