1. 引言
随着物联网(IoT)和嵌入式设备的快速发展,轻量级分组密码因其低资源消耗和高软硬件实现成为保障数据安全的核心技术之一。Simon32/64 [1]是美国国家安全局(NSA)推选的轻量级加密算法,在资源受限环境中得到了广泛应用。然而它采用较短的32比特分组长度且相对简单的轮函数,研究者对其安全性保持持续关注[2] [3]。传统的密码分析方法,如差分分析[4]、线性分析[5],在面对Simon32/64算法中模乘运算时,难以构造有效的区分器,导致分析效果受限[6]。因此,需要探索新的分析手段以评估Simon32/64的安全性,为Simon32/64的安全性评估提供新的思路。
近年来,深度学习与差分分析的融合为密码分析提供了新的研究思路。2019年,Gohr [7]基于残差神经网络首次构造了Speck32/64的差分区分器,成功攻击了简化轮次的Speck32/64 [1],证明了深度学习在捕捉密码算法非线性特征方面的潜力。随后,研究者们主要从输入数据格式和神经网络架构两个方面对神经网络差分区分器进行优化。例如:2020年,Su等[8]提出多面体密文对作为输入数据格式,将8轮Simon32/64的神经网络差分区分器准确率提升至92%。2021年,Hou等[9]采用多输出差分对作为输入,提高了7~8轮Speck32/64和9~10轮Simon32/64的区分器准确率。2022年,Bao等[10]用挤压激励网络替代残差网络,优化Simon32/64的神经网络差分区分器,提高了分类精度。2023年,Chen等[11]采用多密文对作为输入,并应用于五种不同的密码算法,实验表明该方法能有效提升神经网络差分区分器的准确率。Zhang等[12]结合初始模块和残差网络,提出9~11轮Simon32/64的神经网络差分区分器。
尽管上述研究在Simon32/64的神经网络差分分析上取得了重要进展,但仍存在两大局限性。第一,输入数据格式与模型架构的优化缺乏系统性,现有研究往往孤立地结合单一数据格式与单一模型,例如多面体密文对[8]仅与残差网络结合,缺乏对多种数据格式与多种模型的系统性配对实验;第二,对加密过程中间轮次特征的挖掘不足,现有方法普遍依赖最终轮密文作为输入,难以有效捕捉算法内部的非线性传播规律。
针对上述问题,本文提出多维协同优化框架,系统探索输入数据格式与神经网络模型的组合效应对Simon32/64差分区分器性能的影响,提升了Simon32/64神经网络差分区分器的性能,为基于深度学习的密码分析方法提供了新的优化思路。主要贡献包括:
1) 本研究优化Simon32/64的输入数据格式,并探讨其与神经网络模型的协同作用。在现有输入数据格式的基础上,提出M3PODPR数据格式,以增强对Simon32/64非线性结构的表征能力。结合三种神经网络模型与五种数据格式,构建15种神经区分器进行系统分析。实验结果表明,该数据格式在所有模型中均优于现有格式,并在挤压激励网络下取得最佳表现,8~11轮Simon32/64任务的最高准确率分别达到100.00%、98.20%、79.55%和60.29%,展现出更强的泛化能力。
2) 明文均衡策略下的公平性分析:为确保实验公平性,本文采用2 × 107个明文样本进行训练,以消除不同数据格式间的固有偏差。实验结果表明,M3PODPR结合SENet仍能在8~11轮任务中取得最高准确率,分别为99.99%、96.14%、73.55%、51.37%,进一步验证了该方案的有效性。
3) 本研究将SENet与M3PODPR相结合,并与现有方法进行对比。实验结果表明,该方案在9~11轮Simon32/64任务中均取得最优性能,显著优于传统数据格式。
2. 预备知识
本章主要介绍Simon32/64轻量级分组密码的基本原理、不同输入数据格式的构造方法、用于密码分析的神经网络模型,以及Gohr提出的神经网络差分区分器。
2.1. 符号说明
本文的符号说明如表1所示。
Table 1. Symbol description
表1. 符号说明
符号 |
含义 |
|
循环右移/循环左移 |
|
按位异或运算 |
|
按位与运算 |
|
最后一轮子密钥 |
2.2. 加密算法Simon简介
Simon是美国国家安全局(NSA)于2013年提出的一类轻量级分组密码算法族,专为资源受限的嵌入式设备设计,其结构简洁,易于硬件实现。Simon家族包含多个版本,本文研究对象为Simon32/64,即分组长度为32位,密钥长度为64位,加密轮数为32轮。
Simon32/64采用Feistel网络结构,将32位明文分为左右两个16位分组,记为
和
,通过多轮迭代逐步混淆与扩散。每轮加密流程如下:
Simon32/64的密钥扩展算法以及其他详细信息可参考文[1]。
2.3. 不同输入数据格式
在Gohr提出的经典数据生成方法中,明文对
被加密为密文对
作为训练样本。其中正样本(标签1)是由满足输入差分
的明文对加密生成。负样本(标签0)是由随机明文对加密生成。在此基础上,研究人员提出了多种扩展的数据格式,以增强神经网络区分器的训练效果:
1) 多密文对(MCP: Multiple Ciphertext Pairs):采用t组明文对
,通过同一随机密钥加密生成组密文对
作为训练样本。
2) 多输出差分对(MOD: Multiple Output Differences):在多密文对的基础上,进一步计算t组密文对的差分
作为训练样本。
3) 单三面体密文对(S3PCP: Single 3-polytope ciphertext pair):在Gohr的数据生成方法上,将明文对扩展为三个明文
,并满足:
和
。
4) 单四面体密文对(S4PCP: Single 4-polytope ciphertext pair):在单三面体密文对的基础上,进一步扩展为四个明文
,并满足:
、
和
。
这些扩展数据格式通过增加明文对数量或引入多面体结构,丰富了训练样本的统计特征,使神经网络区分器能够更有效地捕捉密码算法的非线性特征。图1展示了多密文对和多输出差分对的生成过程。
Figure 1. Generation process of multiple ciphertext pairs and multiple output differences
图1. 多密文对和多输出差分对的生成过程
2.4. 神经网络模型架构
近年来,深度学习在密码分析领域的应用不断深入,神经网络架构的优化显著提升了差分区分器的性能。本文主要介绍三类适用于Simon32/64神经网络分析的经典模型。
1) 残差网络(ResNet: Residual Network):He等[13]于2016年提出ResNet,其核心通过残差连接缓解深层网络的梯度消失问题。残差块的数学定义如下:
其中,x为输入,F为卷积层和非线性激活函数的组合,Wi为权重矩阵。残差连接允许网络直接传递原始输入,使得深层网络训练更加稳定。在密码分析中,ResNet因其强大的特征传递能力被广泛采用。
2) 初始模块和残差网络的混合网络(Inception + ResNet: Inception Module and Residual Network):Szegedy等[14]提出的初始(Inception)模块采用并行多尺度卷积,增强了特征空间的多样性。Inception + ResNet结合了Inception的多尺度特征提取能力和ResNet的稳定梯度传递特性。
3) 挤压激励网络(SENet: Squeeze-and-Excitation Network):Hu等[15]于2018年提出SENet,其核心思想是通道注意力机制,通过挤压和激励两步操作动态调整特征通道的重要性。挤压操作对特征图进行全局平均池化,生成通道描述向量。激励操作通过全连接层学习通道间依赖关系,输出通道权重。在密码分析中,SENet能够聚焦于关键差分特征,抑制噪声干扰,提升区分器性能。
2.5. Gohr的神经网络差分区分器
Gohr针对Speck32/64设计了一种基于深度学习的神经网络区分器[7],该方法采用单一密文对(SCP: Single Ciphertext Pairs)的数据格式仅需约束单一明文差分
即可实现有效分类。对于给定的密码算法E,区分器的目标是判定密文对
是否来源于满足特定差分条件的明文对
,其标签函数定义为:
Gohr采用单输出神经元的残差网络作为基础架构,最终输出样本属于正类的概率,当预测概率大于0.5时,判定样本标签为1,否则为0。
3. M3PODPR数据格式
本节提出了一种新的输入数据格式M3PODPR (Multiple 3-Polytope Output Differences in Penultimate Round),用于增强神经网络区分器对Simon32/64倒数第二轮非线性特征的捕捉能力。该格式基于多面体密文对的输出差分,结合数据增强技术,以提升分类器的识别精度。接下来介绍其生成流程,并分析其在Simon32/64区分任务中的优势。
3.1. 设计动机
Benamira等[16]研究表明,神经网络差分区分器能够有效捕捉加密算法倒数第二轮和倒数第三轮的中间状态特征。受此启发,本文提出一种新的输入数据格式,旨在提Simon32/64倒数第二轮的输出差分信息,以增强神经网络区分器对中间轮次的非线性特征的捕捉能力。
3.2. Simon32/64算法的特性
Figure 2. Output information of the penultimate round in Simon32/64
图2. Simon32/64倒数第二轮输出的信息
给定n面体密文对
,根据Simon32/64的加密特性,可以从密文逆向推导出倒数第二轮的部分输出信息,具体过程如图2所示。若已
及最后一轮子密钥
,可计算倒数第二轮的输出
,即使未知
,仍可直接获得右半部分的差分信息
。因此基于多面体密文对,可以构造出倒数第二轮的多面体输出差分:
。这种数据格式可用于训练神经网络区分器,以更深入地捕捉Simon32/64的中间轮次非线性特征。
3.3. M3PODPR数据生成过程
本文采用三面体密文对的格式,在生成倒数第二轮的三面体输出差分后,进一步采用数据增强技术,即:在倒数第二轮,应用多个三面体输出差分,增强数据集的统计特征。具体实现如图3所示:
1) 使用任意主密钥,加密t组三面体明文对:
2) 得到t组三面体密文对:
3) 进一步计算倒数第二轮的输出差分:
4) 以此构造新的输入数据格式,定义为倒数第二轮的多三面体输出差分(M3PODPR: Multiple 3-Polytope Output Differences in Penultimate Round)。
Figure 3. Generation process of M3PODPR
图3. 倒数第二轮的多三面体输出差分的生成过程
4. 基于多数据–多模型Simon32/64区分器的协同优化实验
针对Simon32/64神经区分任务,研究了不同数据格式与神经网络模型的组合对区分器性能的影响。首先,在固定训练集107下,评估五种数据格式与三种深度学习模型的组合性能,以寻找准确率最高的区分器。随后,为确保不同数据格式在相同明文消耗量2 × 107下进行公平对比,进一步开展公平性实验。
4.1. 实验环境
本文在Linux平台上使用Python 3.6.15进行实验,服务器配置如下:AMD EPYC 7542处理器(32核)、667GB内存、NVIDIA GeForce RTX 3090 (24GB显存),实验存储为50GB NVMe SSD,并使用CUDA 12.2和TensorFlow 2.5.0实现模型。
4.2. 生成输入数据格式
本实验基于Gohr提出的神经网络区分器训练范式,采用二元交叉熵损失函数及动态学习率调整策略,通过替换输入数据格式与模型架构,系统评估不同组合对Simon32/64区分器性能的影响。相较于Gohr提出的单一数据格式(单密文对)和单一模型(残差网络),本文扩展至五类数据格式,具体如下:
1) 多密文对(MCP: Multiple Ciphertext Pairs)
采用随机密钥加密多个明文对
,生成多密文对
,明文对的输入差分为
。
2) 多输出差分对(MOD: Multiple Output Differences)
采用随机密钥加密多个明文对
,生成多输出对
,明文对的输入差分为
。
3) 单三面体密文对(S3PCP: Single 3-Polytope Ciphertext Pair)
采用三明文
构造三面体密文
对。并满足输入差分
和
。
4) 单四面体密文对(S4PCP: Single 4-Polytope Ciphertext Pair)
采用四明文
构造四面体密文
对。并满足输入差分
、
和
。
5) 倒数第二轮多三面体输出差分对(M3PODPR: Multiple 3-Polytope Output Differences in Penultimate Round)
采用多三面体明文对
,通过逆向计算倒数第二轮的输出差分:征
。并满足输入差分
、
。
4.3. 神经网络模型设计与架构
为了提升神经网络对Simon32/64差分特征的学习能力,本文采用三种深度学习模型进行实验分析,包括ResNet、Inception + ResNet和SENet。以下分别介绍这三种模型的具体架构。
ResNet:继承Gohr的基线架构。图4详细展示了本文所采用的残差网络的具体结构。其中,在模块1中,包含一个一维卷积神经网络(1D-CNN),其卷积核大小(Kernel Size)为1,滤波器数量(Filters)为32。在模块2中,网络由两个1D-CNN组成,每个卷积层的核大小均为3,滤波器数量同样设定为32,以提取更深层次的特征信息。最后,在模块3中,网络采用了三层全连接层(Fully Connected Layers),其输出维度依次为64、64和1,以进一步整合前面提取的特征并完成最终的分类。
Figure 4. Residual network model structure
图4. 残差网络模型结构
Inception + ResNet:结合多尺度卷积与残差连接,结构如图5所示。初始模块通过1 × 1、2 × 2和8 × 8不同尺寸的卷积核并行提取多尺度局部特征,增强模型对不同粒度信息的感知能力。残差模块进一步筛选重要通道,强化关键信息的传递。在模块1中,包含三个1D-CNN,卷积核大小分别为1、2和8,滤波器数量均为32。模块2由两个1D-CNN组成,初始卷积核大小为3,滤波器数量增加至96,并在每个残差块后逐步增大2,以扩展感受野,提升长距离依赖建模能力。该架构兼具特征提取的多样性与关键信息增强能力,有效提升模型性能。
Figure 5. Hybrid network model of the inception module and residual network
图5. 初始模块和残差网络的混合网络模型
SENet:引入通道注意力机制优化特征权重。图6展示了本文使用的挤压激励网络的结构,模块1采用1D-CNN进行初步特征提取,卷积核大小为1,滤波器数量64,并通过两个全连接层(输出维度均为64)进一步处理。模块2由两个1D-CNN组成,卷积核大小均为3,滤波器数量64,同时包含两个全连接层(输出维度64)。模块3由三层全连接层组成,输出维度依次为128、128、1,用于整合特征并完成最终预测。该架构通过注意力机制自适应调整特征权重,有效提升模型的特征表达能力和关键信息捕获能力。
Figure 6. Squeeze-and-Excitation network model structure
图6. 挤压激励网络模型结构
4.4. 基于107训练集的神经网络区分器性能评估
为了全面评估不同数据格式与模型架构的组合性能,实验采用五种数据格式与三种神经网络模型,共构建15种神经网络区分器。训练集、验证集和测试集的规模分别为107、106和106。在区分器训练100个epoch后,8~11轮Simon32/64的测试集准确率如表2和图7所示。实验中,仅当准确率超过51%时,区分器被视为有效。
从实验结果可以看出,不同数据格式在各类神经网络模型中的表现存在显著差异,同时数据格式对明文的消耗量也影响了区分器的性能,表明数据输入方式对神经网络的学习能力至关重要。
MCP、S3PCP和S4PCP在Inception + ResNet结构下表现最佳。例如,当输入数据格式为S4PCP时,基于Inception + ResNet的区分器在9轮Simon32/64任务中的测试集准确率达到71.26%,显著优于基于ResNet下63.64%和SENet下65.43%的准确率。从数据特性来看,MCP、S3PCP和S4PCP直接由密文对构成,完整保留了密文的全局分布模式和局部比特的关联性,使得数据维度较高,要求模型同时捕捉局部细节与宏观统计特征。而Inception + ResNet通过多尺度特征提取与深层残差连接,能够更有效地学习这类高维数据。其中,Inception模块采用1 × 1、2 × 2和8 × 8卷积核的并行结构,2 × 2卷积关注邻近比特的局部关联性,而8 × 8卷积则识别更大范围的统计偏差,实现不同尺度的特征提取。同时,ResNet结构通过残差连接缓解梯度消失问题,提升模型的稳定性,使其在处理高维密文数据时仍能保持良好的学习能力。
此外,从明文消耗量的角度来看,S3PCP和S4PCP相较于MCP具有更低的明文消耗量,分别为3 × 107和4 × 107,而MCP的明文消耗量为32 × 107。尽管S3PCP和S4PCP明文消耗量较少,但其在Inception + ResNet结构下的9轮区分任务中仍能保持较高准确率(S3PCP为69.47%, S4PCP为71.26%),表明在一定范围内,通过优化数据格式,可以在降低明文消耗量的同时保持较好的区分能力。然而,当轮数增加至10轮及以上,S3PCP和S4PCP的准确率均下降至51%以下,表现出失效现象,说明在深轮次任务中,低明文消耗的数据格式难以提供足够的可学习特征,导致区分器的有效性降低。
相比之下,MOD和M3PODPR在SENet结构下表现最佳。例如,当输入数据格式为M3PODPR时,基于SENet的区分器在10轮Simon32/64任务中的测试集准确率达到79.55%,相比基于Inception + ResNet结构下75.41%的准确率提高4.14%。从数据特性来看,MOD和M3PODPR主要基于输出差分(异或结果),相比直接使用密文对,这类数据的关键信息密度较低,数据分布较为稀疏,且关键特征信号较弱,容易受到噪声干扰。而SENet采用通道注意力机制,通过“挤压–激励”操作自动学习各通道的重要性权重,能够动态调整特征通道的权重,强化关键差分信息,同时抑制无关噪声干扰。相比Inception + ResNet的静态多尺度卷积,SENet能够根据输入数据的特征自适应调整权重,因此在处理MOD和M3PODPR这类非均匀分布的数据格式时表现更优。
值得注意的是,尽管MOD和M3PODPR在数据结构上相比MCP、S3PCP和S4PCP具有更低的信息密度,但M3PODPR通过引入更复杂的差分信息,提供了更丰富的可学习特征。在明文消耗量上,M3PODPR明文数量为48 × 107,明显高于MCP、MOD、S3PCP和S4PCP。实验结果表明,尽管M3PODPR需要消耗更多的明文进行训练,但其提供的高质量特征能够有效提升区分器的性能,使其在10轮及以上任务中仍能保持较高的准确率(10轮任务中,基于SENet结构的区分器测试集准确率达到79.55%,11轮任务中仍能保持60.29%)。相比之下,其他四种数据格式(MCP, MOD, S3PCP和S4PCP)在10轮及以上完全失效,准确率均低于51%。这一结果表明,在深轮次任务中,增加明文消耗量有助于增强区分器的稳定性和泛化能力,尤其是当数据格式能够提供更具区分性的特征时,额外的明文消耗可以转化为显著的性能增益。
综合来看,M3PODPR在三种神经网络模型ResNet、Inception + ResNet和SENet中均取得最优表现,Table 2. Test accuracy of Simon32/64 neural distinguishers in rounds 8~11 with the 10⁷ training set sizes
表2. 基于107训练集8~11轮Simon32/64神经区分器的测试集准确率
网络模型 |
数据格式 |
训练明文数据量 |
测试准确率(%) |
8轮 |
9轮 |
10轮 |
11轮 |
ResNet |
MCP |
32 × 107 |
95.12 |
71.34 |
无效 |
无效 |
MOD |
32 × 107 |
81.23 |
60.23 |
无效 |
无效 |
S3PCP |
3 × 107 |
90.86 |
61.33 |
无效 |
无效 |
S4PCP |
4 × 107 |
92.13 |
63.64 |
无效 |
无效 |
M3PODPR |
48 × 107 |
99.99 |
90.25 |
70.16 |
53.95 |
Inception + ResNet |
MCP |
32 × 107 |
100.00 |
88.70 |
无效 |
无效 |
MOD |
32 × 107 |
83.34 |
64.76 |
无效 |
无效 |
S3PCP |
3 × 107 |
93.68 |
69.47 |
无效 |
无效 |
S4PCP |
4 × 107 |
95.47 |
71.26 |
无效 |
无效 |
M3PODPR |
48 × 107 |
100.00 |
93.20 |
75.41 |
55.29 |
SENet |
MCP |
32 × 107 |
93.70 |
75.41 |
无效 |
无效 |
MOD |
32 × 107 |
85.47 |
69.35 |
无效 |
无效 |
S3PCP |
3 × 107 |
75.34 |
64.76 |
无效 |
无效 |
S4PCP |
4 × 107 |
82.20 |
65.43 |
无效 |
无效 |
M3PODPR |
48 × 107 |
100.00 |
98.20 |
79.55 |
60.29 |
Figure 7. Test accuracy of Simon32/64 neural distinguishers in rounds 8~11
图7. 8~11轮Simon32/64神经区分器的测试集准确率
且在SENet结构下达到全局最优,成为15种神经网络区分器中的最佳方案。实验结果显示,仅当输入数据格式为M3PODPR时,基于ResNet、Inception + ResNet和SENet的区分器才能在10轮和11轮Simon32/64任务中保持有效性。相比之下,其他四种数据格式MCP、MOD、S3PCP和S4PCP在10轮及以上完全失效,准确率均低于51%。这一结果表明,M3PODPR格式不仅能够规避最终轮密钥混淆的影响,同时结合适当的明文消耗量优化了区分器的训练过程,在深轮次任务中展现出更强的区分能力和稳定性。
4.5. 基于2 × 107个明文的神经网络区分器性能评估
Table 3. Number of single-sample plaintexts for five data formats
表3. 五类数据格式的单样本明文的数量
数据格式 |
单样本明文的数量 |
MCP |
32 |
MOD |
32 |
S3PCP |
3 |
S4PCP |
4 |
M3PODPR |
48 |
在初步实验中,由于五类数据格式的单样本明文数量不同(见表3),导致在相同训练集规模(107个样本)下,总明文量存在显著差异。这一不均衡性可能会影响不同数据格式的神经区分器训练效果,使得某些数据格式在训练过程中受益于更丰富的明文信息,从而影响实验结果的公平性。
为消除明文总量差异对性能评估的影响,本节增设公平性实验组,强制所有数据格式的总明文量固定为2 × 107,并通过调整训练集规模实现数据均衡。具体调整方案如下:
训练集大小的计算方式:
验证集和测试集大小的计算方式:
这一调整方案能够有效消除不同数据格式在明文利用率上的差异,确保实验对比的公平性,使得不同数据格式的神经区分器性能可以在相同明文总量的前提下进行客观评估。实验结果如表4所示。
实验结果表明SENet结合M3PODPR结构在8~10轮的准确率最高分别是99.99%、96.14%和73.55%,显著优于ResNet和Inception + ResNet,进一步验证了SENet的通道注意力机制能够有效增强差分特征的学习能力。相比之下,其他四种数据格式MCP、MOD、S3PCP、S4PCP在10轮及以上完全失效,说明仅依赖最终轮密文对难以提供有效的区分信息,而MOD格式在所有轮次均无效,表明单独使用输出差分不足以训练出有效的神经区分器。此外,Inception + ResNet结合M3PODPR发生过拟合,可能是由于该模型结构复杂,所需训练样本较多,但公平性实验减少了训练集大小,导致泛化能力下降,需要进一步调整正则化策略或优化模型参数。
Table 4. Test accuracy of Simon32/64 neural distinguishers in rounds 8~11 with 2 × 10⁷ plaintexts
表4. 基于2 × 107个明文8~11轮Simon32/64神经区分器的测试集准确率
网络模型 |
数据格式 |
训练集大小 |
测试准确率(%) |
8轮 |
9轮 |
10轮 |
11轮 |
ResNet |
MCP |
2 × 107/32 |
76.54 |
50.61 |
无效 |
无效 |
MOD |
2 × 107/32 |
无效 |
无效 |
无效 |
无效 |
S3PCP |
2 × 107/3 |
82.70 |
64.43 |
无效 |
无效 |
S4PCP |
2 × 107/4 |
83.30 |
65.76 |
无效 |
无效 |
M3PODPR |
2 × 107/2 |
99.10 |
85.60 |
62.76 |
无效 |
Inception + ResNet |
MCP |
2 × 107/32 |
过拟合 |
MOD |
2 × 107/32 |
无效 |
无效 |
无效 |
无效 |
S3PCP |
2 × 107/3 |
91.20 |
65.43 |
无效 |
无效 |
S4PCP |
2 × 107/4 |
91.32 |
65.87 |
无效 |
无效 |
M3PODPR |
2 × 107/2 |
过拟合 |
SENet |
MCP |
2 × 107/32 |
88.43 |
58.75 |
无效 |
无效 |
MOD |
2 × 107/32 |
无效 |
无效 |
无效 |
无效 |
S3PCP |
2 × 107/3 |
69.03 |
53.60 |
无效 |
无效 |
S4PCP |
2 × 107/4 |
68.74 |
53.47 |
无效 |
无效 |
M3PODPR |
2 × 107/2 |
99.99 |
96.14 |
73.55 |
51.37 |
4.6. 与现有研究的实验结果对比
本节将本文最佳实验结果(SENet结合M3PODPR构造的区分器)与现有研究的实验结果进行对比分析,以评估本研究方法在神经区分任务中的改进效果。本对比主要针对9~11轮Simon32/64任务的区分器准确率,同时,为了确保公平性,现有研究的实验结果中也取其最优结果进行比较。通过分析不同方法在这些轮次上的测试集准确率,可以直观地验证M3PODPR数据格式的有效性以及SENet结构在特征提取方面的优势。
Table 5. Comparison of experimental results between this study and related works
表5. 本研究与相关工作的实验结果对比
网络模型 |
数据格式 |
轮数 |
准确率% |
来源 |
ResNet |
S4PCP |
9 |
63.73 |
文献[8] |
SENet |
SCP |
9 |
65.15 |
文献[10] |
ResNet |
MOD |
9 |
82.27 |
文献[9] |
Inception + ResNet |
MCP |
9 |
96.30 |
文献[12] |
SENet |
M3PODPR |
9 |
98.20 |
本文4.1节 |
ResNet |
S4PCP |
10 |
50.14 |
文献[8] |
SENet |
SCP |
10 |
56.10 |
文献[10] |
ResNet |
MOD |
10 |
61.09 |
文献[9] |
续表
Inception + ResNet |
MCP |
10 |
72.30 |
文献[12] |
SENet |
M3PODPR |
10 |
79.55 |
本文4.1节 |
ResNet |
S4PCP |
11 |
- |
文献[8] |
SENet |
SCP |
11 |
51.74 |
文献[10] |
ResNet |
MOD |
11 |
- |
文献[9] |
Inception + ResNet |
MCP |
11 |
58.78 |
文献[12] |
SENet |
M3PODPR |
11 |
60.29 |
本文4.1节 |
如表5所示,根据实验结果,我们对不同方法的优缺点进行了深入分析,并通过实验数据进行了详细对比。Su等[8]提出的S4PCP (单四面体密文对)结合ResNet结构在9轮上实现了63.73%的准确率,虽然通过多面体密文对增强了特征信息,但仍然依赖最终轮密文,在深轮次任务(10轮及以上)中失效(准确率降至50.14%或更低)。Bao等[10]提出的SCP (单密文对)数据格式结合ResNet进行分类,具有训练速度快、计算成本低的优势,但仅使用单一密文对,导致区分能力受限,9轮准确率仅为65.15%,且在10轮及以上下降至56.10%,无法有效识别深轮次的密码特征。Hou等[9]采用MOD (多输出差分)数据格式,在9轮Simon32/64任务中的准确率达到82.27%,但在11轮时仍然存在信息丢失问题,无法维持有效的区分能力。Zhang等[12]结合MCP (多密文对)数据格式与Inception + ResNet结构,在9轮任务中取得了96.30%的准确率,相比ResNet和SCP具有更强的特征提取能力,但在10轮任务中准确率下降至72.30%,11轮进一步降至58.78%,表明该方法的泛化能力仍然有限。相比之下,本文提出的M3PODPR数据格式结合SENet,在9轮任务中实现了98.20%的最高准确率,并在10轮和11轮任务中分别达到79.55%和60.29%,均显著优于现有方法,证明了倒数第二轮特征增强的有效性,同时展现出更强的泛化能力。然而,该方法相较于其他方法对明文的消耗量较大,是未来优化的一个方向。
从理论上来看,M3PODPR数据格式能够取得优异结果的主要原因在于Simon32/64采用Feistel结构,每轮加密过程中,密钥混合操作会不断引入新的非线性特征。相比最终轮密文,倒数第二轮的输出仍然保留了部分未被最终轮密钥完全混淆的状态信息,使得神经网络在学习过程中能够更有效地捕捉和利用这些特征。此外,信息熵分析表明,倒数第二轮的输出差分携带了更高的信息量,从而增强了数据的区分性,使M3PODPR格式能够提取更丰富的密码学特征,进一步提升神经区分器的分类能力。然而,将该数据格式构造的神经区分器应用于密钥恢复攻击时,仍需消耗大量选择明文,这在实际应用中可能带来一定的开销,因此如何优化明文利用效率将是未来研究的重要方向。
5. 总结与展望
5.1. 总结
本研究围绕神经区分任务,对五种不同的数据格式MCP、MOD、S3PCP、S4PCP、M3PODPR和三种不同的神经网络架构ResNet、Inception + ResNet、SENet进行了系统的对比实验,共构建了15种不同的神经区分器,并在8~11轮Simon32/64算法上进行了测试分析。实验结果表明,数据格式的选择对于神经区分器的性能具有重要影响,其中M3PODPR格式在所有轮次下均表现最佳,显著优于传统的MCP、MOD、S3PCP和S4PCP格式,证明了引入多轮次密文信息可以有效提升神经区分器的准确率。同时,在不同的网络架构对比中,SENet由于其通道注意力机制,在所有数据格式下均表现优于ResNet和Inception + ResNet,展现了更强的特征提取能力。最终,SENet结合M3PODPR的组合在9~11轮任务中均取得最优结果,其中9轮(98.20%)和10轮(79.55%)的准确率远超现有研究,11轮(60.29%)的准确率也保持领先,展现了较好的泛化能力。然而,随着轮次的增加,所有方法的准确率均有所下降,在11轮任务中,大部分传统数据格式准确率都接近50%,表明神经区分器在更高轮次任务中的能力受限。本研究的实验结果充分证明了M3PODPR数据格式的有效性以及SENet在神经区分任务中的优势,为后续研究提供了新的优化方向。
5.2. 未来展望
尽管本研究取得了较好的实验结果,但仍存在一些值得进一步探讨的问题。首先,如何进一步提升神经区分器在高轮次任务(如11轮及以上)的准确率,仍然是一个重要挑战,可以考虑引入更深层次的特征表示或优化训练策略来增强模型的泛化能力。其次,本研究主要基于Simon32/64进行实验,未来可以扩展至其他轻量级密码(如Speck、PRESENT),验证M3PODPR格式的通用性。最后,随着神经密码分析技术的发展,还可以探索如何结合传统密码分析方法(如差分路径搜索)与神经网络,提高攻击的可解释性和效率。
基金项目
本研究得到了国家自然科学基金资助项目(62002184)、安徽省高校自然科学重点项目(2024AH050011)和香港狮子山网络安全实验室研究课题资助(LRL24017)的资助。