1. 引言
随着信息技术和数字媒体的迅猛发展,信息安全问题变得尤为重要。特别是在数字通信和互联网广泛应用的时代,信息的安全传输和隐秘通信成为了许多领域亟需解决的难题[1]。图像信息隐藏技术作为一种重要的信息保护手段,通过将秘密信息嵌入到普通图像中,使得信息传输过程更加隐蔽且难以察觉。这项技术被广泛应用于版权保护、军事通信和隐私保护等领域。
传统的图像隐写方法如最低有效位(LSB)替换、像素值差分(PVD)以及离散小波变换(DWT),通过对载体图像的像素值进行修改,将秘密信息隐藏其中。然而,这些方法的嵌入容量有限,信息隐藏量的增加可能会导致图像质量的下降,进而增加秘密信息被检测和分析的风险。随着隐写分析技术的进步,传统方法在信息安全性和隐蔽性方面的缺陷愈发明显[2]-[7]。
近年来,深度学习技术在计算机视觉领域取得了突破性进展,为图像处理和信息隐藏提供了新的可能性。深度学习算法通过自动学习图像的特征,能够更加有效地实现高容量的信息隐藏,并在保持图像视觉质量的同时增强信息的安全性和鲁棒性。自编码器、生成对抗网络(GANs)等深度学习模型已经成功应用于图像隐写领域[8]-[10],与传统方法相比,它们在隐写容量、隐蔽性、图像质量和抗隐写分析攻击的能力上都有显著提升。基于深度学习的图像信息隐藏技术相较于传统方法在隐写容量、安全性和图像质量上都有显著提升,尤其是在面对隐写分析攻击时表现出更强的鲁棒性。
然而,尽管这些方法取得了显著进展,但仍有改进空间,如在嵌入容量和图像质量之间的平衡、隐写分析攻击的抵抗力等方面。本文在此基础上,提出了一种基于编解码网络的更高效的大容量鲁棒图像隐写术方案,与其他隐写术方案的容量相比,本文方案在256 × 256像素彩色图像上实现了高达24 bpp的隐写容量。
2. 相关工作
图像信息隐藏技术已经在信息安全领域得到了广泛的应用。传统的隐写方法主要通过对载体图像的像素值进行修改来嵌入秘密信息,这些方法包括最低有效位(LSB)替换、像素值差分(PVD)以及离散小波变换(DWT)等[11]。这些技术在图像质量和嵌入容量之间取得了一定的平衡,但它们的嵌入容量有限,尤其是在面临隐写分析攻击时,其安全性和鲁棒性较差。因此,如何提高隐写容量和隐蔽性是传统隐写方法的一大挑战。
为了应对传统方法的局限性,近年来,深度学习在图像处理领域的成功应用为图像信息隐藏技术带来了新的发展方向[12]。深度学习通过其强大的特征提取能力,能够在更高的嵌入容量下保持载体图像的视觉质量,同时提高信息隐藏的安全性。
近年来,许多基于深度学习的隐写方法被提出。自编码器是其中的一种典型方法,它通过自动学习输入图像的紧凑表示,将秘密信息嵌入到载体图像中,并通过解码器实现信息的提取。Baluja [13]等人提出了一种基于卷积神经网络(CNN)的隐写算法,该算法利用自编码器架构,在保持图像质量的同时,实现了较高的嵌入容量。
生成对抗网络(GAN)近年来在隐写领域也引起了广泛关注[14] [15]。GAN通过生成器和判别器之间的博弈学习,不仅可以生成高质量的载体图像,还能提高对隐写攻击的抵抗能力。Zhu [16]等人提出的基于GAN的隐写算法,通过对抗学习,增强了隐写图像的隐蔽性,使其更难以被隐写分析检测到。
可逆隐写技术是近年来的另一个研究热点。该技术允许在提取秘密信息的同时完全恢复载体图像。传统隐写方法往往会对载体图像造成不可逆的损坏,而可逆隐写技术能够有效解决这一问题,特别是在需要高保真恢复载体图像的应用场景中[17] [18]。基于深度学习的可逆隐写方法,如通过CNN实现的可逆隐写,进一步提高了信息隐藏的鲁棒性和安全性。
3. 算法设计
所提出方法的工作流程如图1所示,由三个模块组成:预处理模块,嵌入网络和提取网络。预处理模块为嵌入网络生成载密图像做了准备。嵌入网络的目的是生成载密图像,将秘密图像隐藏在载体图像中。提取网络从载密图像中提取恢复秘密图像。预处理模块与嵌入网络一起放置在发送端,来生成隐写图像。提取网络在接收端,用于从载密图像中提取秘密图像。
Figure 1. Overall flow chart
图1. 总体流程图
3.1. 网络结构
编码器和解码器采用全卷积网络架构。编码器的输入是一个256 × 256 × 6的矩阵,包含一个256 × 256 × 3的RGB载体图像和一个同样大小的秘密图像,将这两者进行维度拼接。编码器的输出为一个256 × 256 × 3的RGB载密图像,如图2、图3所示。编码器的主要任务是将秘密图像嵌入到载体图像中,同时确保生成的载密图像在视觉上保持高质量。
Figure 2. Encoding network structure
图2. 编码网络结构
Figure 3. Decoding network structure
图3. 解码网络结构
在嵌入秘密图像的过程中,必须考虑到解码器提取秘密图像的准确性。编码器不仅需要确保秘密图像在视觉上难以察觉,还要保证嵌入的秘密信息能够被高精度地提取和恢复。因此,嵌入网络是整个架构的关键部分。它并非只是卷积层的简单叠加,而是结合了预处理和多维度拼接等技术。预处理用于提取输入图像中的关键特征,而多维拼接则用于对封面图像和秘密图像的特征进行有效组合,确保信息嵌入的有效性和图像质量的平衡。
3.2. 损失函数
与传统的图像重建不同,图像隐写过程需要输入和输出的过程。因此,引入了自定义的损失函数以提高架构的性能。需要计算两种损失:嵌入损失Lm和提取损失Le,总损失是嵌入损失和提取损失的加权总和。公式如下:
(1)
(2)
其中,C、H和W分别表示图像的通道数、高度和宽度。
表示图像第i行、第j列和第k个通道中0至255范围内的像素值。因此,模型的损失函数可以用公式表示:
(3)
4. 实验分析
实验在RTX3090 GPU上使用Python 3.8编程语言和Pytorch 1.11框架进行训练,学习率为0.001。从ImageNet数据集中随机选取了20,000张图像作为训练集,测试集包括从ImageNet数据集中随机选取的另外5000张图像,对于每张封面图像,使用的秘密图像是从训练集或测试集中随机选取的,所有图像都预处理为256 × 256 × 3 RBG图像。该网络已迭代500次,
。
4.1. 容量分析
图像水印算法的嵌入容量是评估图像水印算法的重要标准之一,其指在不造成视觉失真的情况下,所能够嵌入的最大信息量。相对嵌入容量是本章算法衡量嵌入容量的指标。本文提出的方案将彩色图像隐藏在彩色图像中,与传统的数据隐藏方案相比有了很大的改进。为了进一步研究该方案的隐藏容量,分析了该方案的相对容量。计算方法如下:
(4)
其中NS是秘密数据的大小,并且NC是载体图像的(像素数) × (通道数)。本算法的相对容量为24 bpp。
4.2. 视觉质量分析
在隐写或信息隐藏方案中,以峰值信噪比(PSNR)和结构相似性(SSIM)指标作为评价标准的方案被广泛使用。图像质量由PSNR、SSIM等指标组成的评价表进行评价,PSNR值高说明两幅图像之间的失真很小,隐藏图像的质量较好。类似地,在提取过程中,较高的PSNR可以指示所提取的图像的质量非常高。PSNR计算方法如下:
(5)
结构相似性指数(SSIM)也被广泛应用于信息隐藏领域。SSIM方法量化了亮度、对比度和结构三个因素的相似性。简化的SSIM可以通过诸如图像的方差和协方差的公式来计算。公式如下:
(6)
同时,通过对比载体图像和载密图像,可以发现重建的隐写图像与原始隐写图像没有明显差别,结果见表1和图4所示。
Figure 4. Images of experimental results
图4. 实验结果图像
Table 1. PSNR and SSIM of experimental result images
表1. 实验结果图像的PSNR和SSIM
Compare image |
PSNR (dB) |
SSIM |
Figure 3(a) |
32.7088 |
0.8972 |
Figure 3(b) |
33.8801 |
0.9182 |
Figure 3(c) |
32.9825 |
0.9073 |
Figure 3(d) |
33.5104 |
0.8770 |
5. 结论
本文提出了一种基于卷积神经网络(CNN)的端到端图像隐写方法,系统结构包括预处理模块、嵌入网络和提取网络。预处理模块对载体图像进行处理,以便嵌入网络能够将秘密图像嵌入其中,而提取网络则负责从生成的隐写图像中提取出秘密图像。实验结果表明,与传统隐写方法及其他深度学习隐写方法相比,该方法在峰值信噪比(PSNR)上具有显著优势,证明在信息隐藏中的安全性和鲁棒性更高。此外,该方法的容量为24 bpp,表明在实现高容量隐写的同时,仍保持了良好的隐写效果。
基金项目
北京市教委科研计划(KM202010015009, KM202110015004);北京市高等教育学会项目(MS2022093, MS2023204);北京市数字教育研究课题(BDEC2023619095);北京印刷学院思政重点项目(20240053);北京印刷学院青年卓越项目(Ea202411)。
NOTES
*通讯作者。