1. 引言
图像隐写是将秘密信息按照一定的规律嵌入到载体图像中,生成含密图像,使得秘密信息传输难以被人察觉。传统的空域隐写算法LSB [1] 或者JPEG域图像隐写方法Outgess [2]、nsF5 [3] 等,他们通过修改空域或DCT域系数,将二进制比特流嵌入到图像中。然而这样的隐写算法难以抵挡SRM [4]、DCTR [5] 等方法的攻击。
为抵抗隐写分析者的检测,隐写算法的设计者在设计隐写算法时引入STC编码方法 [6] 及嵌入失真函数 [7],将秘密信息嵌入到图像中难以被统计建模的位置,而这些位置大多为纹理复杂度较高的区域,如HUGO [8]、WOW [9]、UNIWARD [10] 等方法。为了针对此类自适应隐写算法,基于DCTR的SCA-DCTR [11] 隐写分析方法也相应产生,此方法是由DCTR加入对于像素嵌入概率的估计,从而使得针对自适应隐写方式有着较高的检测准确率。但是基于SRM隐写分析方法却没有类似的方式提高其对于自适应隐写算法的分析准确率。
其中SRM是一种准确度较高的空域高维度图像特征,通过各种滤波器对图像进行滤波处理后得到相应的特征量。然而SRM只考虑的像素点及其相邻位置像素的相关性,并没有考虑图像的纹理特征,没有对隐写时的未知进行预测,故在对于自适应隐写方法进行分析的时候对于准确率会有一定的降低。
针对此问题,本文在SRM特征上进行一定的改进,将其与图像的纹理特征进行快速结合,使其对于自适应隐写算法进行隐写分析时准确率有所提高。
2. 空域富模型
SRM是于2012年由Fridrich等人提出的一种高维度的空域隐写分析图像特征,是一种传统的通用隐写分析方法。通用隐写分析是不针对一种隐写算法的隐写分析方法,其步骤是通过提取已知图像的统计特征训练分类器,再利用训练好的分类器判别未知图像是否含密,隐写分析的步骤如图1所示。其中特征提取及分类器训练为传统通用隐写分析中较为重要的步骤,SRM即为一种建模的特征。
在文献 [4] 中指出,SRM隐写分析特征的抽取步骤分为:提取残差图像、残差图像的量化及截断、提取共生矩阵。
2.1. 提取残差图像
由于图像隐写是将二进制比特流嵌入到载体图像的空域或JPEG域中,等同于是将一个微弱的噪声与载体图像叠加,生成一个含密图像。这样将噪声叠加进来就会改变原始图像中相邻像素的相关性,残差图像亦然,故使用残差图像作为特征抽取的基底,这样可以减少图像内容对于隐写分析特征抽取的影响。
Figure 1. Steps of general steganalysis
图1. 通用隐写分析步骤
若灰度图像为
,经过SRM高通滤波器滤波可以得到残差图像
:
(2.1)
公式2.1中即为对图像进行高通滤波后得到的残差图像,其中
是根据图像中像素点
的领域对
的估计。
不同的高通滤波器可以对像素点的不同领域进行估计,所以Fridrich设计了多种多样的高通滤波去使对像素的评估模型更加全面和丰富,滤波器模型如图2所示。
在图2中
表示滤波器的中心,也就是待估计的像素点,其余的符号则为各式滤波器,相同符号表示相同的滤波器。
Figure 2. High pass filter (Fig. 2 in reference [4])
图2. 高通滤波器(文献 [4] 中的Fig. 2)
2.2. 提取共生矩阵生成特征
残差图像中一个像素点的幅值越大,则说明该像素点对应于领域像素的相关性较弱,由于残差图像中每个像素点的幅度各不相同,首先对图像进行量化及截断,希望能够将残差图像的范围限定在某一个区间,这样能够降低之后步骤的计算量。其量化及截断的步骤如下:
(2.2)
式2.2中Q为量化因子,T为截断阈值, 表示截断,
表示取整。根据不同的量化因子及截断阈值,可以改变SRM的检测性能,本文中取Q = 1,T = 2。
共生矩阵是统计某一距离上的一类像素的数量。由量化截断后的残差图像提取共生矩阵,得到的共生矩阵即为SRM最终想要抽取的隐写分析特征。所提取共生矩阵阶数的大小会直接影响特征抽取的结果,阶数过高会使得特征的统计无意义;阶数如果过低,又会使得特征不够丰富,降低分析准确率。本文中提取残差图像的四阶共生矩阵作为隐写分析特征,且Q = 1, T = 2,在文献 [4] 中被称作SRMQ1,即Q = 1,T = 2,d = 4。
3. 论加入图像纹理的空域富模型隐写分析方法
图像纹理 [12] 是一种能够反映物体表面的变化的属性,图像纹理复杂的区域像素变化大、周期性小,纹理平滑区域则像素变化平缓,周期性大,如图3。纹理在性质上来说是一种难以描述的视觉属性,但现在多采用由1973年Haralick [13] 等人提出的灰度共生矩阵来描述图像的纹理特征。灰度共生矩阵与共生矩阵的生成方法相同,是衡量图像空域中相隔某距离的两个像素之间的灰度关系,其中方向包括水平、竖直、对角线、逆对角线方向。最后再通过计算生成的灰度共生矩阵的特征参数,由此来描述图像的纹理信息。
Figure 3. Image of complex texture (left) and image of smooth texture (right)
图3. 复杂纹理图像(左)与平滑纹理图像(右)
Haralick等人定义了14个由灰度共生矩阵生成的特征参数来描述图像的纹理特征,而14个特征参数中有4个是非相关的,多被用于纹理特征的提取,本文中还加入另一个特征参数作为纹理特征,分别为能量、熵、对比度、相关性、均质性。通过取各个方向上灰度共生矩阵各个特征参数的均值及方差,就可以得到图像一个有较高分类精确度的10维特征。
如今自适应隐写多采用STC编码或损失函数来估计隐写对图像造成的改动,而在纹理复杂区域的改动往往对图像整体的影响较小,不易与被统计特征发现,这样损失函数最终确定的位置多位于纹理复杂的区域,所以自适应隐写的最终嵌入区域多处于纹理复杂区域。例如对图3中两幅图像进行S-UNIWARD方法以0.1嵌入率嵌入秘密信息,嵌入点如图4所示,其中黑色点为进行−1修改,白色点为进行+1修改。
Figure 4. Embedded location of S-UNIWARD
图4. S-UNIWARD嵌入位置
由于SRM无法对图像的纹理信息进行辨识,遗漏了图像的纹理信息,而自适应隐写改动多位于纹理复杂区域。对此本文采用将图像进行2 × 2分割,对每一块图像进行SRM判别。判别结果−1代表载体图像,+1代表含密图像,再将判别结果乘以相依块的10维纹理特征,最后按顺序拼接为,则可得到图像的40维纹理特征,最后再按照40维纹理特征进行分类。同理可将图像进行4 × 4或更高数量的切割,以提高对局部纹理特征的辨识度。其具体隐写分析步骤如图5。
本文所使用的特征分类器使用由Fridrich等人提出的集成分类器(Ensemble Classifer) [14] [15],此分类器对于大样本训练集训练速度快,分类效果好,能够明显缩短训练分类器的时间。集成分类器是以FLD
Figure 5. Steganalysis steps combining texture complexity and SRM
图5. 结合纹理复杂度的SRM隐写分析步骤
(Fisher Linear Discriminator)为基本分类器,通过有微弱差异的训练集对每个FID进行训练,最后将通过所有分类器的判决进行无加权投票,以投票数量为多数的结果作为最终结果。
4. 实验与结果分析
4.1. 实验配置
本文的采用的图片源自不同手机型号拍摄的原始未经处理的JPEG格式的照片(图片源自http://www.cihw.org.cn/index.php/9/),原始照片按最短边裁剪成正方形,然后统一缩放成1024 × 1024大小,筛选出品质因子分布在90~95之间的图像。将图像库统一使用matlab转换为BMP图像格式,并生成两组图像相同、品质因数分别为75和95的图像库。隐写方法使用S-UNIWARD及WOW,类似文献 [4],检测嵌入率使用0.1~0.5及0.05。由于修改式隐写方法在嵌入率低于0.05时已较难被发现,且在嵌入率大于0.5时多种隐写分析方法均能检测出图像已被隐写,故不使用低于0.05和大于0.5的嵌入率。
对于不同品质因数下的不同嵌入率,分别使用相同的2000张图像作为训练集,1000张图像作为测试集,分别嵌入后进行得到载体图像和含密图像,测试模拟已知隐写环境分类器效果。
4.2. 结果分析
通过测试对1000张图片进行分类后的错误率来对分类器性能进行评断,其错误率:
(4.1)
在式4.1中,、和
分别代表虚警样本数、漏警样本数、总样本数,这样就可以得到相应的分类器结果,从而判别分类器性能。
将通过纹理特征结合的SRM和原始SRM隐写分析性能进行对比,其中模拟已知隐写环境在S-UNIWARD隐写算法下,在载体图像品质因数QF为75及95的情况下错误率如图6及图7所示;其中模拟已知隐写环境在WOW隐写算法下,在载体图像品质因数QF为75及95的情况下错误率如图8及图9所示。
Figure 6. Error rate of steganalysis for S-UNIWARD when QF = 75
图6. QF = 75时对S-UNIWARD隐写分析错误率
图6中横轴为隐写嵌入率,纵轴为分类器进行分类后的错误率。可见本文结合图像纹理复杂度后的SRM隐写分析方法,在嵌入率为0.2、0.3时,对于采用S-UNIWARD为嵌入算法、载体图像品质因数QF = 75的图像对,检测错误率降低较为明显;而在0.05、0.1及0.5时降低不明显。
Figure 7. Error rate of steganalysis for S-UNIWARD when QF = 95
图7. QF = 95时对S-UNIWARD隐写分析错误率
类似于图7,可见本文算法在嵌入率为0.05和0.1时,相对于SRM错误率降低较少,其他嵌入率下错误率降低更为明显。且相比于选择载体图像品质因数QF = 75时,本文方法及SRM方法错误率均有所上升,且本文算法相对于SRM错误率的降低没有品质因数QF = 75时那么明显。所以品质因数高的图像更加能够抵抗隐写分析检测,本文的算法对于高品质因数下图像的隐写方法检测性能提升一般。
Figure 8. Error rate of steganalysis for WOW when QF = 75
图8. QF = 75时对WOW隐写分析错误率
由图8可见,其隐写分析性能曲线与图6曲线类似,说明S-UNIWARD与WOW隐写算法的隐写性能较为相近。而本文结合图像纹理复杂度后的SRM隐写分析方法,对于在嵌入率适中时,性能提升优于在嵌入率较高或较低的情况。因此,使用本文方法对采用WOW进行隐写的图像进行检测时,类似于S-UNIWARD,在嵌入率适中时相对于SRM隐写分析方法性能提升更加明显。
Figure 9. Error rate of steganalysis for WOW when QF = 95
图9. QF = 95时对WOW隐写分析错误率
由图9可见,在嵌入率大于0.1时,本文方法相对于SRM错误率有一定的降低,且在嵌入率适中时降低更加明显,与以S-UNIWARD作为隐写嵌入算法时的曲线类似。
可见在隐写嵌入率为0.2到0.4的时候,本文中的与纹理特征相结合的SRM隐写分析方法判别错误率,相较于SRM降低得更加明显。这说明本文提出的方法对于自适应隐写方法下隐写分析的检测性能有一定的提高,但是对于低嵌入率隐写或者图像高品质因数下的判别性能提升并不明显,所以本文方法适用于对中等嵌入率、图像品质因数不高的隐写图像进行隐写分析检测。
5. 总结与展望
本文从SRM隐写分析方法未考虑自适应隐写算法嵌入信息于图像纹理复杂区域的角度出发,提出了一种将图像纹理特征与SRM快速结合的图像隐写分析方法。先将图像进行分块判别,并将判别结果与块12维纹理特征结合,最后将纹理特征拼接,通过与判别结果结合后的纹理特征对图像进行分析。从实验结果中可以看出,在隐写嵌入率适中、图像品质因数不高时,此方法对针对于自适应隐写算法的检测错误率有一定的降低。
下一步,可以考虑如何将SRM特征与RGB通道等其他未考虑到的特征进行快速结合,提高隐写分析系统的性能,降低判别错误率。
基金项目
本文受到国家自然科学基金(U1736121)资助。
NOTES
*通讯作者。