1. 背景
在飞速发展的当今时代,为保护多媒体产品的版权,数字水印技术应运而生,并取得良好效果,主要应用于数字图像、音频、视频、数据库和软件。数字水印音频的研究起步较晚于对数字水印图像的研究。数字声音标记技术的研究主要分为两类:时间域数字标记算法、频率域数字标记算法。时间域数字标记算法是指时间范围内的直接信号变化,使自己想要标记的部分嵌入到音频中。
近些年来,基于离散波变换的数字水印算法研究越来越多。随之也应用到了DWT和其他变换域组成的公共域上。它克服了固定DFT视频分辨率的缺点,定位特性良好。小波变换的多分辨特性可以将音频分解成多个级别,将信号分割成多个子波段,自主处理,计算效率较高,在实际应用中很容易实现。2007年,尹雄等人提出了LSB算法的改进,将水印嵌入到小波算法的系数中。在水印中嵌入了同步信号,使水印获得同步。该算法可以提取水印而无需使用原始音频信号,这种称为水印的盲提取过程 [1]。当今应用最广泛的是DWT和DCT两种算法,嵌入在数字音频中,保护音频在使用过程中不受到攻击,从而保护创者的版权。
2. 数字音频水印的概述
数字音频水印是通过算法将水印编写到音频中,并具有相对的隐蔽性,不能使人们听出添加水印前后存在的细微差别。这项技术的实现具有一定的难度,一是人类的听觉较为灵敏,二是在把水印嵌入到算法中后,还需要相应的提取技术,还原数字音频。在这里分析两种算法的优缺点,基于离散小波变换(DWT)的水印算法和离散余弦变换(DCT)算法。
2.1. 数字音频水印攻击类型
水印的攻击主要有噪声的干扰、低通滤波、重采样等,当今水印的抗攻击能力已大幅提高。
噪声干扰:增强噪声干扰是指在加入水印后,对声音讯号加入噪声干扰。平均噪声可以是高斯或白噪声。通常,带有水印的数字音频信号在传输时也会产生背景噪声。另一种可能是受其它攻击的影响,噪声干扰会改变大小 [2]。
低通滤波:是指将嵌入水印的的数字音频进行滤波处理。首先根据不同的音频信号选择不同的低通滤波器,然后对滤波器参数进行设置后,将数字音频信号输入滤波器中,通过处理后的信号即为低频信号。
重采样:在一段数字音频信号中的重新采样,需使用不同的采样频率,与原采样频率进行比对。重采样也有两种,纵轴采样和横轴采样。
2.2. 数字音频水印的评价标准
数字音频水印是否有有效,取决于多个方面,其中较为重要的一个因素即为鲁棒性。
鲁棒性是指控制系统具有的相对稳定性,表示频率范围内控制系统稳定性的效能指标和变更原则,自动控制理论中的限制和消除干扰理论密切相关。引入内部模型原理,将动态外部信号模型插入控制单元以创建高精度反馈控制系统的设计原理,在支持鲁棒性研究中起着重要作用 [3]。当系统中存在不确定因素,如模型破坏或随机扭曲时,鲁棒控制是一种理论和控制方法,可以保持满意的功能质量。早期强有力的控制主要研究单周期系统的频率特性或基于小故障分析的灵敏度问题。现代鲁棒控制主要研究微观结构的分析和理论与设计方法,而不限制控制系统的干扰。
控制系统的鲁棒性是指控制系统在任何干扰(包括模型降级)期间不变更特定效能指标的能力,具有极强的抗干扰能力。对于实际工程系统,人们最担心的是当模型参数发生很大变化或结构发生变化时,控制系统是否能够保持渐近稳定,称为稳定性稳健。
数字音频水印技术的鲁棒性是指在传统的信号处理过程之后检测水印的能力。下面基于数字音频水印的鲁棒性展开对两种水印算法的研究。
3. DWT算法的研究
数字音频水印在算法研究方面在最近几年聚焦在离散小波变换(DWT)和DWT变换域组成的公共域上,DWT提出了良好的定位特性。多分辨DWT的特性可以将声音分解成多个层次,这样分块计算会大大提高计算效率。基于波标记转换的音频水印算法,它使用的是一种量化波系数,用于添加有关水印的信息,这是安装盲水印的算法 [4]。将水印纳入小波转换领域,可以充分发挥小波高分辨率转化的特性,小波的转化具有很好的能量压缩能力。波变后,音频的能量主要集中在接近信号的系数上。水印通过修改详细信号系数嵌入信号中,确保水印算法的实现。
DWT算法在近年来的广泛使用,得益于摆脱了傅里叶变换复杂算法的限制,可以更清晰表现出信号的时域特性,使我们更清晰去分析不同区域的信号的不同分表率。
设
为被积函数,则
,在经过傅里叶变换后得
该式,
是小波函数,同时该式也是小波变换的前提。
对小波进行上下左右平移和伸缩变换后,假设其平移变换尺度为α,变换常数为τ,则在进行几何变换后的函数为
该式因变量是关于的小波函数。因为平移变换尺度α,变换常数τ的值在不断变化,所以也称为连续小波变换函数。
再将平移变换尺度α,变换常数τ作离散处理,式子可表示为
然后将得到的式子归一化处理T,就可以得到离散小波函数
在这样得到离散小波变换函数后,可以分析稳态信号,或者非稳态信号。在通过小波分解后,可以把要分析的信号转换成高频子带和低频子带两个部分,而低频子带又包括高频和低频,在分解后的小波信号中,可以发现能量主要是低频量,而高频量只有一小部分。原因是低频量具有很强的抗干扰能力,即鲁棒性。
这种算法的优点是:1) 小波变换频率不固定,有较好的局部特性。无论在时域还是频域都能精确定位算法嵌入位置。2) 分辨率较高,可以把音频分成多个分段处理,这样有较高的效率。3) 有较高的隐蔽性,将算法嵌入音频后不会影响人们的听觉体验。
4. DCT算法的研究
在数字音频中,嵌入水印的位置主要考虑在能量较大的地方。在这些地方,嵌入水印的能量也可以适当增加,从而提高水印的稳定性。而且如果该部分受到攻击,攻击强度也会破坏音频的质量 [5]。
首先选取一个特征点,并对初始音频信号做DCT变换,由此得到DCT的公式为
是加入水印后的DCT变换,重复以上操作变换最后即可得到嵌入水印后的音频信号。
该算法具有的特点:1) 在中低频音频信号中嵌入水印信息,保证了水印信息的鲁棒性。2) 通过对特征点的识别,将水印嵌入到高能量的音频信号中,提高了水印的鲁棒性。3) 实现了水印的盲检测。然后根据数据备份的特点对上述算法进行了改进。利用秘密数据的破坏、纠错编码和利用原始音频信号提取秘密数据,适合大规模的信息隐蔽。
NOTES
*通讯作者。