1. 引言
无线视频业务是通过无线网络和移动终端为用户提供视频内容的通信服务,如视频电话、视频会议、视频点播、网络电视等。由于网络带宽有限,视频传输前需进行压缩处理,这必然导致视频编码失真 [1] 。此外,网络丢包和时延几乎不可避免,它们对接收端视频图像质量或用户体验质量都有很大的影响 [2] 。
目前视频图像质量评估方法主要分为主观评价和客观评价两大类 [3] 。其中,主观评价方法是人为地评价总体图像质量,常用的有平均主观评分(MOS),该评价方法实时性差,不同观察者对同一图像的主观感受及评判标准也不尽相同。客观评价方法一般通过比较原始图像序列与经编/解码后的图像序列来评价视频质量,常用的有峰值信噪比(PSNR)和均方误差(MSE),由于是在像素级上进行操作,因此它们对视频时域和空域上的失真非常敏感。
结构相似度(SSIM) [4] 或复小波结构相似度(CW-SSIM) [5] 是一种衡量图像质量的新指标,它从图像组成的角度将结构信息定义为独立于亮度、对比度的反映场景中物体结构的属性,将失真建模为亮度、对比度和结构三个不同因素的组合,并用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量 [6] 。
本文针对不同运动速度大小的视频文件,将综合应用PSNR与SSIM方法进行无线传输效果评估,为今后的无线视频传输质量提供一定的理论依据。
2. 基于PSNR的图像质量评价分析
PSNR是目前使用较普遍的图像客观评价方法。其计算方法简单,便于操作,同时可以大致反映图像质量。PSNR的计算公式是:
(1)
其中,
为原始图像大小,
和
分别为原始图像与重建图像对应的灰度值,式中
,
是对于亮度部分用几个比特来表示一个像素的值。计算公式是比较原始图像和重建图像的亮度部分,这个值越大表示重建图像与原始图像的差距越小,即画面质量越好。实验结果表明,当封包错误率一定时,GOP (Group of Picture)长度较短时,PSNR值较大,图像质量较好;当GOP长度一定时,量化参数Q越小,PSNR值越大;封包长度越长时,PSNR值越大,图像质量越好。
3. 基于SSIM的图像质量评价分析
基于人类视觉系统更适宜于提取可视区域中的结构信息这一假设,Wang等人 [6] 提出了SSIM算法,该算法结构框图如图1所示。
该算法从原始图像与重建图像的亮度、对比度及结构信息这三个方面进行比较,构建相应的模型,并将这三个模型综合成一个SSIM值。图1中
与
分别表示原始视频帧和重建视频帧,设
、
、
分别为亮度比较函数、对比度比较函数、结构相似性比较函数,则有:

Figure 1. Diagram of the structural similarity (SSIM) algorithm
图1. SSIM算法结构框图
(2)
式中,
和
分别表示原始图像和重建图像的亮度均值,
和
分别表示原始图像和重建图像的协方差,
表示二者的协方差,
、
、
是为了避免分母为零定义的很小的常数,
,
,
为像素值的动态变化。当
时,SSIM的计算公式为:
(3)
SSIM的取值范围为
,其数值越大,表明图像失真越小,即图像质量越好。
4. 实验仿真结果及分析
本文实验视频bus_cif.yuv、container_cif.yuv与news_cif.yuv分别是高速运动、中速运动和低速运动下的视频文件。本文拟用PSNR、SSIM图像客观评价方法针对这三类视频综合进行无线传输效果评估,仿真实验在NS-2平台进行。
运用PSNR方法评估时,三种视频文件格式均为CIF,设定压缩方式为mpeg4,封包长度MTU设为1000,Q值设为2,让三种运动速度大小的视频文件分别在封包错误率为0、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1的情况下各进行50次仿真,然后取平均值,所得实验结果如图2所示。
运用SSIM算法评估时,其模型参数设置为:
,
(
、
的绝对值足够小就行),
。同样是让三种运动速度大小的视频文件分别在封包错误率为0、0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1的情况下各进行50次仿真,然后取平均值,所得实验结果如图3所示。
对比图2和图3可以看出,当封包错误率在0到0.1之间时,PSNR值和SSIM值都会随着封包错误率的增大而降低。这主要是因为当封包错误率越来越大时,封包遗失的概率就会很高,这必然导致视频
在压缩解压中无法正确译码,从而使视频质量降低。无论是PSNR评估方法还是SSIM评估方法,处于低速运动视频,图像质量明显好于运动速度较大的视频。实验给出了三种运动速度大小的视频文件在封包错误率为0时的原始图像截图,如图4所示。

Figure 2. PSNR under different transmission error
图2. 不同传输错误率下的PSNR

Figure 3. SSIM under different transmission error
图3. 不同传输错误率下的SSIM
(a) PSNR = 33.72, SSIM = 0.9295 (b) PSNR = 32.96, SSIM = 0.8677 (c) PSNR = 26.01, SSIM = 0.6299
Figure 4. Original image with no transmission error
图4. 传输错误率为0时的原始图像
针对这三种运动速度大小的视频,在以上实验的基础上,封包错误率范围变为0.1到0.35,其它条件均不变,分别用PSNR和SSIM方法对这三种视频进行传输效果评估,实验数据为仿真50次所求得的平均值,实验结果如图5和图6所示。三种视频在封包错误率为0.25时的失真图像截图如图7所示。

Figure 5. PSNR under different transmission error
图5. 不同传输错误率下的PSNR

Figure 6. SSIM under different transmission error
图6. 不同传输错误率下的SSIM
(a) PSNR = 23.63, SSIM = 0.4908 (b) PSNR = 19.73, SSIM = 0.4564 (c) PSNR = 12.95, SSIM = 0.4085
Figure 7. Distorted image with 25% transmission error
图7. 传输错误率为25%时的失真图像
对比图5和图6可以看出,PSNR值和SSIM值均随着封包错误率的增大而减小;对于低速运动的视频图像,当封包错误率逐渐增大时,PSNR值依然较大,但SSIM值在封包错误率为0.2时开始骤降,由图7可以看出,对于低速运动的视频图像,采用SSIM评估方法比PSNR方法更符合人眼主观观察结果;对于高速运动的视频图像,图像清晰度差别较大,但SSIM评估值相差较小,因此对于物体中速或高速运动的视频,PSNR评估方法比SSIM方法更符合人眼主观感受。
5. 结论
本文介绍了两种经典的图像质量客观评价方法,并通过仿真软件,对不同运动速度大小的视频进行有损传输质量评估,通过实验结果发现,当封包错误率增大到0.25时,对于低速运动的视频图像,SSIM评估方法比PSNR评估方法更符合人眼主观观察结果,但对于运动速度较大的图像,特别是高速运动的视频图像,PSNR评估方法更优于SSIM方法。