1. 引言
水下光学成像技术在海洋探测、水下通信及海洋工程开发等领域具有重要应用价值。然而,由于水下环境的复杂性,光在传播过程中常受到湍流、散射等介质的强烈干扰,导致传统成像方法在水下湍流环境下难以获得高分辨率的清晰图像。湍流的相位扰动作用会引起光波的散斑效应和成像模糊,这极大地限制了水下成像技术在复杂场景中的应用。如何在湍流环境中提升成像质量,已成为水下光学成像领域亟待解决的关键问题。
近年来,关联成像技术凭借其无需直接探测目标、抗干扰能力强以及对弱光灵敏等优点,逐渐受到学术界的广泛关注。关联成像通过光场调制与计算重建目标空间分布,特别适用于光学复杂介质环境中的成像问题。因此,研究关联成像在水下湍流条件下的成像性能,具有重要的理论意义和实际应用价值。
关联成像的理论基础最早由Klyshko [1]提出,他利用双光子纠缠态进行量子干涉实验,探讨了通过二阶关联产生干涉图案的机制,这一“关联机制”成为鬼成像(Ghost Imaging)理论的核心。1995年,Pittman [2]等人基于自发参量下转换(SPDC)产生的双光子纠缠态,提出了关联成像的实验模型,并通过二阶关联成功实现了高分辨率的量子光学成像,为后续鬼成像技术的发展奠定了基础。2008年,Shapiro [3]提出了一种新的关联成像方案——计算鬼成像,该方法取消了传统实验中的参考光路,仅需单个探测器记录光强信息,通过人工设计的光场矩阵与检测信号强度结合,利用关联计算重建目标图像。与传统鬼成像相比,计算鬼成像的实验架构更加简化,实用性强。为提升鬼成像质量并减少实验时间,许多研究者提出了不同的改进方案,例如差分鬼成像[4]、归一化鬼成像[5]、正(负)鬼成像[6]以及对应鬼成像[7]等。信号处理中的压缩感知技术也被应用于计算鬼成像中,进一步降低采样率同时保持较高的图像质量。2016年,Yuan [8]等人提出了基于快速沃尔什–哈达玛变换(FWHT)的鬼成像方案(GIFWHT),采用Hadamard矩阵调制光源,发现目标图像能够被快速精确地重构,并证明正交矩阵在调制器件中的应用能够改善图像质量并减少测量次数。2019年,Wen [9]等人提出了基于“切蛋糕”哈达玛基排序的新型单像素压缩成像方法,通过优化测量模式排序显著降低采样比,实现超低奈奎斯特采样条件下的图像重构。2022年,Wu [10]等人提出了一种基于Coiflet小波序列重排序的Hadamard矩阵方法,实现了高质量图像重建。
目前,利用相位屏模型模拟传输介质的波前畸变已成为常用的仿真方式。光束在随机湍流介质中的传输可以等效为通过一系列与随机介质统计特性相符的相位屏传输。过去,光在大气湍流中的传输特性已得到广泛深入的研究,其中大多数研究采用随机相位屏模型模拟大气湍流。与大气湍流不同,海水系统更为复杂,海洋湍流是由海水介质对光折射率起伏所引起的。从上世纪60年代开始,学者们广泛关注海洋湍流的研究。1978年,Ohya [11]等人研究了海洋稳定边界层的结构、特性以及相关的大气动力学过程,分析了边界层内湍流运动、热交换和风速剖面的变化规律。1984年,Garwood [12]等人详细研究了海洋翻转性结构的能量情况。2000年,Nikishov [13]提出了一种综合考虑海水温度、盐度、折射率起伏等因素的空间功率谱来描述海洋湍流。2017年,杨天星[14]等人提出了海洋湍流相位屏模型。基于此,我们提出了一种水下湍流关联成像系统,用以研究水下湍流条件下的成像质量。
2. 原理分析与系统方案描述
2.1. 计算鬼成像
计算鬼成像(Computational Ghost Imaging, CGI)是鬼成像技术的一个重要分支。鬼成像利用量子纠缠特性和光强相关统计特性来获取物体图像。在传统鬼成像方法中,成像过程依赖于两束光:信号光束照射物体后,其产生的光场信息被桶探测器接收;参考光束的光场信息也直接被桶探测器接收。通过关联计算这两个光路的光场信息,最终得到物体的图像。然而,在计算鬼成像中,传统的参考光路被去除,光场模式由计算机生成,通常使用数字微镜装置(DMD)或相位调制器(SLM)来控制光场的分布。
这些预设的光场模式在照射目标物体后,所产生的透射光或反射光被单点探测器进行测量,同时记录下模式本身的分布信息。通过多次采样并计算光场模式与探测器信号之间的相关性,可以实现对目标物体图像的重构。计算鬼成像的独特之处在于,能够通过单点探测器和一组已知的光场模式来重建物体图像,而无需依赖传统的成像光学系统。
为了实现计算鬼成像,首先需要事先确定目标区域照射的散斑图案。通过将不同散斑图案与其对应的测量值进行相关运算,才能成功重构出物体的图像。值得注意的是,散斑图案的类型和分布会对最终图像的重构质量产生显著影响。因此,在快速成像的基础上,优化散斑图案分布的研究显得尤为重要。这是提高鬼像质量的关键所在。
为进一步提高采样速率并重建高质量图像,本研究选择使用哈达玛矩阵作为调制矩阵,对目标物体进行照射。哈达玛矩阵是一种由+1和−1组成的n阶正交矩阵,矩阵的列之间相互正交且没有相关性。正是由于这一特点,哈达玛矩阵在图像重建中比其他类型的调制矩阵具有更优越的性能。哈达玛矩阵的基本构成可以用以下矩阵表示[15]:
(1)
为了得到更高阶的哈达玛矩阵,可以使用以下递归公式:
(2)
2.2. 计算鬼成像实验装置
计算鬼成像的实验装置原理图如图1所示。实验中,最关键的器件是DMD (数字微镜装置),其被放置在物体所在的光路上,用于控制光场模式的生成。通过这种方式,DMD能够产生一系列强度或相位随机的光场模式。桶探测器用于接收物体衍射或透射后的总光强信号[16]。
Figure 1. Experimental setup for computational ghost imaging
图1. 计算鬼成像实验装置原理图
在实验过程中,哈达玛矩阵加载到DMD后,激光通过预设的调制矩阵反射出调制光线,照射到待成像物体上。经过物体后的透射光或反射光通过桶探测器进行记录。所记录的总光强为III。采样后,将调制矩阵与光强信息进行关联计算,最终重建出物体的图像。关联计算公式如下[17]:
(3)
其中,
表示平均光强值,为采样次数。
2.3. 压缩感知理论
为了提高采样速率并改善图像重建质量,本文引入了压缩感知(Compressed Sensing, CS)理论。压缩感知是一种信号处理技术,通过对欠定线性系统进行稀疏解,可以有效减少所需的采样数据量。压缩感知方法利用远少于奈奎斯特采样频率的测量点来恢复物体的原始信息,从而节省了采样时间[18]。
结合压缩感知和计算鬼成像技术,可以显著减少采样次数,同时提高图像的重构质量。压缩感知的数学模型如下[19]:
(4)
其中,y为长度为
的观测信号,
为观测矩阵,
为待重构的稀疏信号,
为噪声项。压缩感知模型要求通过最优化方法恢复信号。
在计算鬼成像中,桶探测器记录的光强信号
即为压缩感知中的测量值,每次测量使用的随机矩阵被视为观测矩阵,待成像物体作为原始信号输入计算中,从而实现基于压缩感知的计算鬼成像重构。
2.4. 基于小波变换的哈达玛矩阵优化
小波变换(Wavelet Transform)是一种基于多分辨率分析的信号处理方法,可以有效提取信号的低频全局特征和高频局部细节特征。小波变换在图像处理中的优势体现在其稀疏表示特性上,能够有效进行图像的降噪和压缩处理。
在计算鬼成像中,加载到DMD上的哈达玛矩阵模式顺序对成像质量有显著影响。为了优化成像质量,我们将小波变换与哈达玛矩阵相结合,通过小波分解和重构来优化哈达玛矩阵的模式顺序。具体而言,使用Coiflet小波进行分解,可以提取出图像的多分辨率特征,并基于此优化哈达玛矩阵的排列,从而提高成像效率。
2.5. 基于“切蛋糕”方法的哈达玛矩阵优化
在现有基于压缩感知的计算鬼成像实验中,采样冗余问题依然存在,导致采样率和计算复杂度之间存在权衡。尤其在处理大规模图像时,随机测量仍然具有一定的盲性,难以进一步降低采样率。为此,研究者提出了“切蛋糕”方法来优化哈达玛矩阵的排序。
该方法将每一行哈达玛矩阵视为一个“蛋糕”,并根据矩阵的连通区域数量对这些“蛋糕”进行排序。连通区域数量越少,表示该行哈达玛矩阵的低频特性越强,其对图像重建的贡献越大。通过优化哈达玛矩阵的排序,可以有效减少采样冗余,从而提高计算效率和重建图像的质量。
2.6. 海洋湍流信道模型的理论分析
在海洋湍流影响下,光束的传播受到复杂的相位扰动,这对于水下成像造成了很大挑战。为了解决这一问题,本文采用随机相位屏模型来模拟海洋湍流对光束传播的影响。图2展示了海洋湍流相位屏模型的示意图。
在弱湍流区域,海洋湍流主要引起光束的相位扰动,光束的强度变化较小。因此,可以采用一系列随机相位屏模型来描述海洋湍流对光束传播的影响。
Figure 2. Diagram of the ocean turbulence phase screen model
图2. 海洋湍流相位屏模型示意图
在湍流相位屏模型的构建中,考虑了海洋湍流的折射率起伏、温度、盐度等环境因素对相位扰动的影响。湍流强度通过相位扰动的均方根值(RMS)进行量化,弱湍流对应较小的相位扰动和低频扰动,而强湍流则表现为较大幅度和高频扰动,这会导致光波传播过程中较为显著的成像模糊和失真。具体来说,相位扰动的幅度和频率可以通过随机相位屏模型来模拟,湍流强度与成像质量之间呈负相关,即湍流强度增加会降低成像质量。实验中,通过调节相位扰动幅度、频率和湍流的空间功率谱,研究不同湍流条件下的图像质量变化。结果表明,强湍流条件下,成像模糊和失真现象更加明显,这为优化水下成像方法提供了重要依据。
3. 方法设计
在分析湍流强度对成像质量的影响时,通过调节湍流强度的相位扰动幅度和频率,我们定量评估了不同湍流条件下哈达玛矩阵调制方式对图像重建效果的影响。实验结果表明,随着湍流强度的增加,成像质量显著下降,尤其在强湍流环境下,图像模糊和失真现象加剧。在弱湍流条件下,使用哈达玛矩阵调制的图像重建效果较好,图像清晰度较高,而在强湍流条件下,尽管哈达玛矩阵能够提供一定的改进,但由于相位扰动的增加,重建质量仍然受到显著影响。通过数学模型与模拟实验相结合,我们进一步分析了湍流强度与图像重建质量的关系,实验数据表明湍流强度与图像的峰值信噪比(PSNR)和结构相似度(SSIM)呈负相关,强湍流导致图像质量下降。
本研究旨在通过深度学习技术提高计算机生成成像(CGI)在复杂环境中的性能,特别是在减少采样时间的同时,保持图像质量的高水平。为了实现这一目标,本章提出了基于条件生成对抗网络(CGAN)的图像重建方法,主要通过生成器和判别器的对抗训练,优化图像的生成过程。
3.1. 方法概述
传统的计算机生成成像方法通常依赖于大量的采样数据,以确保图像质量。然而,在噪声和环境干扰较强的情况下,如何在较少的采样时间内获得高质量的重建图像一直是一个挑战。为了解决这一问题,本研究采用了条件生成对抗网络(CGAN),通过生成器和判别器的博弈过程,重建出清晰的图像。
生成器(Generator)的主要任务是从模糊图像中恢复出清晰的图像。具体来说,生成器接受模糊输入图像(大小为64 × 64),并通过一系列卷积(Conv2d)和转置卷积(ConvTranspose2d)操作进行图像特征提取和重建,最后输出清晰图像。为了增强模型的表现,生成器中引入了注意力门(Attention Gate),使其能够聚焦图像中最重要的区域,从而提升图像的重建效果。
判别器(Discriminator)则负责评估图像的真实性,判断输入的图像是来自真实数据集还是生成器的输出。判别器通过多个卷积层提取图像特征,并通过最终的二分类输出(真或假)判断图像的真伪。判别器的优化目标是提高对生成图像和真实图像的区分能力,从而指导生成器不断改进其输出。
3.2. 生成器和判别器的设计
如图3所示,生成器和判别器的结构由多个卷积层(Conv2d)和转置卷积层(ConvTranspose2d)组成。生成器的设计包括了多层次的特征提取和重建过程,每一层都对输入图像进行处理,以逐步恢复清晰度。同时,生成器在中间部分使用了实例归一化(InstanceNorm)和LeakyReLU激活函数,这有助于防止模型的过拟合,并加速训练过程。
生成器的最后一层通过Attention Gate机制引导模型注意图像中的关键区域,使得生成的图像细节更加丰富且准确。相比传统的GAN结构,CGAN通过引入条件信息(例如图像标签或其他输入数据)进一步提升了生成图像的质量。
判别器的设计则专注于通过多个卷积层来学习图像的细节特征,并进行真假分类。在判别器的训练过程中,实例归一化(InstanceNorm)和LeakyReLU激活函数被广泛应用,这不仅有助于稳定训练过程,还能提高网络对细节的敏感度。判别器的最终输出通过1 × 1卷积层(Conv2d 1 × 1)实现二分类结果,区分输入图像是否为真实数据。
3.3. 训练与测试流程
在训练阶段,模型接受经过模糊处理的图像作为输入,并通过训练优化生成器和判别器的参数。如图4所示,模糊图像首先经过计算机生成成像(GI)的步骤得到,这些图像被送入CGAN模型进行训练。生成器通过从模糊图像中提取特征并重建,努力生成清晰的图像;而判别器则通过比较生成图像与真实图像来评估其质量,反馈信息帮助生成器不断改进。
Figure 3. Diagram of the generator and discriminator architecture
图3. 生成器与判别器架构示意图
通过不断迭代训练,生成器逐渐学会如何生成高质量的图像,而判别器则精确地判断哪些图像是真实的,哪些是生成的。在此过程中,生成器和判别器的博弈提高了图像重建的效果,最终使得生成器能够在给定模糊图像的情况下生成高度逼真的图像。
在测试阶段,经过训练的CGAN模型对新输入的模糊图像进行处理,输出清晰的重建图像(如图4所示的字母E和C)。这一过程验证了模型在处理不同图像时的效果,也为实际应用中的图像重建任务提供了可行的解决方案。
Figure 4. Diagram of the training and testing process
图4. 训练与测试流程示意图
3.4. 不同照明编码图案对计算鬼成像的影响
为了全面评估采样数对图像重建质量的影响,首先需对采样率作出明确定义。在我们使用的64 × 64像素尺寸的图片中,每张图片共包含4096个像素。因此,我们将采样率定义为
,其中M代表采样数目,这与使用的编码图案数量相等。通过这种方式,我们可以逐步调整编码图案的数量,进而评估它们对图像重建质量的具体影响。
在对比实验中,我们探讨了不同照明编码图案对计算鬼成像质量的影响。图5(a)~(c)分别展示了传统方法、小波变换方法和切蛋糕方法在不同采样率R下对EMNIST数据集中数字“7”的重建表现。图5中的结果表明,采样率对每种编码图案的图像重建质量具有显著影响。在较低采样率下(例如R = 0.1),三种编码图案的重建图像都呈现出模糊不清的现象,目标的边缘信息明显失真。然而,随着采样率的提高,重建结果逐渐改善,目标图像的边缘也变得越来越清晰。
Figure 5. Simulated results of traditional, wavelet transform, and cake cutting modes at different sampling rates in CGI
图5. 传统、小波变换和切蛋糕模式在不同采样率下的CGI模拟结果
值得注意的是,在相同采样率条件下,不同编码图案的表现差异也十分显著。如图5所示,即使在高采样率情况下,传统编码图案的重建图像质量依然较差。此外,在R低于0.3时,小波变换方法难以清晰地捕捉到物体轮廓。相较而言,切蛋糕方法在低采样率下的表现始终优于传统方法和小波变换方法。例如,在R为0.1时,切蛋糕方法便能够成功重构物体的轮廓和细节信息,且准确度较高,这充分展示了切蛋糕方法在低采样率下的优势。这些结果表明,切蛋糕方法能够在低采样率下快速、准确地重建图像,同时保持较高的图像质量成像效果评估指标见图6。这为进一步优化图像重构算法和实现高质量的鬼成像提供了有力的指导。
(a) (b)
Figure 6. Analysis chart of evaluation indicators for three imaging methods
图6. 三种成像方法评估指标分析图
3.5. 结论
本章介绍了基于条件生成对抗网络(CGAN)的方法用于计算鬼成像(CGI)中的图像重建。通过对生成器和判别器的设计与训练,成功提升了模糊图像的重建质量。实验结果表明,生成器能够有效恢复图像细节,且判别器有助于优化生成的图像质量,最终实现了在低采样率和高噪声环境下的图像清晰恢复。
在未来的工作中,可以继续优化生成对抗网络的结构,提高网络在处理更加复杂图像时的效率和精度,为实际应用中的图像重建提供更加高效和精准的解决方案。
4. 总结与展望
本文研究了水下湍流对光学成像质量的影响,并提出了一种结合关联成像技术与深度学习方法的水下湍流成像优化方案。通过对传统方法、小波变换方法和切蛋糕方法在不同湍流强度下的性能进行比较,研究了湍流环境中成像质量的变化。实验结果表明,切蛋糕方法在低采样率下能够有效提高图像重建质量,具有明显的优势。
为了进一步提升图像质量,本文结合条件生成对抗网络(CGAN)技术,对湍流环境下的模糊图像进行了去噪和复原。实验结果验证了深度学习技术在水下湍流成像中的有效性,成功地提高了成像质量,为水下光学成像技术的应用提供了新的解决方案。
尽管取得了一定的成果,未来的研究仍面临一些挑战。首先,虽然深度学习模型在图像恢复方面取得了显著效果,但其计算复杂度较高,如何优化网络结构,提升处理效率,仍是未来的研究重点之一。其次,结合更多的多维度数据(如光谱信息、时间序列等)进行联合分析,可能会进一步提升图像质量并拓展应用范围。最后,实时应用方面仍需进一步努力,特别是在复杂湍流条件下的实时成像系统的实现。
未来的工作可以在算法优化、实时处理能力以及跨领域应用等方面进行深入探索。随着算法的进一步完善和硬件技术的进步,基于深度学习和关联成像的水下湍流成像技术将在水下探测、海洋工程和深海通信等领域发挥越来越重要的作用。