1. 介绍
平方公里射电阵(Square Kilometre Array, SKA)是在建的世界最大综合孔径射电望远镜,它的首要科学目标之一:对宇宙黎明和再电离时期探测(Epoch of Reionization, EoR)。SKA通过其强大的硬件基础实现对EoR信号高分辨率、高动态范围的成像,但宽带成像时所携带的带宽涂污效应(bandwidth smearing)对EoR信号的分离及提取造成极大的障碍。在探测的所有总信号中,除了弥散辐射(diffuse radiation)之外,最强的辐射干扰便是河外点源(Extragalactic point source, Ptr),这些点源产生的辐射在150 MHz处贡献了总前景辐射的~27%,成为了强且难处理的前景成分,尽快实现对点源等前景干扰信号的带宽涂污效应矫正成为了SKA的研究重点 [1] [2]。
带宽涂污是一种成像过程中带宽选择对观测图像造成的图像干扰,在天文图像中有限的带宽使得可视度函数数据在径向产生拖尾现象,而其程度随离视场中心距离的增大而加强。设
为该频带中心的空间频率,
为该频带内另一个频率的空间频率,设
。当宽频带接收器在每个基线和时间只产生一个能见度时,它测量的整个空间频率范围被映射到由频带的中心频率给出的范围上。将
映射到
上的过程等于按
将
坐标进行缩放。根据傅里叶变换的相似性定理,坐标系在一个域中的缩放等价于在另一个域中的反缩放。
因此当整个空间频率范围以这种方式平均时,图像域效应即是一个径向拖尾,不同的频率以不同的方向径向移动 [3]。
(1)
目前基于EVLA望远镜的宽带成像技术已应用许久,包括多频合成成像(Multi Frequency Synthesis Imaging, MFS)等在内的诸多算法,可以在一定程度上解决带宽涂污问题。MFS成像技术是利用综合的uv覆盖,同时使用来自所有通道的数据使得成像灵敏度增强,达到解决带宽涂污问题的目的。然而,该算法建立在假设图像中的所有源在频带上都有一个平坦频谱的基础上 [4]。如果光源的光谱不是恒定的,那么直接的可见性组合将产生与光谱变化幅度成比例的虚假空间结构 [3]。
为了得到更快更好的矫正结果,本文拟提出深度学习的矫正方法用于对SKA观测信号的带宽涂污效应矫正。目前已有不少关于天文数据图像处理的深度学习方案,比如利用生成式对抗网络(generative adversarial networks, GAN)对望远镜图像进行超分辨率重建,在望远镜制造成本一定的情况下获得更好的数据精度或更多的样本。例如利用递归降噪自编码器针对真实LIGO (Laser Interferometer Gravitational-wave Observatory)引力波信号中的非高斯噪声进行降噪,而在训练模型时只需用模拟的高斯噪声 [5]。还有利用卷积神经网络对已经采集到的海量高维恒星光谱数据进行分类处理 [6],以及基于集中稀疏表示图像超分辨率重建理论的层次聚类字典训练和相似约束的天文图像超分辨率重建算法 [7]。这些都是深度学习在天文图像领域的一些应用,但是基于深度学习的低频SKA带宽涂污效应矫正,目前没有针对性的研究。
本文拟采用的深度卷积神经网络方法在带宽涂污效应矫正的应用相比于传统算法具有以下几个优势:
1) 特征提取可以优化模型;
2) 模型训练完成,效应矫正过程会变得相当高效;
3) 网络结构灵活,易于扩展,应用于更多的有用信号矫正 [2]。
并且,我们使用了残差学习算法、正则化和批量归一化等手段提高了其网络性能,使网络可以进行复杂的特征模式的提取,达到良好的矫正效果,这对于大数据量的天文图像具有一定的应用价值。为了客观对深度学习算法矫正效果进行评价,我们进行了网络模型搭建,数据集构建,深度学习矫正实验,并从多个评价指标对矫正结果进行了全参考图像质量评价比较分析。
2. 网络模型
卷积神经网络的结构与组成
通常卷积神经网络由输入层、卷积层、池化层、全连接层、输出层五个部分组成。卷积层和池化层通常取若干个,将卷积层和池化层进行交替叠加,即一个卷积层与一个池化层相连再接一个卷积层 [8],以此类推。在构建此卷积神经网络模型时,考虑到太深的网络结构势必造成训练时间过长,所以基于深度学习的矫正方法要将运算成本和矫正性能综合考虑。利用构建好的数据集,通过实验过程中不断对卷积层数进行调整,最终确定为20层,不同层数训练结果如表1所示。

Table 1. PSNR values of different training layers
表1. 不同训练层数PSNR值
卷积神经网络主要有三层网络架构,第一部分:Conv (3 * 3 * c * 64) + ReLU (c代表图片通道数)为1层,第二部分:Conv (3 * 3 * 64 * 64) + BN + ReLU为18层,第三部分:Conv (3 * 3 * 64)为1层,这里的
代表图像为1通道。神经网络结构如图1所示。

Figure 1. Diagram of a convolutional neural network
图1. 卷积神经网络示意图
输入图像为带宽涂污效应图像。其中Conv为卷积层,卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,而更多层的网路能从低级特征中迭代提取更复杂的特征。BN为批归一化层,主要作用是加快网络的训练和收敛的速度,控制梯度爆炸防止梯度消失,防止过拟合。ReLU为激活函数,激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。最后一步得到残差学习图像,通过残差学习,隐含地使用隐藏层中的操作移除潜在的干净图像,这使得每层的输入都是高斯分布的,相关性较低,并且与图像内容的相关性较小,残差学习可以帮助批量归一化以减少内部协变量偏移。在网络训练过程中,网络每轮训练都在不断地寻求中心损失函数最小化的方向,并回馈给整个网络,使得网络参数不断地向中心损失函数最小化的方向变化,直至中心损失函数收敛。PSNR值代表训练过程中对于图像恢复情况,代表了噪声特征的处理效果,通常PSNR值越大代表效果越好。
3. 数据集构建及实验
3.1. 数据集构建
3.1.1. 数据集来源
根据目前的观测证据和研究结果,可将河外点源大致分为两大类,射电星系和致密源。在射电星系中,宿主通常为巨型椭圆星系,射电辐射结构远超出宿主星系本身的范围(比如存在相对论性喷流),在1.4 GHz处的射电功率 ≥ 1022 WHz−1;致密源没有明显可见的射电辐射结构,呈致密点状。根据射电辐射的来源,可主要分为恒星形成星系(star-forming galaxy)和活动星系核(Active Galactic Nucleus, AGN)。同时AGN还可进一步分为类星体、耀变体(blazar)、射电宁静(radio-quiet)AGN等子类 [2]。为了模拟出带宽涂污效应强的点源图像,我保留了158 MHz处大于10 mJy的明亮点源,以便后续的矫正研究。
为了得到带有SKA仪器效应的观测图像,本文采用了目前最新的SKA1-Low阵列布局,对前文模拟得到的天图进行模拟观测,获得了包含仪器效应的SKA1-Low观测图像。SKA1-Low干涉阵列由512个站点组成,每个站点包含256根天线,合计131,072根天线 [2]。阵列布局中央区域如图2所示。
本文对于河外点源的模拟均使用了Wilmanetal. 2008 [10] 针对SKA模拟的点源结果,从而得到窄带河外点源的成像结果,并在150 MHz到166 MHz频道之间进行宽带成像得到具有带宽涂污效应的点源图像。首先需要模拟得到河外点源的天图,如图3所示,然后使用OSKAR [11] 软件模拟每张天图的可见度数据,积分时间为6 h [12]。输入天图的中心置于(R.A., Dec.) = (0˚, −27˚),因为该点会经过SKA1-Low的天顶,是开展模拟观测的理想选择。所以,在一次6 h的模拟观测过程中,输入天图的中心的时角(Hourangle)范围为[−3 h, 3 h] [2] [13]。
如图4所示,为模拟得到的SKA1-Low观测图像,左图为窄带Ptr图像,右图为具有带宽涂污效应Ptr图像。基于带宽涂污的概念,能看到右图能见度合成成像受到观察频率和期望的视场的影响,使得阵列分辨率和灵敏度发生径向退化,产生了图像域的径向涂污,造成一些大尺度结构及明亮点源扭曲,这些效应对天体物理的研究产生了极大的阻碍。
来源/Credit: Dewdney & Braun 2016 [9]
Figure 2. The layout configuration of stations in the central area (radius R ≤ 1700 m), including the 224 randomly distributed stations in the core area (R ≤ 500 m) and another 12 station clusters outside the core area
图2. 中央区域(半径R ≤ 1700 m)的站点布局,包括224个随机分布在核心区域(R ≤ 500 m)的站点,以及12个分布在核心区域之外的站点团

Figure 3. Simulate sky map of Ptr at 158 MHz
图3. Ptr在158 MHz处模拟天图
(a)
(b)
Figure 4. (a) Narrowband Ptr image; (b) Ptr image with bandwidth smearing
图4. (a) 窄带Ptr图像;(b) 带宽涂污Ptr图像
3.1.2. 噪声增强与归一化
为了更好地模拟地球的电磁干扰环境对观测的影响,我们为带宽涂污Ptr数据集进行了增强噪声处理。增强噪声首先要得到图像的背景值,图像背景值是像素值出现频率最高值,需要对带宽涂污Ptr图像的像素值分布进行统计,根据出现频率进行排序,则出现最多的像素值就是背景像素值 [14],这些图像背景值区域通常是电磁干扰最容易产生噪声区域。基于此,为带宽涂污Ptr图像添加了方差为
的高斯噪声,为带宽涂污图像添加了模拟噪声之后,带宽涂污Ptr图像样本增多且更加趋近于真实的射电望远镜观测效果,噪声增强效果如图5所示。

Figure 5. Ptr image with bandwidth smearing and Gaussian noise
图5. 带宽涂污高斯加噪Ptr图像
虽然经过了增强噪声的处理后使得图像更趋近于地球获取辐射信号的真实情况,但是因为点源组成部分的射电星系和致密源的像素值差别较大,且像素值中同时存在负值和正值,使得天文fits图像数据量过大,导致网络性能不足以达到训练效果。针对这种情况,我们对数据进行批归一化处理,从而缓解了内部协变量偏差的问题,对训练速度达到了增强效果,避免了训练时出现的梯度爆炸和梯度弥散,加快了网络的收敛速度。本文对数据处理过程使用了最大最小值归一化方法,其公式如下:
(2)
公式(2)中,
是归一化之后的像素值,X为原始数据,
、
分别为原始数据集的最大值和最小值。最终,通过噪声增强和归一化处理后分别得到了训练集
和测试集
。训练集
:100张fits图像的单点截取集,测试集
:10张fits图像的单点截取集。
3.2. 评价指标建立
为了评价矫正模型的实际效果,需要建立一个全面、真实、客观的图像质量评价指标体系,主要包括峰值信噪比(Peak Signal to Noise Ratio, PSNR)、结构相似性(Structural Similarity, SSIM),这两个指标是目前广泛应用的图像质量评价指标。
假设原始图像为𝑦,矫正后图像为
,图像大小为
可得:
峰值信噪比:
(3)
结构相似性:
(4)
公式(3)中,n是每个采样值的比特数。公式(4)中,
是
的平均值,
是的
平均值,
是
的方差,
是
的方差,
是
和
的协方差 [14]。
,
是用来维持稳定的常数。
是像素值的动态范围。
。在一般的图像处理任务中,PSNR值越大,SSIM值越大,代表矫正重建效果越好,对于图像中的点源的结构显示效果越好。
3.3. 实验分析
3.3.1. 基于卷积神经网络的带宽涂污效应矫正训练
训练数据过程中,基于计算成本和降噪性能的综合考虑,将图像深度设置为一般图像降噪的20层,Learning Rate设置为0.001,Batch Size为128,训练过程持续了50个周期。如图6所示,给出了训练PSNR值
和训练损失值
随着CDAE训练过程的变化情况。训练损失值
持续下降,并逐渐稳定,最小值达到了
,同时训练PSNR值
稳定增加,最大值达47.9847,说明深度卷积神经模型的训练效果良好,没有出现过拟合。
训练结果的深度学习训练结果,相较于矫正前明亮点源产生的径向涂污的图像效应,有了明显的矫正效果,恢复了明亮点源的正常形态,对于模拟的地球电磁干扰的局部噪声也有了较大的改善。
3.3.2. 测试实验结果
所有实验均使用同一软硬件平台,保证了数据处理能力的同一性。我们利用10张fits文件的单点截取集对深度学习网络进行了矫正测试,并选取了两个A (613, 911)、B (690, 755)点的矫正结果与带宽涂污Ptr图像的对应点进行了细节对比,如图7所示。从图中可以看出,卷积神经网络对于点源的矫正使得其基本恢复了形态,得到了更清晰丰富的天体物理结构,对于宇宙环境的显示更为细腻。相对于深度卷积神经网络的矫正结果,矫正前的带宽涂污效应的径向与伪影现象异常明显,具体的评价指标结果如表2。
(a)
(b)
Figure 6. (a) Loss value change; (b) PSNR value change
图6. (a) Loss值变化;(b) PSNR值变化
(a)
(b)
(c)
(d)
Figure 7. (a) Ptr image with bandwidth smearing at point A; (b) Correction result of deep learning at point A; (c) Ptr image with bandwidth smearing at point B; (d) Correction result of deep learning at point B
图7. (a) 带宽涂污Ptr的A点图像;(b) A点深度学习矫正结果;(c) 带宽涂污Ptr的B点图像;(d) B点深度学习矫正结果

Table 2. Comparison of evaluation indexes
表2. 评价指标对比
从评价指标中我们可以看出,卷积神经网络的PSNR平均值比矫正前提高约19.4329,SSIM平均值比矫正前提高约0.1266。从图中可以看出,深度学习的矫正方法基本可以实现良好的矫正效果,使矫正结果逼近于窄带图像,并且整个矫正过程更加模块化,达到了高效且精准的矫正结果。
4. 结论
本文使用的深度学习方法实现了对河外点源单点的直接矫正,提供了更新颖的思路,达到了良好的矫正效果,后续工作可以对前景干扰的其他信号,包括但不限于同步辐射、自由–自由辐射、射电晕辐射以及EoR信号进行卷积神经网络的带宽涂污矫正研究,将传统成像算法包括但不限于MFS、STACK、SW-MFCLEAN等与深度学习方法进行比较研究,可以对卷积神经网络结构进行更好的调整,使矫正达到更好的效果,使一些小尺度结构的细节可以显示得更加清晰。
基金项目
国家自然科学基金(11963003),SKA专项资助(2020SKA0110300),国家重点研发计划(2018YFA0404602),贵州大学引进人才科研基金(贵大人基合字(2018)60号),贵州大学培育项目(贵大培育[2020]76号)。
参考文献
NOTES
*通讯作者Email: lizhang.science@gmail.com