1. 引言
热带气旋是极具破坏性的自然灾害,每年都会造成严重的经济损失和人员伤亡,特别是在沿海地区[1]。因此,通过科学的手段预测热带气旋路径尤为重要,而热带气旋中心定位是预测热带气旋路径的基础,其定位的精准性直接影响到后续路径预报、强度估计的质量。
高时空分辨率的卫星云图为预报热带气旋中心位置提供了极为重要的数据。几十年来,人工Dvorak技术(DT)一直是卫星图像中定位台风中心的基石,被全球许多官方预报中心所采用[2]。在此基础上发展起来的先进Dvorak方法(ADT)解决了人工方法的一些局限性,实现气旋中心自动定位[3]。传统的定位方法还主要通过数字图像处理技术和数学形态学运算处理台风云系来确定台风的中心[4]。如2003年,刘正光等人[5]先提取出台风主体云系,应用数学形态学求取台风最大内切圆中心和半径,在此范围内寻找台风眼区,进而确定台风中心,但此方法无法适用于无眼台风;2007年,Olander等人[3]提取螺旋云带的骨架和边缘,然后基于骨架进行螺旋线拟合,最后以螺旋线原点作为台风中心;2010年,Chaurasia等人[6]利用热带气旋中心附近云系的椭圆对称特征,通过最小化计算处理红外卫星云图,进而确定台风中心位置。传统方法普遍地受限于特定情况,算法中涉及的参数往往需要根据实际情况调整,自动化智能化程度较低。
随着深度学习在计算机视觉领域的快速发展,目标检测等图像处理任务的性能显著提高[7] [8],研究者基于卫星云图广泛使用深度学习提取热带气旋特征和定位气旋中心。如2019年,Duan等人[9]提出了CenterNet模型将目标检测视为标准关键点估计问题,首先使用输入图像通过全卷积网络生成热图,然后将热图的峰值位置视为物体的中心,并使用峰值周围的图像特征来确定划定物体的边界框的宽度和高度;2020年,Tan等人[10]结合残差结构和注意力机制来检测目标,还在给定约束条件下,对卷积网络的深度、宽度和分辨率进行缩放,提高了模型效率;2024年,郑宗生等人[11]提出一种融合通道注意力与坐标注意力的卷积神经网络模型(TY-LOCNet)进行台风中心定位,并提出距离损失函数通过距离回归提高模型定位精度。深度学习方法的优势在于不需要人工设计特征提取器,而是利用其强大的非线性表达能力自动从复杂的图像分布中提取出高层特征[12]。现有的基于深度学习的热带气旋中心定位方法主要通过监督学习的方式直接从已有的标注数据中学习模型参数,需要大量标签信息,标注成本高,且方法仅限用于热带气旋中心定位。为了在仅有少量可靠的气旋中心标注数据的条件下有效地学习气旋的结构特征,一种常用的思路是采用无监督学习和有监督学习相结合的方式,即所谓的半监督学习[13]。而能否有效提取特征的关键在于无监督学习方法的选择。当前无监督学习的主流方法包括生成式模型和自监督学习方法等,其中自监督学习方法主要分为“对比式”和“生成式”两类[14]。生成式模型旨在对数据的分布进行建模,利用该分布可以产生出新的样本[15] [16]。常见的生成式模型包括自编码器、生成对抗网络等[17]。其中生成对抗网络通过对抗训练的方式来不断提高生成样本的质量[17] [18]。但生成对抗网络的训练依赖大量的样本,并且训练过程不稳定,很容易出现模式崩溃的现象[19]。考虑到对于热带气旋中心定位任务更多的是关注热带气旋中心及周边区域天气系统的特征,因此定位模型需要更侧重于学习具有判别属性的特征。而对比自监督学习则是一种可根据具体任务生成伪标签,并利用特定的距离度量函数来学习任务有关的特征的方法[16] [20]。对于气旋中心识别和定位任务来说,可构造热带气旋系统的正负样本对,并利用距离度量函数使模型能够有效学习到气旋系统相对于非气旋系统的判别性特征。
故本文提出了一种基于对比自监督学习的热带气旋中心定位方法(SSLTCL),利用大量无标签的热带气旋样本对比学习气旋特征,再利用少量高精度的热带气旋标注样本回归预测台风中心定位,协同训练气旋特征提取模型和气旋中心回归模型。此方法充分利用热带气旋的眼墙、螺旋雨带等明显结构特征显著降低热带气旋数据的标注成本,并提高热带气旋中心定位的精度,同时实现了对热带气旋的检测。
2. 方法与数据
2.1. 数据来源
本文使用的卫星云图数据来源于中国卫星气象中心的风云四号A星(FY-4A)和风云四号B星(FY-4B)地球静止轨道气象卫星,卫星上搭载先进静止轨道辐射成像仪(AGRI)并获取全圆盘辐射亮温数据,其空间分辨率为4千米,全圆盘扫描频率为15分钟,图像维度为2748 × 2748像素。其中,FY-4B卫星数据共15个光谱通道,覆盖可见光至红外波段(0.47 μm~13.3 μm),包括6个可见光通道(0.47 μm~2.25 μm)和9个红外通道(3.75 μm~13.3μm);而FY-4A卫星数据共14个光谱通道,覆盖可见光至红外波段(0.47 μm~13.5 μm),包括6个可见光通道(0.47 μm~2.25 μm)和8个红外通道(3.72 μm~13.5 μm)。
由于FY-4A与FY-4B卫星的轨道参数存在一定差异,为确保数据一致性,本文采用的处理流程为:首先分别从FY-4A和FY-4B卫星L1级HDF文件内Calibration科学数据集(SDS)获取辐射定标所需的逐通道定标系数,将全圆盘数据的原始数字量化(DN)值转换为辐射亮温值。两颗卫星均采用CGMSLRIT/HRIT全球规范定义的静止轨道标称投影,参考椭球为WGS84,地心至卫星质心的轨道半径相同。根据两颗卫星的星下点经度便可精确计算行列号到经纬度的映射关系,进而将全圆盘辐射亮温值映射至0.04˚ × 0.04˚的等经纬网格。通过上述的辐射定标和几何校正处理流程,FY-4A和FY-4B卫星既保留了各自的观测几何特性,又实现了空间基准和辐射基准的统一。
本文重点关注影响中国区域的热带气旋,而中国气象局(CMA)热带气旋最佳路径集(https://tcdata.typhoon.org.cn/)提供了1949以来年西北太平洋(含南海,赤道以北,东经180˚以西)海域热带气旋每6小时的位置和强度[21] [22],为此本文使用此最佳路径集的热带气旋6小时定位信息与风云4号卫星AGRI成像仪每15分钟的全圆盘观测数据进行时空对齐。
2.2. 数据集构建
2.2.1. 数据筛选
相较于可见光通道,红外通道的卫星数据具备全天候观测优势。本文选取FY-4A和FY-4B的6.25 μm、10.8 μm和12.0 μm多红外通道数据构建数据集。其中,6.25 μm波段对上层大气水汽含量敏感;10.8 μm和12.0 μm波段则可联合反演地表或海表温度及云顶高度信息。多通道协同分析能够有效提供热带气旋三维结构的关键信息。
此外,由于FY-4A和FY-4B分辨率为4 km的全圆盘可观测经纬度范围有限,在观测区域边缘的热带气旋变形较严重,本文对部分热带气旋数据进行剔除,以确保数据样本的有效性。由于热带气旋在形成初期和消散末期的卫星云图特征不显著,本文选取热带风暴、强热带风暴、台风、强台风以及超强台风五个等级的热带气旋数据。
2.2.2. 数据集分类
本文基于CMA热带气旋最佳路径集,将数据集划分为锚定样本、正样本和负样本。最佳路径集提供了热带气旋每6小时的经纬度位置和台风强度等级信息。锚定样本的构建遵循以下步骤:首先选取台风在最佳路径集中特定时刻对应的风云卫星数据,以该台风的真实中心经纬度位置为区域中心,框定一个300 × 300像素的区域作为锚定样本。正样本的构建在锚定样本的基础上,将框定区域中心相对于锚定样本区域中心进行空间随机偏移。由于在实际应用中台风中心定位的预测区域中心是基于全圆盘图像人为确定的,而人眼判断的误差一般在两度以内,同时为维持热带气旋结构特征的完整性,本文设置随机偏移范围在−2˚至2˚,并记录台风中心在新框定区域的相对位置。每个正样本信息包含一个空间维度为300 × 300像素的红外卫星云图数据、对应真实台风中心相对坐标、对应真实台风中心经纬度坐标和台风强度等级。负样本的构建则选取最佳路径集中未记录时刻(即无台风日)的卫星数据,并随机框定西北太平洋10˚N~40˚N、100˚E~130˚E区域内空间维度为300 × 300像素的图像。正、负和锚定样本如图1所示。
Figure 1. Comparison diagram of anchor (a), positive (b) and negative (c) samples
图1. 锚定样本(a)、正样本(b)和负样本(c)对比图
2.2.3. 数据分层与预处理
本文使用的FY-4A卫星成像仪L1级全圆盘数据(空间分辨率4 km)时间范围为2018年3月至2024年3月,FY-4B卫星同类数据时间范围为2022年6月至今。为构建数据集,本文选取训练集与验证集来源数据为2019年3月至2022年6月的FY-4A数据和2022年6月至2024年12月的FY-4B数据,测试集来源数据为2018年3月至2018年12月的FY-4A数据。
经过数据筛选与剔除,从训练集与验证集来源数据中共获得了10,239张SCI图像,其中锚定样本3693张,正样本3693张,负样本2853张。本文将SCI图像按7:3的比例分层分割为训练集和验证集,且训练集和验证集中三类样本的比例保持一致。从测试集来源数据中筛选获取755张SCI正样本图像作为测试集,用于评估模型的整体泛化性能。
为满足模型输入要求并加速训练收敛,对所有SCI图像的像素值以及台风相对位置坐标进行了归一化处理,将其范围缩放至[−1, 1]。
2.3. 热带气旋中心定位模型
本文基于对比自监督学习提出了一种特征提取与坐标回归协同训练的热带气旋中心定位模型(SSLTCL)。为了提高模型泛化能力,该模型在建模过程中对有眼台风和无眼台风统一建模。模型能够根据输入的卫星云图直接预测气旋中心的地理坐标。模型整体结构如图2所示。气旋中心定位模型架构主要由两部分构成:基于对比自监督学习的气旋特征提取模型和基于监督学习的气旋中心回归模型。首先对已有的中国气象局(CMA)热带气旋最佳路径集的气旋中心标注数据进行筛选,提高标注数据的可靠性。再将锚定样本、正样本和负样本三类原始数据输入到基于深度卷积神经网络的气旋特征提取模型,基于对比自监督学习方法,采用距离度量以最大化正样本与锚定样本的相似性和最小化负样本与锚定样本的相似性。同时将正样本特征提取结果输入到基于多层感知机的气旋中心回归模型,利用筛选后标注数据进行训练。协同训练气旋特征提取模型和气旋中心回归模型,最终输出热带气旋中心经纬度坐标。
Figure 2. Overall architecture of the tropical cyclone center localization model
图2. 热带气旋中心定位模型整体架构
由于热带气旋数据标注成本高,且热带气旋自身具有眼墙、螺旋雨带等明显结构特征,本文基于对比自监督学习的思想,希望从热带气旋卫星云图本身派生出一种信息作为监督信号,从而降低标注成本和提高模型的训练效率。在前面数据集构建中,数据集划分为锚定样本、负样本和正样本。为最大化正样本与锚定样本的相似性以及最小化负样本与锚定样本的相似性,常见的对比损失有噪声对比估计器(InfoNCE)损失和三元组(Triple)损失等[20]。其中,InfoNCE损失提供了一种互信息估计的下界,该估计自然地由1个正对和N个负对组成,通常需要大批次的样本参与训练[20] [23]。如果负样本包含噪声或者同类样本差异大,易导致优化目标偏离[23]。三元组损失使用正样本对和负样本对组成三元组,在对比损失的基础上进一步考虑了类内距离和类间距离的相对关系。相比负样本对,这样会使得正样本对在映射后的特征空间里距离更近[24]。而卫星云图中热带气旋结构复杂多变,为此本文基于三元组损失函数来量化正样本、负样本与锚定样本之间的差异程度,损失函数的公式如下:
(1)
式中:
表示欧式距离,
表示特征提取函数,
为锚定样本,
为正样本,
为负样本。
为一个需要预先设置的超参数,其表示
与
之间的距离要大于
与
之间的距离。在本文中,超参数
。由于热带气旋的形状、大小和云团结构在不同的发展阶段和环境条件下可能会发生显著变化,深度卷积神经网络(DCNN)能够自动学习到这些变化的特征,从而更好地适应气旋的动态变化,为此本文基于深度卷积神经网络进行热带气旋特征提取。
深度卷积神经网络由五个卷积模块组成,前三个模块各包含一个卷积层(Convolutional Layer)、一个ReLU激活层和一个最大池化层(Max Pooling Layer),后两个模块各包含一个卷积层和一个激活层。深度卷积神经网络模型的详细结构如图3所示。
Figure 3. Detailed architecture of the deep convolutional neural network (DCNN) model
图3. 深度卷积神经网络模型的详细结构
为有效捕捉输入气旋云图的多尺度特征信息,模型在浅层网络使用较大的9 × 9卷积核提取气旋较大尺度的结构特征,并且通过最大池化层下采样特征图,减少数据量,同时保留重要特征。随着网络的深入,逐步缩小卷积核大小,在深层网络使用较小的3 × 3卷积核提取更精细的局部特征。通过由大到小的卷积核设计,模型可以更灵活地适应不同的特征尺度,且深层的小卷积核有助于将浅层提取的较大尺度特征进行组合和细化,从而输出更高级的特征表示。这种特征组合对于解析复杂的气旋云图内容至关重要。所有卷积层均使用ReLU激活函数,引入非线性变换能力,使模型能够学习更复杂的特征信息。
多层感知机(MLP)接收深度卷积神经网络输出的高维特征图,并将其映射至气旋中心坐标。MLP由三个隐藏层和一个输出层组成,每个隐藏层均为线性全连接层,后接一个ReLU激活函数,其中第一隐藏层为256个神经元,第二隐藏层为128个神经元,第三隐藏层为64个神经元;第
幅图像的特征
提供给输入层,那么第
幅图像隐藏层的第
个神经元所对应的输出可以表示为:
(2)
式中:
为输入层到隐藏层的第
个神经元的权重向量;
为输入层到隐藏层的偏差参数;
为ReLU激活函数。然后,经过前向传播的隐藏层,第
幅图像输出层神经元所对应的输出可以表示为:
(3)
(4)
式中:
为第
幅图像隐藏层所有神经元的输出值,
和
分别对应第
幅图像的气旋中心的纬度相对坐标和经度相对坐标。
回归模型多采用均方误差函数(MSELoss),MSELoss计算真实向量与标签向量对应位置上值的损失,然后取平均值,公式如下:
(5)
式中:
为所有正样本数量,
为第
个正样本的预测中心像素值,
为第
个正样本的真实中心像素值。
但由于气旋中心坐标经过归一化操作,数据的动态范围小,输出值在−1和1之间波动。MSE损失函数的缺点是其偏导值在输出概率值接近0或者1的时候非常小,这可能导致模型在刚开始训练时,偏导值几乎消失,学习速率非常慢[25]。而L1损失函数的导数恒定,即使很小的误差,梯度也很大,更适合处理小误差[25]。为此,本项目采用L1损失函数,公式如下:
(6)
式中:
为所有正样本数量,
为第
个正样本的预测中心像素值,
为第
个正样本的真实中心像素值。
为了提高气旋特征提取的有效性以及气旋中心定位的准确性,本文联合训练深度卷积神经网络模型和MLP模型,损失函数定义为三元组损失函数和L1损失函数的加权和,从而使深度卷积神经网络模型提取的热带气旋特征具备坐标注意力机制,公式如下:
(7)
式中:
和
分别为三元组损失函数(
)和L1误差损失函数的权重。热带气旋中心定位模型的详细结构示意图如图4所示。
Figure 4. Schematic diagram of the tropical cyclone center localization model structure
图4. 热带气旋中心定位模型结构示意图
3. 模型评估
3.1. 评估方法
本文使用平均绝对误差(MAE)和召回率(Recall)评价指标对SSLTCLD的台风中心定位性能进行评估,其中MAE计算的是预测的台风中心与真实的台风中心在经纬度上的误差,公式如下:
(8)
式中:N为测试样本数量,Lngo和Lato分别为预测台风中心的经度和纬度,Lngc和Latc分别为真实台风中心的经度和纬度。基于平均绝对误差的评估方法可以评价台风中心定位精度,误差值越小精度越高。
召回率表示正确定位的台风占所有台风的比例。在本文中台风中心经纬度定位的平均绝对误差小于0.5˚,即为台风正确定位;否则,台风被误定位。召回率定义为:
(9)
式中:TP为正确定位的台风数量,FN为错误定位的台风数量。只有保持较高的召回率,才能证明该方法是有效的。
3.2. 模型参数优化
Figure 5. Comparison of changes in the total loss function under different model parameter configurations: (a) Training set; (b) Validation set
图5. 不同模型参数配置下的总损失函数对比变化:(a) 训练集;(b) 验证集
由于联合训练深度卷积神经网络模型和MLP模型,损失函数定义为三元组损失函数和L1损失函数的加权和,本文考虑的模型参数主要包括三元组损失函数的权重
、L1损失函数的权重
。为了衡量模型的性能并指导训练过程,本文计算了不同模型参数配置下训练集的总损失函数。模型训练采用AdamW优化器,优化器的参数分组配置为特征提取器(DCNN)和回归网络(MLP)分别作为独立的参数组,但采用相同的初始学习率,学习率设置为0.0001。训练时批量大小(Batch Size)设为30,每一批量中锚定样本、正样本和负样本各为10,训练轮次共50轮。结果如图5所示。
横坐标为训练轮次(Epoch),纵坐标为总损失函数值。从图6可看出,在不同参数配置下,模型均能较快收敛,表明了模型的可行性,且当
、
时,模型在训练集和测试集的损失函数值均最小,表明了模型在此参数配置下训练效果最好,本文后续的结果均在此参数配置下计算得出。
3.3. 模型性能评估
本文保持输入基于对比自监督学习的气旋特征提取模型的数据集不变,不断减少输入基于监督学习的气旋中心回归模型的正样本数量,研究模型定位精度随有标签样本数量减少而变化的趋势。参与监督学习训练的正样本比例依次设为1、0.7、0.5、0.3,基于相同验证集数据分别计算平均绝对误差,结果如表1所示。
Table 1. Variation of model localization error with positive sample ratio
表1. 模型定位误差随正样本比例变化
正样本比例 |
1 |
0.7 |
0.5 |
0.3 |
平均绝对误差/˚ |
0.206 |
0.211 |
0.254 |
0.270 |
平均经度误差/˚ |
0.228 |
0.233 |
0.272 |
0.299 |
平均纬度误差/˚ |
0.184 |
0.188 |
0.236 |
0.240 |
随着有标签样本数量的减少,模型的定位误差逐渐增大,当参与监督学习训练的正样本比例为1时,模型的定位精度最高,因为更多有标签样本能更全面覆盖真实数据分布,帮助模型学习更鲁棒的特征,降低对训练集的过拟合风险。虽然模型定位精度随有标签样本数量的减少而降低,但是当正样本比例为0.3时,定位误差仍低于0.3˚,这表明对比自监督学习有效地学习到热带气旋的判别特征,模型在数据稀疏场景下仍能保持较高的定位精度,极大地降低了数据标注成本。本文后续的试验结果均是基于全部正样本训练的模型计算得出的。
本文基于测试集数据分别计算五个台风强度等级的平均绝对误差和召回率,结果如表2所示。
Table 2. Localization error and recall rate across different typhoon intensity levels
表2. 不同台风强度等级的定位误差和召回率
台风强度等级 |
热带风暴 |
强热带风暴 |
台风 |
强台风 |
超强台风 |
平均绝对误差/˚ |
0.281 |
0.227 |
0.213 |
0.165 |
0.163 |
平均经度误差/˚ |
0.272 |
0.272 |
0.237 |
0.165 |
0.180 |
平均纬度误差/˚ |
0.290 |
0.182 |
0.188 |
0.164 |
0.145 |
召回率/% |
80.5 |
84.2 |
85.7 |
91.7 |
93.5 |
在测试集下SSLTCL定位的平均绝对误差为0.210˚。从表中可以看出,随着台风强度等级的不断上升,模型的定位误差随之降低,这是因为随着台风强度等级的上升,台风风眼、中心稠密云区和螺旋云带逐渐清晰,使得模型更加容易提取台风图像特征。图6展示了模型分别在五个台风强度等级下的台风中心定位效果图,其中每一列代表一种强度等级的台风案例。每幅云图中绿色点代表真实台风中心位置,红色点代表预测台风中心位置,每幅图像左上角标记了该幅图像的台风中心位置误差,单位为度。
Figure 6. Comparison diagram of typhoon center localization results under different intensity levels: (a) Tropical storm; (b) Severe tropical storm; (c) Typhoon; (d) Severe typhoon; (e) Super typhoon
图6. 不同强度等级的台风中心定位效果对比图:(a) 热带风暴;(b) 强热带风暴;(c) 台风;(d) 强台风;(e) 超强台风
3.4. 算法对比试验
本文将SSLTCL算法与“预训练 + 微调”分离式训练策略的台风中心定位方法(PTFT-TC)、基于双注意力机制的台风中心定位方法(TY-LOCNet) [11]、基于深度强化学习的台风中心定位算法(DRTCL) [26]、螺旋拟合算法(SF) [27]以及自动旋转中心飓风风眼检索算法(ARCHER) [28]五种热带气旋中心定位方法进行了比较。其中“预训练 + 微调”分离式训练策略是先对深度卷积神经网络模型进行预训练,再冻结DCNN仅训练多层感知机模型,两种模型的架构均与本文一致。TY-LOCNet方法是仅使用监督学习训练深度卷积神经网络模型,通过优化损失函数以提升台风中心定位精度。SF算法利用图像处理技术增强对比度提取台风图像的螺旋特征,然后利用螺旋方程对增强后的图像进行模板匹配并计算适应度,适应度值高于阈值的螺旋可以判定为台风中心。ARCHER算法根据螺旋方向的亮度温度梯度,结合可能的环状边缘,找到台风中心。由于其他算法选取2018年7~9月的台风图像作为测试数据,本文在这个时间段的台风中心定位误差为0.172˚,优于TY-LOCNet、DRTCL、SF和ARCHER (TY-LOCNet、DRTCL、SF和ARCHER的定位误差分别为0.254˚、0.265˚、0.287˚和0.369˚),表明了SSLTCL算法的有效性。结果如表3所示。
Table 3. Localization errors of different typhoon localization algorithms
表3. 不同台风定位算法的定位误差
算法类型 |
SSLTCL |
PTFT-TC |
TY-LOCNet |
DRTCL |
SF |
ARCHER |
定位误差 |
0.172 |
0.490 |
0.254 |
0.265 |
0.287 |
0.369 |
3.5. 台风轨迹定位误差试验
本文选取了2023年第2号台风“玛娃”(MAWAR)作为研究对象,各时次预测区域范围的确定遵循以下规则:初始时次的区域范围由数值预报直接给出;考虑到六小时时间间隔内台风的移动距离有限,通常不足以超出第一时次设定的区域范围,因此第二时次的预测区域范围与第一时次保持相同;从第三时次开始,区域范围将进行动态调整:利用前两个时次(即第一和第二时次)预测的台风中心坐标计算其移动向量,并将此向量作为框定第三时次预测区域的移动依据;后续各时次(第四时次及以后)的区域范围均依据前两个连续时次预测中心的移动向量,采用与第三时次相同的逻辑递推确定。将SSLTCL检测出的台风“玛娃”运动轨迹与最佳轨迹对比,结果如图7所示。
Figure 7. Center localization performance diagram for typhoon “Mawar”
图7. 台风“玛娃”的中心定位效果图
绿色点代表真实的台风中心,红色点代表SSLTCL检测出的台风中心。2023年5月20日12时台风“玛娃”被中国气象局定级为热带风暴,9月21日00时升级为强热带风暴,在这段时间内“玛娃”的台风中心移动到148.8˚E、7.0˚N坐标处。5月21日18时“玛娃”升级为台风,此时“玛娃”已经移动到了147.7˚E、8.2˚N。5月22日12时“玛娃”升级为强台风,18时移动到146.9˚E、10.5˚N。5月23日凌晨00时“玛娃”升级为超强台风,且持续至5月28日06时,此时“玛娃”移动到127.9˚E、17.6˚N,但由于超强台风阶段后期“玛娃”为无眼台风,台风中心点定位误差略大。之后“玛娃”继续沿西北路径移动但风力减弱,直至5月30日06时“玛娃”开始转向沿东北路径移动,此时台风中心位于125.0˚E、20.6˚N。台风强度持续减弱,至6月2日00时“玛娃”降级为热带风暴。在整个期间,台风“玛娃”的台风中心定位预测平均误差为0.345˚,实际表现良好。本文基于对比自监督学习的热带气旋中心定位模型在实时跟进台风中心预报方面,能够对卫星云图中的台风中心进行精准定位,取得了很好的效果,但由于风云4号卫星的红外辐射亮温场难以直接反映气压和风场信息,限制了对无眼台风的定位能力。
3.6. 热带气旋分类试验
本文采用基于距离的判别方法对热带气旋进行分类。对于每个新样本,分别计算其与训练集中所有正样本(热带气旋)的平均距离
和所有负样本(非热带气旋)的平均距离
。分类决策规则为:若
,则判定为热带气旋;若
,则为非热带气旋。为全面评估分类性能,本文构建了混淆矩阵对测试集的预测结果进行量化分析。本试验的测试集中正负样本均为1000个,其中负样本包含温带气旋473个,结果如图8所示。
Figure 8. Confusion matrix of tropical cyclone classification results
图8. 热带气旋分类结果的混淆矩阵
矩阵主对角线元素分别表示热带气旋(TP)和非热带气旋(TN)的正确分类数量,非对角线元素则反映误分类情况(FP和FN)。通过准确率(Accuracy)、精确率(Precision)、召回率(Recall)三种评价指标,进一步验证了该距离判别方法在两类样本识别中的可靠性。公式如下:
(10)
(11)
(12)
式中:TP为正确分类的热带气旋数量,FP为错误分类的热带气旋数量,TN为正确分类的非热带气旋数量,FN为错位分类的非热带气旋数量。经过计算得到模型对两类样本识别的准确率为97.3%,精确率为94.8%,召回率为100%,可见模型在热带气旋与非热带气旋的分类任务中具有较高的可靠性。
由于正样本全部判别正确,本文进一步分析误判的负样本,误判负样本中包含35个温带气旋和20个普通云系,部分误判样本如图9所示。
Figure 9. False negative samples in tropical cyclone classification: (a) (e) Extratropical cyclones; (b)~(d) General cloud systems
图9. 热带气旋分类误判负样本:(a) (e) 温带气旋;(b)~(d) 普通云系
图9(a)和图9(e)为温带气旋样本,图9(b)~9(d)为普通云系样本。图中绿色文本标注了待测样本特征向量与正样本特征向量中心的距离,红色文本标注了其与负样本特征向量中心的距离。分析可见,被误判为热带气旋的温带气旋样本(图9(a)和图9(e)),其绿色距离显著小于红色距离。视觉上,这些样本云系均呈现较明显的螺旋状结构。温带气旋本身也常具有类似但通常尺度更大、结构可能更松散的螺旋云系。而被误判为热带气旋的普通云系样本(图9(b)~9(d)),其与正样本中心的距离相比温带气旋样本更大。这些样本所在的日期正处于热带气旋形成前夕,云系已显示出轻微的螺旋状结构雏形。当前模型对螺旋状云系这一关键特征的提取和判别标准需要更精细化的分析,它虽能有效捕捉螺旋形态,但对于区分成熟热带气旋螺旋与温带气旋螺旋、或发展初期的热带扰动螺旋之间的细微形态差异仍存在一些不足,本文后续工作将进一步优化模型特征提取能力。
4. 结论
热带气旋中心的精准定位对于台风预报和自然灾害防范具有重要意义。针对现有热带气旋中心定位模型主要基于监督学习,数据标注成本高且未充分利用热带气旋在卫星云图上显著的结构特征等问题,本文提出了一种基于对比自监督学习的热带气旋中心定位模型(SSLTCL)。为了提高热带气旋中心定位精度,构建由锚定样本、负样本、正样本组成的数据集,并最大化正样本与锚定样本的相似性和最小化负样本与锚定样本的相似性。此外,协同训练基于深度卷积神经网络(DCNN)的气旋特征提取模型和基于多层感知机(MLP)的气旋中心回归模型。根据试验结果得出以下结论:
1) 基于对比自监督学习的气旋特征提取模型,从热带气旋卫星云图本身派生出一种信息作为监督信号,极大地降低了数据标注成本;
2) DCNN-MLP协同训练,使深度卷积神经网络模型提取的热带气旋特征具备坐标注意力机制,提高了台风中心定位精度;
3) SSLTCL能够实现对热带气旋的检测,在热带气旋和非热带气旋两类样本的识别中可靠性较高;
4) SSLTCL的定位精度还有改进空间,模型在热带风暴级别台风的定位误差略大,在后续工作中会着重对热带风暴级别台风做进一步优化,同时展开对无眼台风定位的深入研究。
NOTES
*通讯作者。