1. 引言
轨迹分类是一种利用目标轨迹识别目标类型的技术,应用于行为习惯挖掘、交通管理、船只航行监控等领域,为辅助完成疏导交通拥堵,优化交通调度、海上预警等任务 [1] [2]。在空中管理中,轨迹分类技术用于区分不同飞行目标的类型,预警客机附近出现的鸟类、无人机等飞行目标,使得相关人员能够及时采取措施,避免相撞事故,保障民航班机安全飞行 [3] [4]。
目标轨迹是轨迹分类任务的处理对象,通常由GPS、北斗、雷达等定位系统产生,由一组和时间相关的目标空间位置数据组成。由于轨迹数据结构简单,因此如何从轨迹数据中提取出可分性好的轨迹特征,以支撑轨迹分类任务是轨迹分类研究的重点和难点 [5]。
最早的轨迹特征提取算法由Lee提出,称为TraClass [6]。该方法先将轨迹区域划分成网格,然后不断细化网格,直到同类目标的轨迹几乎处于同一网格中,那么这个网格就被当成该类轨迹的特征。但是,该方法仅考虑了轨迹的空间信息而没有考虑到轨迹的时间信息。
为了同时提取飞行器的空间信息和时间信息,研究者提出了两种基于统计学的轨迹特征:局部特征 [7] 和全局特征 [8]。局部特征提取方法先将轨迹划分为子段。然后根据子段数据得到目标速度、加速度、转向角等运动参数的统计量,作为轨迹特征。和局部特征相比,全局特征也由运动参数的统计量组成。区别在于全局特征由完整轨迹统计得到,而局部特征由局部轨迹统计得到。当轨迹数据质量较好时,局部特征和全局特征能够准确地刻画目标的运动特性,满足轨迹分类的需求。然而,受到大气环境和设备状况等因素的影响,轨迹数据通常包含大量的飞点(错误的目标空间数据),对局部特征和全局特征造成干扰。
随着机器学习技术的发展,神经网络结构不仅用于完成识别、分类任务,也用生成数据特征。这种利用神经网络结构从数据中提取特征的技术称为嵌入技术 [9]。目前,嵌入技术已经应用于各个领域。在文本处理领域,著名的word2vector模型 [10] 就是利用嵌入技术将文本转化词向量。和传统的one-hot编码相比,词向量具有语义相关和低维度的优点。在语音处理领域,google工程师利用瓶颈神经网络(bottleneck nerual network, b-NN)将高维度的语音倒谱特征映射成低维度的d-vector [11]、s-vector [12],从而大幅度提高了语音识别和声纹识别的性能。在图像处理领域,Tang等人也利用CNN结构对图像数据进行嵌入,提高了视频识别的性能 [13]。另外,嵌入技术还应用于水文数据挖掘 [14]、雷达信号识别 [15]、医学数据处理 [16] 等领域,并获得了成功。这些研究成果说明嵌入技术能够从数据中获取性能较好的特征。
为了减弱飞点对轨迹局部和全局特征的影响,本论文提出了一种基于神经网络的轨迹嵌入方法。该方法首先从轨迹中提取出局部和全局特征,组成高维度的特征向量;然后将这些高维特征向量带入b-NN得到低维度的超向量,称为t-vector。由于b-NN将高维特征向量投影到低维度“通用坐标”空间,对特征向量值进行校对和压缩 [17] [18],所以t-ector具有维度较低且可分性较好的优点。本论文还将Xgboost、SVM和随机森林组成三人表决器,对t-vector分类,提高了目标轨迹分类的鲁棒性。在实际试验中,t-vector提高了三人表决器5%以上的准确率,并使其获得较低的DCF值。
2. 相关方法
2.1. 轨迹特征提取
为了从飞行器轨迹中提取有效的轨迹特征,学者提出了两种基于统计的特征提取方式:局部特征提取和全局特征提取。
局部特征提取分为分段和特征计算两个部分。最常用轨迹分段方法由Dodge提出 [19]。该方法根据运动物理学原理,将轨迹数据分为“低偏离低蜿蜒”、“低偏离高蜿蜒”、“高偏离低蜿蜒”、“高偏离高蜿蜒”四种类型,然后根据这些类型将轨迹分成若干轨迹段。得到轨迹段后,求出这些轨迹段的运动参数统计量,就得到局部特征。常用的统计量包括均值、期望、标准差、最值、百分占比、偏斜率、峰度、变化系数、自相关系数等 [20]。全局特征提取方法从完整的轨迹中计算运动参数的统计量。另外,Yang等人还提出了朝向变化率、停止率、速度变化率、航迹长度等全局特征 [21]。
2.2. 瓶颈神经网络
瓶颈神经网络(bottleneck nerual network, b-NN),如其名所示,是一种带有瓶颈层的神经网络,用于完成特征提取任务,最早由google工程师们提出,用于从语音倒谱中生成d-vector和s-vector,提高了语义识别、声纹识别的性能。后来,b-NN又应用于水文数据、雷达信号和医学数据的特征提取任务中 [22]。
b-NN由输入层,输出层,若干隐层和瓶颈层构成。隐层结构由具体任务决定,可以为全连接层和可以为卷积层。输出层为softmax后验概率,代表输入数据的类型。瓶颈层的节点比隐层节点少得多,用于维度压缩和生成特征。它的位置不固定,若靠近输入层,那么特征表征数据个体特性;若靠近输出层,那么特征表征数据类型特性 [23]。
3. 轨迹嵌入方法
在实际运用中,受到定位环境和定位设备的影响,得到的轨迹中含有大量的飞点(定位错误点),从而干扰特征值。因此,本论文提出基于嵌入技术的特征提取法,以得到鲁棒性较好的轨迹特征。该方法流程如图1所示。
3.1. 预处理
预处理的作用是取出轨迹中的冗余点和异常点。假设一条航迹定义为
,其中
为轨迹中的点,
为轨迹点的空间信息如经度、纬度和高度等;
为轨迹点的时间。在预处理中,首先检查
。比如经度和纬度必须要满足经度、纬度和高度要在合理范围之内。然后计算相邻点的速度
和距离
:
(1)
(2)
如果
小于阈值则认为
冗余点,需要剔除掉。如果
不再合理范围内(如10 m/s或者1000 m/s)则认为
为异常点,需要剔除。

Figure 1. The flow of trajectory embedding
图1. 轨迹嵌入流程
3.2. 局部特征和全局特征提取
轨迹经过预处理后,就可以用于提取局部和全局特征。提取方式如图2所示:

Figure 2. Local and global features extraction
图2. 局部和全局特征提取
首先计算速度、加速度、爬升量、转弯角四种运动参数用于划分轨迹,于是得到16种轨迹类型。根据每种类型将轨迹划分成若干轨迹段,然后基于这些轨迹段计算每种轨迹类型的段长度均值、标准差,类型数量和类型百分比作为局部特征(图中表示为
),得到
个局部特征。
全局特征(图中表示为
)从整段轨迹中提取得到。本论文计算速度、加速度、爬升值、转弯角、蜿蜒度5种运动系数用于生成全局特征。每种运动系统对应的全局特征为:
均值;
标准差;
最大值、最小值;
模:即出现平率最多的取值范围;
四分位:下四分位和上四分位;
四分位距离。
偏斜度
:
(3)
其中,X为运动参数,
为运动参数的均值,
为运动参数的方差。
峰度
:
(4)
其中,X为运动参数,
为运动参数的均值,
为运动参数的方差。
变化系数
:
(5)
自相关系数A:
(6)
其中,
(7)
其中,
为第i运动参数,
为运动参数的均值,
为运动参数的方差。另外,还采用了Wang等人 [24] 提出的四种全局特征:朝向变化率、停止率、速度变化率和航迹长度。因此,得到54个全局特征。将64个局部特征和54个全局特征组合到一起,就构成了118维的特征向量,用于b-NN的输入以完成轨迹嵌入。
3.2. 轨迹嵌入
本论文采用b-NN将118维的向量映射成32维的t-vector完成轨迹嵌入。该b-NN的结构如图3所示。
该b-NN有7层全联接层隐层,每层有128个节点。为了得到分类性能更好的嵌入向量,瓶颈层位于输出层和最后一层隐层之间,包含16个节点。b-NN的最后一层为分类层,包含四个节点,分别表示客机、无人机、鸟类和其他目标。训练时,采用所有支撑数据进行训练,学习率为0.01。生成t-vector时,去掉最后一层输出层,将每条轨迹对应的局部和全局特征作为输入,然后输出一个t-vector。即每个t-vector对应一条轨迹样本。
4. 轨迹分类流程
论文将t-vector用于轨迹分类任务,提出一种轨迹分类模型,其流程如图4所示。

Figure 4. The flow of trajectory classification
图4. 轨迹分类流程
轨迹分类流程分为两个部分:训练部分和评估部分。在训练部分,训练数据(分类已知)代入轨迹嵌入过程得到t-vector,然后用t-vector训练由支撑向量机(support vector mechine, SVM),随机森林(Random Forest, RF)和XGBoost(XG)组成的三人表决器模型(Three-voter model, TVM)。在评估阶段,测试数据(分类未知)输入轨迹嵌入过程得到t-vector,然后将t-vector代入训练好的TVM得到最后的分类结果。
5. 实验与结论
5.1. 实验数据集合和实验过程
实验采用的数据集为公开领域收集的客机、鸟类、无人机和其他飞行器轨迹数据,各2万条航迹。该数据中,每行代表一个航迹点。每行包含6列,分别为ID、Lat、Lon、Alt、T和Class。ID为航迹标识,即同一ID的航迹点属于同一个飞行目标的同一航迹;Lat和lon两项分别为经度和纬度,单位为度;Alt为高度,单位为米;T为系统时间即获取经纬度高度信息的时间,单位为秒。Label为目标类型标识,为了方便训练,将客机、鸟类、无人机和其他飞行器打标为“1000”、“0100”、“0010”和“0001”。
首先将所有数据作为支撑集训练b-NN,然后将数据按照8:2的比例划分成训练集和测试集,用于训练和测试轨迹分类的性能。为了评估测试轨迹的分类性能,采用准确率(ACC)和检测代价函数值(DCF)最为评判标准。准确率为分类正确的样本量和总样本量的比值。DCF定义为:
(8)
其中,
为权重,设为0.5。
为正确接收率,即正确分类正例样本量和正例样本量的比。
为正确拒绝率,即正确分类反例样本量和反例样本量的比。为了计算DCF,本论文分别取1万条客机、飞鸟、无人机和其他飞行器航迹为正例,取剩下分类的1万条样本航迹作为反例。例如,当去1万条客机航迹为正例时,取飞鸟、无人机和其他飞行器共1万条航迹为反例。因此,我们将得到4个DCF:
、
、
和
,分别表示客机、鸟、无人机和其他飞行器为正例时得到的DCF。
5.2. 轨迹嵌入性能测试
实验测试用于轨迹嵌入的b-NN性能。实验中包含不同隐层的b-NN用于生成t-vector,采用上述四种飞行目标的轨迹进行实验。实验中,b-NN根据飞行目标的轨迹数据生成t-vector,由SVM、RF、XG组成的三人表决模型(Tree-voters model, TVM)分析t-vector给出飞行目标的类型。实验结果如图5所示。
(a)
(b)
Figure 5. The performance of trajectory embedding with different hidden layers. (a)Accuracy; (b) Time cost
图5. 不同隐层对轨迹嵌入的影响。(a) 准确率;(b) 时耗
图5(a)中显示,随着隐层数量的增加,TVM的准确率逐步提升。当隐层数量达到7层之前,准确率提升速度较快,而达到7层之后,准确率提升趋于平缓。这说明较多隐层有利于提升t-vector的可分性,从而提高分类准确率,但是隐层增加也会增加生成t-vector的时间,如图5(b)所示,因此拥有7层隐层的b-NN可以兼顾准确率和时耗。
下面将b-NN的隐层固定为7层,然后移动瓶颈层(bottlenecl layer, BL)的位置,实验结果如图6所示。

Figure 6. The performance of trajectory embedding with different locations of the bottle-neck layer
图6. 瓶颈层位置对轨迹嵌入的影响
图6中可以看出,当BL位于前5层时,TVM的准确率较低,即TVM的分类性能较差;当BL位于后3层时,TVM获得最高的准确率,即TVM的分类性能较好。这说明,BL靠近b-NN尾部能得到可分性更好的t-vector。这是因为当BL靠前(即隐层在第1~5层)时,生成的t-vector带有更多的轨迹个体信息,而BL靠后(即隐层在第6~8层)时,生成的t-vector带有更多的轨迹类型信息。由于分类任务的目标是分类轨迹类型,所以靠后的BL能够提升表决器的性能。
5.3. 轨迹特征性能测试
实验测试t-vector的性能。对比对象为TraClass、局部特征(local feature, LF)、全局特征(global feature, GF)。为了评估特征性能,采用SVM、RF和XG组成的TVM对上述4种轨迹特征分类。实验结果如表1所示。

Table 1. The performance of different trajectory features
表1. 轨迹特征的性能
表中显示,采用TraClass作为特征时,TVM的准确率最低而DCF2、DCF3和DCF4最高。这表明TraClass不适合用于分类飞行目标轨迹分类。另外,TraClass在文献 [1] 中获得很好的性能,而在本实验中的性能不佳。这是因为文献中使用TraClass表示车辆轨迹。车辆运动轨迹受道路限制,使得TraClass提取过程能较容易“框住”同类目标的轨迹,提取出较好的特征。最后一行中,采用t-vector作为特征时,TVM获得最高的准确率和最低的DCF,这说明t-vector的可分性最好。另外,LF和GF对应的准确率低于t-vector对应的准确率,同时它们对应的DCF高于t-vector对应的DCF。这说明LF和GF的性能没有t-vector好。这是因为,LF和GF为基于统计学的特征,容易受到轨迹中飞点的干扰,而t-vector由b-NN生成得到。b-NN将统计特征映射到“通用坐标空间”,对特征值进行了校准,从而降低了飞点干扰。
5.4. 轨迹分类模型性能测试
本实验测试分类模型的性能,将提出的TVM和SVM、RF、决策树(decision tree, DT)、贝叶斯网络(Bayes network, BN)和多层感知机(multilayers perceptron, MLP)。这些分类模型常用于完成车辆、动物、台风、飞行目标等轨迹分类任务实验中,b-NN用于根据轨迹生成t-vector,然后将t-vector带入上述5种分类模型,完成飞行目标轨迹分类。实验结果如表2所示。

Table 2. The performance of different classification models
表2. 不同分类模型的性能
表显示MLP和TVM获得最高的ACC和最低的DCF。表明MLP和TVM的分类性能最优。然而,相对于TVM,MLP训练时长较长,且对硬件要求较高。另外,SVM、RF和XG的ACC均比TVMd的低而它们的DCF均比TVM高。这是因为,TVM综合考虑SVM、RF和XG三个分类器的输出结果,如果其中立个分类器的结果有误,其余两个分类器可以其纠正错误使得最终结果正确。换句话说,TVM的容错性比单独的分类模型要好。
6. 结束语
轨迹分类是一种利用目标轨迹识别目标类型的技术。飞行目标轨迹分类是轨迹分类的一种,通常应用于机场附近空中交通管理领域,及时识别出离客机较近的飞行目标,辅助相关人员采取措施阻止相撞事故,保障客机起飞和降落时的安全。从轨迹中提取出优质特征,以支撑目标分类任务是轨迹分类的研究重点和热点。针对飞行目标轨迹,研究者提出局部特征和全局特征提取方式,在轨迹质量较好时能够从轨迹中提取出优质的特征。但是这两种方法基于数理统计,容易受到飞点干扰。为了减弱飞点对轨迹特征的干扰,本论文提出了一种基于瓶颈神经网络的轨迹嵌入方法。该方法先从目标轨迹中得到高维度的局部–全局特征向量,然后利用b-NN结构根据高维度特征向量生成t-vector,完成轨迹嵌入。由于b-NN能将局部–全部特征向量映射到低维度“通用坐标”空间中,对特征值进行了校准并降低了特征向量维度,使得t-vector具有较低维度和较好可分性。为了实现轨迹分类,本论文还将SVB、RF和XG构成TVM,和独立分类模型相比,TVM具有较好容错性。
未来的研究分为两个方向进行。一方面着重研究轨迹嵌入,将对抗网络、自动编码机等高性能生成网络运用到轨迹嵌入中。另一方面着力研究分类器,性能跟好的分类网络模型。
致谢
首先感谢编辑和评审专家对本论文的编辑和点评指导,其次感谢杜晓彤对本论文提供的实验数据,最后感谢妻子夏向玲对我科研工作的理解和支持。
基金项目
四川省科技重大专项(2018GZDZX0012)。