基于模糊数学和主成分分析的数据融合算法研究
Research on Data Fusion Algorithm Based on Fuzzy Mathematics and Principal Component Analysis
DOI: 10.12677/AAM.2019.85108, PDF, HTML, XML,  被引量 下载: 1,014  浏览: 3,511 
作者: 徐晚霞, 王 博, 张 贺:中国地质大学(武汉)数学与物理学院,湖北 武汉
关键词: 主成分分析法模糊贴近度数据融合Principal Component Analysis Fuzzy Similarity Data Fusion
摘要: 本文利用多元统计方法中的主成分分析法计算测量值与主成分的相关系数,得出各传感器的综合支持程度,剔除综合支持程度较低的数据,取得有效数据。对有效数据,利用多传感器数据模糊相关特性,提出了一种基于模糊贴近度的数据融合方法。该数据融合方法计算过程相对固定,计算量小,便于计算机实时实现。
Abstract: In this paper, we use the principal component analysis in the multivariate statistical method, count the correlation coefficient between the measured value and the principal component, the comprehensive support degree is obtained, the lower comprehensive support level data are ex-cluded. We acquired valid data. For valid data, using fuzzy correlation characteristics of mul-ti-sensor data, a method of data fusion based on fuzzy closeness is proposed. The calculation process of the data fusion method is relatively fixed and the calculation amount is small, which is easy to be realized by computer in real time.
文章引用:徐晚霞, 王博, 张贺. 基于模糊数学和主成分分析的数据融合算法研究[J]. 应用数学进展, 2019, 8(5): 953-957. https://doi.org/10.12677/AAM.2019.85108

1. 引言

数据融合 [1] 技术是一种多传感器信息数据处理的技术,它利用计算机技术,对来自各个传感器的信息数据在一定的方法下,加以分析、提取、综合,得到被测对象更加全面、可靠、准确的结果。

多传感器数据融合可以增加测量的可信度,改善系统的可靠度,在工业和军事等方面得到了广泛的应用。本文利用多元统计方法中的主成分分析法计算测量值与主成分的相关系数,得出各传感器的综合支持程度,剔除综合支持程度较低的数据,对于剔除后的有效数据,首先将测量与估计值都进行模糊化,然后计算测量值与估计值之间的模糊贴近度,利用贴近度来描述各个传感器的重要度,确定各个传感器在融合算法中的权重。最后利用融合公式求出融合结果。

2. 主成分分析法

主成分分析法 [2] 是将研究对象的多个相关变量(指标)化为少数几个不相关的变量的一种多元统计方法。它作为一种数据分析技术,能对原有数据集进行简化处理,有效找到其中最主要的元素和组成结构,同时剔除信息中的噪音,降低数据冗余性,还能将原有的复杂数据进行降维处理,使得复杂数据结构能够简单化。主成分分析 [3] 的主要内容是把多个变量综合成一个或者少数几个综合指标,通过使用少数的综合指标来代表尽可能多的变量所包含的信息。

定义1:设总体 X = ( x 1 , x 2 , , x n ) 的协方差阵为 ,其特征根为 λ 1 λ 2 λ n ,对应的单位化正交特征向量为 e 1 , e 2 , , e n ,其中 e i = ( e 1 i , e 2 i , , e n i ) ,则第i个主成分为:

y i = e i X = e 1 i x 1 + e 2 i x 2 + + e n i x n (1)

定义1中,当总体的协方差未知时,可以用样本的协方差矩阵或相关矩阵代替。

定义2:在主成分分析中,定义主成分 y i 的方差贡献率

a i = λ i j = 1 n λ j i = 1 , 2 , , n (2)

来说明各主成分 y i 概括原变量X信息的大小。称 j = 1 k a i 为前k个主成分的累计方差贡献率。一般情况下取k使得累计方差贡献率 j = 1 k a i 达到85%以上。

定理1:总体X的原变量 x i 与主成分 y i 的相关系数为

ρ ( x i , y i ) = e i j λ j σ i (3)

其中, σ i x i 的标准差, e i j 为特征向量 e i 的第j个分量。

定理2:设 ( y 1 , y 2 , , y k ) 为总体X的前k个主成分,则 x j ( y 1 , y 2 , , y k ) 的复相关系数的平方:

τ j = ρ 2 [ x j , ( y 1 , y 2 , , y k ) ] = i = 1 k ρ 2 ( y i , x j ) (4)

因为 τ j 表示k个主成分 ( y 1 , y 2 , , y k ) 对原变量 x j 的贡献率,而这k个主成分 ( y 1 , y 2 , , y k ) 概括了原变量X的85%以上的信息,所以在某种程度上, τ j 可以看成是在总体X信息中所在的比重,可以利用 τ j 来定义各传感器的综合支持程度。

定义3:定义第i个传感器的综合支持程度:

z i = τ i i = 1 n τ i (5)

累计综合支持程度越高,则所包含的信息比重越大,一般情况下,取累计综合支持程度达85%以上的传感器。

3. 模糊数学

基于模糊贴近度的数据融合算法 [4] 先将传感器量测值与目标估计值进行模糊化,再定义与计算每个传感器的量测值模糊量与目标估计值模糊量之间的贴近度。由贴近度的大小来表示传感器的重要性,贴近度越大表示该传感器对数据融合结果的影响越重要,在融合过程中其权重也越大。最后提出数据融合公式实现多传感器数据融合。

对于第i个传感器,设其对真实值A的m次测量后的测量均值为 x i ,测量方差为 σ i 。则量测值的模糊量表示为

A ˜ i = ( a i 1 , a i 2 , a i 3 ) = ( x i 2 σ i , x i , x i + 2 σ i ) (6)

定义 A ˜ i A ˜ j 的贴近度为

S ( A ˜ i , A ˜ j ) = 1 1 + d ( A ˜ i , A ˜ j ) (7)

其中

d ( A ˜ i , A ˜ j ) = | a i 1 + 4 a i 2 + a i 3 a j 1 4 a j 2 a j 3 6 |

第i个传感器权重 r i 为:

r i = S ( A ˜ i , A ˜ 0 ) (8)

将它们归一化后可以得到各个传感器之间的相对权重为:

w i = r i l = 1 n r l (9)

则融合结果为:

x ¯ = i = 1 n w i x i

4. 应用实例

秭归县白水河滑坡8个传感器在2009年~2011年期间,水平位移监测值见图1。ZG91,ZG92,ZG93,ZG94,ZG118,ZG119,ZG120,XD01,8个传感器在秭归县白水河测得2009年1月到2011年12月的水平滑坡位移监测值 [5] ,通过数据融合的到最后融合数据,以此判断秭归县白水河的滑坡情况。

Figure 1. Displacement monitoring curve of baishuihe landslide

图1. 白水河滑坡水平位移监测曲线

对于秭归县白水河滑坡8个传感器在2009年~2011年每月的水平位移监测值,运用主成分分析法可知,上面8个传感器的综合支持度分别为0.024,0.022,0.047,0.058,0.064,0.118,0.331,0.358,则根据累计综合支持度大于85%,ZG91、ZG92、ZG93、ZG94的综合支持度不够,融合时删其读数,取其余传感器的测量数据用模糊贴近度的数据融合算法进行融合。传感器个数 n = 4 ,测量次数 m = 36 。模糊数学和主成分与模糊数学融合所得的结果见表1

Table 1. Compared the results of data fusion

表1. 数据融合结果比较

表1可以看到,本文提出的主成分与模糊数学方法与模糊数学融合结果相比,在计算过程中,由于用主成分减少了4个综合支持度不高的数据,在后面用模糊数学融合时,计算量少了很多。

5. 总结

多传感器数据融合综合利用多种传感器的信息以获得有关目标的属性特征,可以避免单一传感器的局限性限制,减少各传感器不确定误差的影响。本文提出了一种基于模糊理论与主成分分析方法集成的多传感器数据融合算法,该方法计算过程相对固定,便于计算机实时实现。

参考文献

[1] 严怀成, 黄心汉, 王敏. 多传感器数据融合技术及其应用[J]. 传感器技术, 2005, 24(10): 1-4.
[2] 董九英. 多传感器数据融合的主成分方法研究[J]. 计算机工程与应用, 2009, 45(33): 111-113.
[3] 向东进, 李宏伟, 刘小雅. 实用多元统计分析[M]. 武汉: 中国地质大学出版社, 2005.
[4] 向新建. 基于模糊数学与统计理论集成的多传感器数据融合方法[J]. 传感技术学报, 2004, 17(2): 197-199.
[5] 张俊, 殷坤龙, 王佳佳, 等. 基于时间序列与PSO-SVR耦合模型的白水河滑坡位移预测研究[J]. 岩石力学与工程学报, 2015, 34(2): 382-391.