基于Tucker分解的频率和时延联合估计算法

doi:10.12677/JISP.2021.103011

期刊菜单

基于Tucker分解的频率和时延联合估计算法
Joint Frequency and Time-Delay Estimation Using Tucker Decomposition

DOI: 10.12677/JISP.2021.103011, PDF, HTML, XML, 国家自然科学基金支持
作者: 刘洋, 吴云韬：武汉工程大学计算机科学与工程学院，湖北武汉
关键词: 张量；频率估计；时延估计；张量Tucker分解；Tensor； Frequency Estimation； Time-Delay Estimation； Tucker Decomposition

摘要: 本文提出了一种基于Tucker分解的频率和时延联合估计算法。通过相邻阵元接收的正弦信号之间的时延特征构造信号张量，其频率和时延信息可利用张量Tucker分解之后的信号子空间通过ESPRIT算法求得。计算机仿真验证了所提算法的性能。

Abstract: In this paper, we develop an algorithm based on tucker decomposition method for estimating the differential delay of a sinusoid signal received at two separated sensors as well as the sinusoidal frequencies. Using tucker method, the reconstructed signal tensor is decomposed, the frequency and time delay estimates are obtained by ESPRIT from the signal subspace. Performance evaluation via computer simulations is included to demonstrate the effectiveness of the proposed algorithm.

文章引用：刘洋, 吴云韬. 基于Tucker分解的频率和时延联合估计算法[J]. 图像与信号处理, 2021, 10(3): 99-105. https://doi.org/10.12677/JISP.2021.103011

1. 引言

频率和时延联合估计的应用包括丘脑皮质癫痫发作路径分析 [1]、频率–移位键控(FSK)调解 [2] 和说话人定位 [3] 等。本文研究了接收信号是正弦信号的频率和时延参数估计问题。

双阵元接收信号数据中蕴含了频率和时延信息，要从中进行参数估计，一般可以先估计其中的一个参数，再对另一个参数进行估计。目前，在正弦信号的频率估计和时延估计领域，有几种常见算法，包括PARAFAC方法(Parallel Factor Analysis) [4]、传统子空间方法 [5]、状态空间实现方法 [6] 和三线性交替最小二乘方法(Trilinear Alternating Least Square, TALS) [7] 等。文献 [4] 中提出了一种基于PARAFAC的频率和时延联合估计方法，该方法将数据矩阵重排，构造三个目标矩阵，利用交替最小二乘方法迭代求解，直到达到收敛条件。该方法多次迭代会影响算法速度。但该方法在样本数过大时，计算量会显著提升。文献 [5] 中提出了基于传统的子空间方法的时延和频率估计由数据矩阵的特征矢量与对应的特征值得到频率与时延信息。该方法需要进行两次矩阵的特征矢量分解，所以运算量较大，不利于实现。文献 [6] 中提出的基于状态空间的频率和时延联合估计算法，该算法通过构造状态空间模型，利用信号的协方差矩阵求得频率和时延信息。在采样数较大时，算法的精确度依赖于参数的取值。与传统方法相比，基于状态空间的时延估计结果具有闭式解，不需要搜索计算。文献 [7] 中提出了TALS方法，其基本思想是每一步更新一个矩阵，对余下的矩阵使用最小二乘(LS)来更新，直到算法收敛。由于TALS算法是基于迭代的最小二乘算法，所以会增加算法复杂度。本文以克拉美罗界(Cramér-Rao bound, CRLB)为算法的评价标准，克拉美罗界CRLB是信号的波达方向或者频率参数估计中一个作为算法性能指标的基准，是理想状态下算法所能达到的最优状态。当算法越靠近CRLB时，说明算法性能越好 [8]。现有的子空间方法拓展到多维信号一般是通过堆叠后利用矩阵来存储，显然这种方式构造不能准确的表达R-D固有数据的结构，而张量方法则可以更自然的对多维数据进行存储和操作。张量的Tucker分解最早由Tucker等人于1963年提出 [9]，随后又进一步的发展了这一理论，在1966年Tucker发表的一篇论文之后被学术界大量引用 [10]，是最早和最全面的关于张量Tucker分解方法概括的文章。Tucker分解有很多叫法，1986年，Kapteyn等学者发表的文章称这种分解方法为N-modePCA方法 [11]；DeLathauwer在2000年发表的文章中将这种分解称为高阶SVD分解 [12]。Tucker分解的实质，其实是PCA的高阶形式，将一个张量分解为核张量与各mode展开矩阵的乘积。本文提出了将张量Tucker分解和频率时延联合估计相结合的方法，利用张量来分析和处理多维数据并分离出信号子空间，为频率和时延联合估计提供了一种新的方法。同时，Tucker分解直接分离出信号子空间的奇异向量，利用ESPRIT算法一步求解就能估计出频率和时延参数，Tucker求解的过程中用到了快速算法Tucker3模型 [13]，处理方法简单明了，有效降低了算法的运算时间，提高了运算速度。仿真结果表明所提算法有良好的性能和较低的时间复杂度。

2. 问题描述及基本算法

正弦信号的频率估计和基于双阵元的时间延迟估计是信号处理中的热门研究主题，在最近的二十年中得到了较大的发展。对于单个正弦信号，用基于Fourier变换的方法可以获得精确的时延和频率估计 [14]。而对于多个正弦波的情形，一般的基于子空间方法和PARAFAC方法计算量较大，分辨率受其精度限制。所以本文提出一种张量Tucker分解的方法来估计频率和时延，有效的降低了算法的运算时间，并且有较好的性能。

不失一般性，基于双阵元正弦接收信号的模型为：

$\begin{array}{l} r_{1} (n) = s (n) + q_{1} (n) \\ r_{2} (n) = s (n - D) + q_{2} (n), n = 0, 1, \dots, N - 1 \end{array}$ (1)

其中， $s (n) = \sum_{m = 1}^{P} α_{m} \exp (j ω_{m} n)$ 由P个复正弦信号组成。假设P先验已知，信号中第m个分量的复振幅和频率分别用 $α_{m}$ 和 $ω_{m}$ 表示。 $s (n - D)$ 为相邻含时延阵元的接收信号，D表示时延，N为采样数。接收信号数据中含有的零均值复高斯白噪声用 $q_{1} (n)$ 和 $q_{2} (n)$ 表示，它们互不相关且方差为 $σ_{q}^{2}$ 。

将两个相邻阵元的接收信号重排为 $x (n)$ ：

$x (n) = {[r_{1} (n), r_{1} (n + 1), \dots, r_{1} (n + M - 1), r_{2} (n), r_{2} (n + 1), \dots, r_{2} (n + M - 1)]}^{T}, n = 0, 1, \dots, K - 1$ (2)

其中， $K = N - M + 1$ ，“T”表示转置操作。K在 $P + 1$ 和 $N - P + 1$ 之间取值，这样当n变化时， $x (n)$ 的秩都小于P，M为矢量长度且远大于P。公式(2)中的状态空间模型为：

$s (n + 1) = Φ s ( n )$

$x (n) = B s (n) + q (n)$ (3)

其中， $s (n) = {[α_{1} e^{j ω_{1} n}, α_{2} e^{j ω_{2} n}, \dots, α_{p} e^{j ω_{p} n}]}^{T}$ ， $Φ = diag (e^{j ω_{1}} {,e}^{j ω_{2}}, \dots {,e}^{j ω_{p}})$ ， $B = {[A^{T} {(A Δ)}^{T}]}^{T}$

$A = [\begin{matrix} 1 \\ e^{j ω_{1}} \\ ⋮ \\ e^{j ω_{1} (M - 1)} \end{matrix} \begin{matrix} 1 \\ \begin{array}{l} e^{j ω_{2}} \\ ⋮ \end{array} \\ e^{j ω_{2} (M - 1)} \end{matrix} \begin{matrix} \dots \\ \dots \\ ⋱ \\ \dots \end{matrix} \begin{matrix} 1 \\ \begin{array}{l} e^{j ω_{p}} \\ ⋮ \end{array} \\ e^{j ω_{p} (M - 1)} \end{matrix}]$

$Δ = diag (e^{- j D ω_{1}}, e^{- j D ω_{2}}, \dots, e^{- j D ω_{P}})$

$q (n) = {[q_{1} (n), q_{1} (n + 1), \dots, q_{1} (n + M - 1), q_{2} (n), q_{2} (n + 1), \dots, q_{2} (n + M - 1)]}^{T}$

$L \geq 2$ 是一给定的正整数，定义向量 $X_{l} = [x (1 + l), \dots, x (K - L + l + 1)]$ ，通过状态空间模型有：

$X_{l} = B Φ_{l} S + Q_{l}, l = 0, 1, \dots, L - 1$ (4)

其中， $Φ_{l} = diag (e^{j l ω_{1}}, e^{j l ω_{2}}, \dots, e^{j l w_{P}})$ ， $S = [s (1), \dots, s (K - L + 1)]$ ， $Q_{l} = [q (1 + l), \dots, q (K - L + l + 1)]$ 。

给定 $i (i = 1, 2, \dots, K - L + 1)$ ，将(4)式中 $X_{l}$ 通过矩阵重排，构造成三维切片形式。在不考虑噪声的情况下，可以构成含频率和时延信息的三维流形 [12]：

$X (i, :, :) = x_{n} (:, i : (i + L - 1)), i = 1, 2, \dots, K - L + 1$ (5)

其中，公式(2)中的 $x (n)$ 用 $x_{n}$ 表示。

将(5)式的信号三维流形X张量化，构造张量 $X \in ℂ^{(K - L + 1) \times 2 M \times L}$ ，可以将其通过Tucker分解为：

$X = G \times {}_{1}U_{1} \times {}_{2}U_{2} \times {}_{3}U_{3}$ (6)

其中， $G \in ℂ^{(K - L + 1) \times 2 M \times L}$ 称为张量核，并满足文献 [15] 中所述的全正交条件。 $U_{1} \in ℂ^{(K - L + 1) \times (K - L + 1)}$ ， $U_{2} \in ℂ^{2 M \times 2 M}$ ， $U_{3} \in ℂ^{L \times L}$ 为酉矩阵，即满足 $U_{r} U_{r}^{H} = I_{r}, r = 1, 2, 3$ ， $I_{r}$ 是规模与 $U_{r}$ 相同的单位矩阵。通过Tucker分解，张量 $X$ 的r-mode奇异向量 $U_{r}, r = 1, 2, 3$ 中含有P个正弦信号的频率信息和相邻阵元的时延信息。

由式(6)可知，张量核 $G$ 的秩为P [15]，则有

$\tilde{X} = {\tilde{G}}^{[P]} \times {}_{1}{\tilde{U}}_{1}^{[P]} \times {}_{2}{\tilde{U}}_{2}^{[P]} \times {}_{3}{\tilde{U}}_{3}^{[P]}$ (7)

其中， ${\tilde{G}}^{[P]} \in ℂ^{P \times P \times P}$ ， ${\tilde{U}}_{1}^{[P]} \in ℂ^{(K - L + 1) \times}^{P}$ ， ${\tilde{U}}_{2}^{[P]} \in ℂ^{2 M \times}^{P}$ ， ${\tilde{U}}_{3}^{[P]} \in ℂ^{L \times}^{P}$ ， ${\tilde{U}}_{r}^{[P]}$ 是 $U_{r}$ 的前P个列向量。由于矩阵重排后的频率信息和时延信息包含在 ${\tilde{U}}_{1}^{[P]}$ 和 ${\tilde{U}}_{2}^{[P]}$ 中，可以利用对应的结构，找到信号子空间和噪声子空间。因此，可以先利用对应的 ${\tilde{U}}_{1}^{[P]}$ 的结构和ESPRIT方法 [16]，构造旋转不变矩阵 $Φ$ ，其估计值用 $\tilde{Φ}$ 表示：

$\tilde{Φ} = {[{\tilde{U}}_{1}^{[P]} (1 : M - 1), :]}^{γ} {\tilde{U}}_{1}^{[P]} (P : M, :)$ (8)

符号“ $γ$ ”表示伪逆操作，对 $\tilde{Φ}$ 进行特征值分解：

$\tilde{Φ} = V_{s} Λ_{s} V_{s}^{H}$ (9)

其中， $V_{s} \in ℂ^{P \times}^{P}$ 的列向量张成 $\tilde{Φ}$ 的信号子空间，而 $Λ_{s} \in ℂ^{P \times}^{P}$ 的对角线元素为 $\tilde{Φ}$ 的特征值。而特征值的对角元素就是对应的频率参数。接着对特征值求相位值，就可以估计出信号的频率信息。频率估计值可以求得为：

${\tilde{ω}}_{m} = ∠ Λ_{s} (m, m), m = 1, 2, \dots, P$ (10)

符号“ $∠$ ”表示求相位角操作。因为Tucker分解分离出的 ${\tilde{U}}_{2}^{[P]}$ 中包含时延信息，所以利用 ${\tilde{U}}_{2}^{[P]}$ 的结构来估计 $Δ$ ，首先对其求伪逆，值用 $\tilde{Δ}$ 表示：

$\tilde{Δ} = {[{\tilde{U}}_{2}^{[P]} (1 : M, :)]}^{γ} {\tilde{U}}_{2}^{[P]} (M + 1 : 2 M, :)$ (11)

最后，对于时延 $\tilde{D}$ ，其值可以用频率的估计值和 $\tilde{Δ}$ 对角元素的加权平均的方法获得：

$\hat{D} = \frac{\sum_{m = 1}^{P} ∠ \tilde{Δ} (m, m)}{- \sum_{m = 1}^{P} {\hat{ω}}_{m}}$ (12)

3. 仿真结果

在计算机仿真中，实验的对比算法选择为目前常见的且有代表性的PARAFAC算法、传统子空间算法(仿真图中的Subspace)和TALS算法。其中，性能指标以克拉美罗界为衡量标准(理想状态下，算法能达到的最好效果，即仿真图中的CRLB)。正弦信号 $s (n)$ 设置为 $s (n) = α_{1} e^{j ω_{1} n} + α_{2} e^{j ω_{2} n}$ ， $α_{1} = 1 / \sqrt{2}$ ， $α_{2} = 1 / \sqrt{2}$ ， $ω_{1} = 0.2 π rad / s$ ， $ω_{2} = 0.4 π rad / s$ 。采样次数为 $N = 100$ ， $M = 25$ ， $L = 4$ 。采样间隔为1s且时延 $D = 1.7 s$ 。所有的仿真图是在200次独立实验下取平均的结果。图1~3分别给出了两个分量的频率估计和时延估计的均方误差随信噪比变化的对比图。

Figure 1. MSE versus SNR for Frequency $ω_{1}$

图1. 频率分量 $ω_{1}$ 的均方误差和SNR图

Figure 2. MSE versus SNR for Frequency $ω_{2}$

图2. 频率分量 $ω_{2}$ 的均方误差和SNR图

Figure 3. MSE versus SNR for Frequency $ω_{3}$

图3. 频率分量 $ω_{3}$ 的均方误差和SNR图

从图1、图2及图3来看，基于PFA方法和基于子空间的方法更接近于CRLB下界，所提算法的第一个频率分量的算法估计性能优于TALS，且接近于子空间方法性能。在信噪比小于−5 dB时，所提算法的第二个个频率分量的算法估计性能优于子空间方法和TALS方法。图3在信噪比为−10 dB到−5 dB时，所提算法的时间延迟估计D远高于TALS方法，性能与子空间方法相似(见图3)。

图4给出了频率 $ω_{1}$ 以 $0.01 π$ 的步长从 $0 π$ 变化至 $0.3 π$ 的频率间隔变化图，实验在SNR = 5下进行，其余参数不变(见图4)。

从图4来看，所提算法在 $0 π$ 到 $0.06 π$ 的高分辨率下，性能优于PFA方法和TALS方法，随着频率间隔逐渐增大，所提算法的性能则不如PFA方法和TALS方法，而基于子空间方法分辨率最高。

图5给出了算法的时间复杂度，采样数N从100以步长为5增加到145。在计算量需求方面，PARAFAC方法在迭代次数为 $λ$ 次的算法复杂度为 $o (3 λ (P^{3} + 2 P L M (N - M - L + 2)))$ [17]，由大量仿真实验表明，当M和L越大，性能越高，但同时计算量也越大。子空间方法的算法复杂度为 $o ({(2 P L)}^{2} (N - M + 1) + 8 P^{3} L^{3})$ [6]，TALS的算法复杂度为 $o (2 (N - M + 1) M L P r)$ [18]，本文所提算法的复杂度为 $o (2 (N - M + 1) M L)$ [15]，其计算代价最低，而且随着采样数的增加，复杂度增长最慢。

Figure 4. Frequency resolution

图4. 频率分辨率图

Figure 5. Computational time compared

图5. 运算复杂度比较图

从图5来看，所提算法时间复杂度最低。随着采样数的增加，基于PFA算法的时间复杂度增长要快于其他算法，TALS方法次之，子空间算法时间复杂度增长较慢，而在同等采样数下，所提算法的时间复杂度增长最慢(见图5)。

4. 结论

本文提出了一种利用张量Tucker分解的频率和时延联合估计算法。所提算法通过构造信号张量，利用张量Tucker分解，分离出信号的r-mode奇异向量，再通过ESPRIT算法估计出频率和时延参数。Tucker分解利用了Tucekr3模型 [13] 使其算法速度极大提升，同时在较低信噪比下，也能达到很好的性能。仿真结果表明所提算法在时间复杂度上要优于TALS方法、PARAFAC方法和子空间方法。参数估计过程中，参数兼并是一个十分重要的问题，本文所研究的算法无法较好的处理参数兼并问题。将来的工作重点之一是能研究有效解决参数兼并的快速算法。

基金项目

国家自然科学基金(No.61771353)资助课题。

参考文献

[1]	Sherman, D.L., Tsai, Y.C., Rossell, L.A., et al. (1995) Narrowband Delay Estimation for Thalamocortical Epileptic Seizure Pathways. 1995 International Conference on Acoustics, Speech, and Signal Processing IEEE, Vol. 5, 2939-2942.
[2]	Sills, J.A. and Black, Q.R. (1996) Frequency Estimation from Short Pulses of Sinusoidal Signals. Proceedings of MILCOM’96 IEEE Military Communications Conference IEEE, Vol. 3, 979-983.
[3]	Ngan, L.Y., Wu, Y., So, H.C., et al. (2003) Joint Time Delay and Pitch Estimation for Speaker Localization. Proceedings of the 2003 International Symposium on Circuits and Systems, Vol. 3, 3.
[4]	Wu, Y., So, H.C. and Tan, Y. (2009) Joint Time-Delay and Frequency Estimation Using Parallel Factor Analysis. Signal Processing, 89, 1667-1670. [Google Scholar] [CrossRef]
[5]	Liao, G., So, H.C. and Ching, P.C. (2001) Joint Time Delay and Frequency Estimation of Multiple Sinusoids. 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol. 5, 3121-3124.
[6]	Wu, Y., So, H.C. and Ching, P.C. (2003) Joint Time Delay and Frequency Estimation via State-Space Realization. IEEE Signal Processing Letters, 10, 339-342. [Google Scholar] [CrossRef]
[7]	Zhang, X.F. and Xu, D.Z. (2009) Novel Joint Time Delay and Frequency Estimation Method. IET Radar, Sonar & Navigation, 3, 186-194. [Google Scholar] [CrossRef]
[8]	Stoica, P. and Nehorai, A. (1989) MUSIC, Maximum Likelihood, and Cramer-Rao Bound. IEEE Transactions on Acoustics, Speech, and Signal Processing, 37, 720-741. [Google Scholar] [CrossRef]
[9]	Tucker, L.R. (1963) Implications of Factor Analysis of Three-Way Matrices for Measurement of Change. Problems in Measuring Change, 15, 122-137.
[10]	Tucker, L.R. (1966) Some Mathematical Notes on Three-Mode Factor Analysis. Psychometrika, 31, 279-311. [Google Scholar] [CrossRef]
[11]	Kapteyn, A., Neudecker, H. and Wansbeek, T. (1986) An Approach Ton-Mode Components Analysis. Psychometrika, 51, 269-275. [Google Scholar] [CrossRef]
[12]	De Lathauwer, L., De Moor, B. and Vandewalle, J. (2000) A Multilinear Singular Value Decomposition. SIAM Journal on Matrix Analysis and Applications, 21, 1253-1278. [Google Scholar] [CrossRef]
[13]	Van Trees, H.L. (2004) Optimum Array Processing: Part IV of Detection, Estimation, and Modulation Theory. John Wiley & Sons, Hoboken.
[14]	吴云韬. 非平稳, 色噪声环境下的参数估计方法研究[D]: [博士学位论文]. 西安: 西安电子科技大学, 2003.
[15]	Kolda, T.G. and Bader, B.W. (2009) Tensor Decompositions and Applications. SIAM Review, 51, 455-500. [Google Scholar] [CrossRef]
[16]	Roy, R. and Kailath, T. (1989) ESPRIT-Estimation of Signal Parameters via Rotational Invariance Techniques. IEEE Transactions on Acoustics, Speech, and Signal Processing, 37, 984-995. [Google Scholar] [CrossRef]
[17]	Bro, R.P. (1997) Tutorial and Applications. Chemometrics and Intelligent Laboratory Systems, 38, 149-172.
[18]	张胜男. 基于平行因子分析的阵列参数估计[D]: [硕士学位论文]. 南京: 南京航空航天大学, 2008.

友情链接