具有状态和控制乘性噪声控制系统的可镇定条件
Conditions of Stabilizability for Control Systems with State and Control Multiplicative Noises
DOI: 10.12677/dsc.2025.144033, PDF, HTML, XML,    科研立项经费支持
作者: 刘光明:嘉应学院数学学院,广东 梅州
关键词: 鲁棒控制均方镇定乘性噪声代数Riccati方程 Robust Control Mean-Square Stabilizability Multiplicative Noises Algebraic Riccati Equation
摘要: 本文研究了一类具有乘性噪声的离散时间线性时不变系统的镇定问题。这类乘性噪声同时存在于状态和控制输入通道,并且被假设为独立同分布的随机过程。为了确保开环不稳定系统能通过状态反馈实现均方意义下的镇定,我们推导出了均方可镇定的基本条件。通过求解非负矩阵的谱半径,首先给出了系统可镇定的充要条件。然后,运用拉格朗日乘数法得出了最优控制镇定系统的充分条件,这些条件由三个耦合的非标准代数Riccati方程决定。在一种特殊情形下,我们得出结论:状态和控制通道均存在乘性噪声的系统与状态通道无噪声系统共用同一个最优控制增益。最后,数值仿真验证了算法的有效性。
Abstract: This paper studies the stabilization problem for a class of discrete-time linear time-invariant systems with multiplicative noises. These multiplicative noises are assumed to be present in the state and control input channels and modeled as independent and identically distributed random processes. We develop fundamental conditions of mean-square stabilizability which ensure that an open-loop unstable system can be stabilized by state feedback in the mean-square sense. By solving the spectral radius of a non-negative matrix, a sufficient and necessary condition which stabilize system is first presented. And then, the Lagrange multiplier method is used to obtain the sufficient condition for optimal control stabilizing system, which is determined by three coupled non-standard algebraic Riccati equations. In a special case, we conclude that the system with state and control multiplicative noises can share a common optimal controller gain with the noise-free system for the state channel. Finally, numerical simulation illustrates the efficiency of the algorithm.
文章引用:刘光明. 具有状态和控制乘性噪声控制系统的可镇定条件[J]. 动力系统与控制, 2025, 14(4): 327-339. https://doi.org/10.12677/dsc.2025.144033

1. 引言

在过去的五十多年,具有乘性噪声的随机不确定系统的控制问题一直是广受关注的研究热点(例如,参见[1]-[8]及其中的参考文献)。网络控制领域的最新研究成果表明,随机乘性噪声可被用于有效建模信道不确定性,例如数据包丢失[9]-[15]、信噪比约束和带宽限制[16] [17]等。这一发现进一步推动了网络控制与随机控制两个领域的研究兴趣。然而时至今日,仍有一些基本的控制问题未被很好地解决。

对于具有乘性噪声的随机控制系统的稳定性问题的研究可追溯至七十年代。在1971年,Willems和Blankenship在文献[1]中给出了线性时不变(LTI)单输入单输出(SISO)随机乘性不确定系统均方稳定的充分必要条件,该条件明确揭示了噪声方差与被控对象 H 2 范数之间的相互制约关系。作为推广,Lu和Skelton在文献[4]中研究了多输入多输出(MIMO)的情形,并给出一个称之为均方小增益定理的充分必要条件,该条件与高度非线性的矩阵方程有关。在网络控制场景中,Elia在文献[9]中重新探讨了LTI MIMO系统的均方镇定问题,并获得了类似的条件。Xiao等人在文献[12]中研究了具有丢包的网络化反馈控制系统的镇定问题,明确建立了均方可镇定性与通信信道信噪比之间的联系。近期,Zhang等人在文献[6]中采用线性二次调节(LQR)设计方法,研究了具有乘性噪声和输入延迟的离散时间系统的最优控制与镇定问题。文献[8]借助输出反馈设计研究了类似的问题,给出了均方可镇定的若干基本条件。Gu在文献[18]中提出了一种均衡方法,用于衰落信道下MIMO系统的反馈镇定。

本文中研究了一类具有状态和控制乘性噪声的线性离散时间系统的状态反馈镇定问题。假设状态测量通道与控制输入通道均受到乘性噪声的干扰。目前而言,上述控制问题仍悬而未决,这也是笔者的研究动机所在。与现有工作相比,本文的主要贡献如下:

1) 建立了具有状态和控制乘性噪声的均方稳定问题模型,并且通过求解非负矩阵的谱半径,给出了系统均方稳定的充要条件。

2) 运用拉格朗日乘数法[19],推导出最优均方镇定的充分条件,该条件由三个耦合的非标准代数黎卡提方程(ARE)确定。

3) 在一种特殊场景下,证明了具有状态与控制乘性噪声的系统与状态通道无噪声系统共享同一个最优控制增益。

本文剩余的部分安排如下。在第2章将给出问题描述及准备工作。在第3章将讨论均方稳定性与最优设计问题。第4章通过数值仿真验证算法的有效性。最后给出总结及展望。

下面给出一些本文将要用到的符号。用 R n 表示 n 维实向量空间。向量或矩阵的转置用 ( ) T 表示。数学期望算子和谱半径分别记为 E( ) ρ( ) 。矩阵的迹用 Tr( ) 表示。由参数构成的块对角矩阵记为 diag{ a 1 ,, a n } 。对于实对称矩阵 X ,符号 X>0 ( X0 )代表 X 是正定的(半正定的)。若传递函数矩阵 G( z ) 是正则且稳定的,那么 G( z ) 2 表示 G( z ) H 2 范数(详见文献[19])。

2. 问题描述

首先考虑如下系统

x k+1 =A x k +B v k , v k =( 1+ ω 0k ) u k , u k =F( I n + ω k ) x k , (1)

其中 x k R n 是系统状态, F=( F 1 ,, F n ) n 维状态反馈增益,控制输入 u k R I n R n×n 是单位矩阵。 ω 0k , ω k =diag{ ω 1k ,, ω nk } 分别是状态和输入通道的乘性噪声。系统(1)如图1所示。

Figure 1. The closed-loop system with state and control multiplicative noises

1. 具有状态和控制乘性噪声的闭环系统

本文始终遵循如下假设。

假设2.1 A 反稳定, ( A,B ) 可镇定,且 A+BF 是稳定的。

假设2.2乘性噪声 { ω ik },i=0,1,,n 是独立同分布的(i.i.d)随机过程,并且它们之间彼此互不相关,即

E{ ω ik }=0 E{ ω i k 1 ω i k 2 }={ σ i 2 , k 1 = k 2 0, k 1 k 2 E{ ω i k 1 ω j k 2 }=0 ij

其中 σ i 2 ,i=0,1,,n 是噪声方差。

需要指出的是,在早期的相关研究中(如文献[4]),假设2.2的做法是标准的。

定义2.1:称闭环系统(1)是均方可镇定的,若存在常增益矩阵 F ,满足对于任意初始状态 x 0 R n ,成立 lim k E{ x k T x k }=0

本文将聚焦于解决如下两个问题:

1) 如何判断系统(1)的稳定性?

2) 为获得闭环系统(1)的最大均方稳定性裕量,如何设计最优控制增益 F

本文将为上述问题提供部分解决方案。首先为简化分析,把系统(1)改写为

{ x k+1 =( A+BF ) x k +B I d k +B d ^ k , d k = ω k y k , d ^ k = ω 0k u k , y k = F x k , u k =F x k + I d k , (2)

其中 I =( 1,,1 ) R n F =diag{ F 1 ,, F n }

闭环系统(2)的框图如图2所示,其中 G 为系统(2)的标称装置,其表达式为

Figure 2. The equivalent closed-loop system

2. 等价的闭环系统

G=( A+BF B I B F 0 0 F I 0 )=( A+BF B B B F ¯ 1 0 0 0 F ¯ n 0 0 0 F 1 1 0 )[ G 11 G 1n G 1( n+1 ) G n1 G nn G n( n+1 ) G ( n+1 )1 G ( n+1 )n G ( n+1 )( n+1 ) ]

其中 F ¯ i ( 0,, F i ,,0 ),i=1,,n ,即,除去第 i 个元素 F i ,其余元素皆为零。又 G ij = F ¯ i ( zIABF ) 1 B,i=1,,n;j=1,,n+1 ,并且 G ( n+1 )k =1+F ( zIABF ) 1 B,k=1,,n G ( n+1 )( n+1 ) =F ( zIABF ) 1 B

为便于后续分析,引入以下记号:

G ^ [ G 11 2 2 G 1n 2 2 G 1( n+1 ) 2 2 G n1 2 2 G nn 2 2 G n( n+1 ) 2 2 G ( n+1 )1 2 2 G ( n+1 )n 2 2 G ( n+1 )( n+1 ) 2 2 ] Σ=diag{ σ 1 2 ,, σ n 2 , σ 0 2 }

下述结论在文献[4]中被称为均方小增益定理,它将在后续的研究中发挥关键作用。

引理2.1在假设2.1和假设2.2成立的条件下,对于给定的状态反馈矩阵 F ,系统(1)是均方稳定的,当且仅当矩阵 G ^ Σ 的谱半径小于1,即 ρ( G ^ Σ )<1

3. 主要结果

3.1. 稳定性条件

本节将给出有关系统(1)稳定的一系列充分必要条件。

定理3.1在假设2.1和假设2.2成立的条件下,对于给定的状态反馈矩阵 F ,以下陈述是等价的。

1) 系统(1)均方稳定;

2) 存在 P>0 ,满足

( A+BF ) T P( A+BF )+ σ 0 2 ( BF ) T P( BF )+( 1+ σ 0 2 ) i=1 n σ i 2 F ¯ i T B T PB F ¯ i P<0

3) 存在 Q>0 α j >0,j=1,,n+1 ,满足如下线性矩阵不等式(LMI)

( A+BF )Q ( A+BF ) T Q+ j=1 n+1 B α j B T <0

α i > σ i 2 F ¯ i Q F ¯ i T i=1,,n α n+1 > σ 0 2 FQ F T + σ 0 2 j=1 n α j (3)

证明:见附录A。

定理3.2在假设2.1和假设2.2成立的条件下,对于给定的状态反馈矩阵 F ,系统(1)是均方稳定的,当且仅当

σ 0 2 G ( n+1 )( n+1 ) 2 2 +( 1+ σ 0 2 ) i=1 n σ i 2 G i1 2 2 <1 (4)

证明:见附录B。

采用文献[19]中关于 H 2 范数的计算方法,我们得到

F ( zIABF ) 1 B 2 2 = B T P 0 B

F ¯ i ( zIABF ) 1 B 2 2 = B T P i B (5)

i=1,,n ,其中 P 0 >0, P i >0 满足Lyapunov方程

( A+BF ) T P 0 ( A+BF ) P 0 + F T F=0 (6)

( A+BF ) T P i ( A+BF ) P i + F ¯ i T F ¯ i =0 (7)

i=1,,n 。由此,上述不等式(7)可被等价转化为

σ 0 2 G ( n+1 )( n+1 ) 2 2 +( 1+ σ 0 2 ) i=1 n σ i 2 G i1 2 2 = σ 0 2 B T P 0 B+( 1+ σ 0 2 ) i=1 n σ i 2 B T P i B <1 (8)

3.2. 均方稳定性界

由定理3.2可知,对于给定的 F ,为保证系统(1)的稳定性,状态和控制噪声的方差需满足相应约束。因此,当选择不同的 F 时,方差的范围会随之变化。这就引出了如下问题:如何找到增益矩阵 F ,以最大化系统(1)的均方稳定裕量?简单起见,假设 σ i 2 ( i=1,,n ) 为已知的,而 σ 0 2 为可调的。由此,使得系统(1)均方稳定的 σ 0 2 的临界值可刻画为

σ * = sup F { σ 0 2 }

其中 是所有能使闭环系统(1)实现均方稳定的控制器增益的集合。此外,使 σ 0 2 取值最大化的最优控

制器增益可表示为

F opt =arg{ σ * }

进一步地利用(8)式可得

σ * = sup F { σ 0 2 }= sup F 1 i=1 n σ i 2 B T P i B B T P 0 B+ i=1 n σ i 2 B T P i B (9)

不失一般性,另外给出如下假设。

假设3.1:方差 σ i 2 = σ 2 ,i=1,,n

接下来,将关于(7)式的n个方程分别从左右两边相加可得

( A+BF ) T ( i=1 n P i )( A+BF )( i=1 n P i )+ i=1 n F ¯ i T F ¯ i =0 (10)

若令 P= i=1 n P i diag( F T F )= i=1 n F ¯ i T F ¯ i ,其中 diag( ) 表示n阶方阵中除对角线元素外其余元素均为零。于是方程(10)可重写为

( A+BF ) T P( A+BF )P+diag( F T F )=0 (11)

随后,(8)和(9)式可分别简化为

σ 0 2 B T P 0 B+( 1+ σ 0 2 ) σ 2 B T PB<1 (12)

σ * = sup F { σ 0 2 }= sup F 1 σ 2 B T PB B T P 0 B+ σ 2 B T PB (13)

其中 P 0 ,P 分别是方程(6)和(11)的正定解。

在网络控制系统中(NCSs),信道容量被定义为[9]

C u = 1 2 log( 1+ 1 σ 0 2 ) (14)

因此系统(1)是均方可镇定的,当且仅当

C u > C u * = 1 2 log inf F ( 1+ B T P 0 B 1 σ 2 B T PB ) (15)

采用拉格朗日乘数法[19],我们可得到如下定理。

定理3.3使得 C u 的取值达到最小的可能最优控制器增益可表示为

F opt =( 1 σ 2 B T PB 1+ B T P 0 B B T P 0 A+ σ 2 B T PA ) ( I n + σ 2 diag( Λ ) Λ 1 ) 1 (16)

其中 Λ>0 P 0 >0 P>0 满足方程

( A+B F opt )Λ ( A+B F opt ) T Λ+B B T =0 (17)

( A+B F opt ) T P 0 ( A+B F opt ) P 0 + F opt T F opt =0 (18)

( A+B F opt ) T P( A+B F opt )P+diag( F opt T F opt )=0 (19)

证明:见附录C。

3.1由定理3.3可以看到,求解由三个耦合的非标准代数黎卡提方程(17)、(18)和(19)所确定的 F opt 是比较困难的。特别地,当 σ 2 =0 时,最优控制器增益退化为

F opt = ( 1+ B T P 0 B ) 1 B T P 0 A

其中 P 0 >0 满足如下黎卡提方程

A T P 0 A P 0 A T P 0 B ( 1+ B T P 0 B ) 1 B T P 0 A=0 (20)

此时

B T P 0 B= i=1 n | λ i | 2 1 (21)

其中 λ i ,i=1,,n 是矩阵 A 的不稳定特征根。因此,系统(1)均方可镇定的充分必要条件简化为

C u > i=1 n log| λ i |

这与文献[9]中得到的结果是一致的。

为获取系统(1)的最小信道容量(或最大稳定裕度)及相应的最优控制器增益,我们可借助如下定理。

定理3.4系统(1)均方可镇定的充分必要条件为 σ 0 2 < σ * ,其中 σ * 的求解转化为如下优化问题:

1 σ * =inf 1 σ 0 2

约束条件为

[ Q AQ+BY ( B I ,B )α Q A T + Y T B T Q 0 α ( B I ,B ) T 0 α ]>0 (22)

[ α i σ 2 F ¯ i Q Q F ¯ i T Q ]0 i=1,,n (23)

[ α n+1 σ 0 2 Y I α ¯ Y T Q 0 α ¯ I T 0 α ¯ ]>0 (24)

其中 Y=FQ α=diag{ α 1 ,, α n , α n+1 } α ¯ =diag{ α 1 ,, α n }

证明:运用Schur补[3],定理3.1中的不等式组(3)既可分别对应等价转化为(22)、(23)和(24)。

3.2遗憾的是,上述优化问题是非凸的,如何求解,是需要进一步探讨的问题。

在一种特殊情况下,有如下结论。

定理3.5假设矩阵A是对角的。则系统(1)是均方可镇定的,若满足

C u > i=1 n log| λ i | 1 2 log( 1 σ 2 B T PB ) (25)

且最优控制器增益为

F opt = ( 1+ B T P 0 B ) 1 B T P 0 A

其中 P 0 >0 P>0 满足方程(20)和(19)。

证明:见附录D。

3.3定理3.5表明,具有状态和控制乘性噪声的系统与状态通道无噪声系统共用同一个最优控制增益,而且信道的最小容量由系统不稳定极点和状态通道噪声方差 σ 2 决定。

ω k 为标量,则可认为状态信号在网络化环境下以数据包形式传输。在此情况下,系统(1)被转化为

{ x k+1 =( A+BF ) x k +B r k , u ¯ k =F x k , r k = ω ¯ k u ¯ k , ω ¯ k = ω 0k + ω k + ω 0k ω k . (26)

定理3.6系统(26)是均方可镇定的,当且仅当成立

C u > i=1 n log| λ i | 1 2 log( 1 σ 2 ( i=1 n | λ i | 2 1 ) ) (27)

证明:直接运用引理2.1得系统(26)均方可镇定的充要条件为

E( ω ¯ 2 ) inf F G 2 2 <1 (28)

由于 E( ω ¯ 2 )= σ 0 2 + σ 2 + σ 0 2 σ 2 ,且 inf F G 2 2 = i=1 n | λ i | 2 1 ,将它们代入(28)可得(27)。

4. 一个示例说明

为便于说明,考虑如下三阶系统

{ x k+1 =A x k +B v k , v k =( 1+ ω 0k ) u k , u k =F( I 3 + ω k ) x k , (29)

其中 x k R 3 ,初始状态 x 0 = ( 1,1,1 ) T E{ ω 0k 2 }= σ 0 2 E{ ω k 2 }= σ 2 I 3

4.1. 矩阵A为对角的情形

在这种情况下,假设矩阵

A=[ 2.5 0 0 0 1.25 0 0 0 2 ] B=[ 1 1 1 ]

根据定理3.5,当 σ 2 =0 时,可得到系统(29)的最优控制器增益 F opt 。事实上,通过求解一个广义特征值问题(GEVP) [3],得 F opt =[ 7.3920 0.1066 4.1354 ] 。令 F= F opt ,根据定理3.4,对于给定的 F ,最大化系统(1)的均方稳定性裕量同样是一个GEVP。若取 σ 2 = 1 3280 ,则 σ * = 1 47.3495 。因此,使得系统(29)稳定的充要条件为 σ 0 2 < 1 47.3495 。从图3可以看到:当 σ 0 2 略小于 1 47.3495 时,状态均方值 E{ x k T x k } 收敛;而当 σ 0 2 略大于 1 47.3495 时,状态均方值 E{ x k T x k } 发散。

根据定理3.3,再次计算最优控制器增益 F opt ,运用文献[10]中有关离散矩阵序列的迭代收敛算法得

Λ=[ 7.4405 9.4697 9.7656 9.4697 69.4444 11.1607 9.7656 11.1607 13.0208 ] P 0 =[ 406.5600 7.4631 298.5231 7.4631 0.7894 4.9207 298.5231 4.9207 222.6746 ]

P=[ 9313.6 115 7172.8 115 6.2 81.2 7172.8 81.2 5588.2 ] F opt =[ 7.3920 0.1066 4.1354 ] σ * = 1 47.3495

Figure 3. The mean-square evolution curve of the states when σ 0 2 = 1 47.4 and σ 0 2 = 1 47.3 , respectively

3. σ 0 2 = 1 47.4 σ 0 2 = 1 47.3 时的状态均方演化曲线

这与先前的结果一致,这意味着最优增益 F σ 2 无关。因此,这印证了系统(1)与 σ 2 =0 时的系统具有共同的最优增益。

4.2. 矩阵A为非对角的情形

接下来,假设矩阵

A=[ 3.5104 3.1250 5.0521 0.8125 1.2500 4.0625 0.3021 0.6250 0.9896 ]

该矩阵与前一个矩阵具有相同的特征值。通过采用4.1节中所使用的类似论证方法,得到如下结果:首先令 σ 2 =0 ,可得

F opt =[ 1.4121 1.0134 0.7245 ]

然后取 σ 2 = 1 3280 ,由此得到 σ * = 1 69.1575 。最后通过使用迭代收敛算法可得

F opt =[ 1.3003 0.9047 0.6943 ] σ * = 1 54.5228

这意味着此时获得了更大的稳定性裕量。事实上,这一点可类比图3进行说明。

5. 结论

本文研究了具有乘性噪声的离散时间随机系统的控制问题。首先对系统稳定性展开分析,通过求解非负矩阵的谱半径,得到了系统稳定的充要条件。随后探讨了控制器的优化设计:运用拉格朗日乘数法,推导出了系统均方可镇定的充分条件。特别地,当系统矩阵为对角矩阵时,研究发现:具有状态与控制乘性噪声的系统,与状态通道无噪声的系统共享同一最优控制增益。最后给出了最优控制的求解算法,即可以采用常规的GEVP优化算法,也可以采用离散矩阵序列的迭代收敛算法,数值仿真结果验证了算法的有效性。未来的研究工作将致力于解决输出反馈控制问题。

基金项目

2025年度嘉应学院科研项目(编号:325E0316)。

附 录

附录A:定理3.1的证明

系统(1)可等价表示为

x k+1 =( A+BF+ ω 0k BF+( 1+ ω 0k )BF ω k ) x k .

1) 2):对上述系统通过运用文献[3]第136~137中类似证明思路即可获得证明。

1) 3):由2)中LMI的对偶形式可知:系统(1)均方稳定,当且仅当存在 Q>0 ,满足如下LMI

( A+BF )Q ( A+BF ) T Q+ σ 0 2 BFQ F T B T +( 1+ σ 0 2 ) i=1 n σ i 2 B F ¯ i Q F ¯ i T B T <0

显然,上述不等式与(3)式等价。证明完毕。

附录B:定理3.2的证明

首先尝试求解 ρ( G ^ Σ ) 。由于 G ^ Σ 是非负矩阵,根据Perron定理[20]可知, ρ( G ^ Σ ) G ^ Σ 的最大模特征值。因为 G ^ Σ Σ G ^ 具有相同的特征值,因此问题转化为求解 Σ G ^ 的特征值。

方便起见,定义

F ¯ i ( zIABF ) 1 B 2 2 = M i i=1,,n F ( zIABF ) 1 B 2 2 = M 0

那么

Σ G ^ =[ σ 1 2 M 1 σ 1 2 M 1 σ 1 2 M 1 σ n 2 M n σ n 2 M n σ n 2 M n σ 0 2 ( 1+ M 0 ) σ 0 2 ( 1+ M 0 ) σ 0 2 M 0 ]

且特征多项式为

det( λ I n+1 Σ G ^ )=| λ σ 1 2 M 1 σ 1 2 M 1 σ 1 2 M 1 σ n 2 M n λ σ n 2 M n σ n 2 M n σ 0 2 ( 1+ M 0 ) σ 0 2 ( 1+ M 0 ) λ σ 0 2 M 0 |

对于上述行列式,首先进行如下初等列变换:让第一列减去第二列,然后让第二列减去第三列,⋯⋯,重复上述过程,得到

| λ 0 0 σ 1 2 M 1 λ λ 0 σ 2 2 M 2 0 0 λ σ n 2 M n 0 0 λ σ 0 2 λ σ 0 2 M 0 | (30)

接下来,采用与之前类似的方法,对行列式(30)进行如下初等行变换:让第二行加上第一行,第三行加上第二行,⋯⋯,依此类推,最终得到

| λ 0 0 σ 1 2 M 1 0 λ 0 i=1 2 σ i 2 M i 0 0 λ i=1 n σ i 2 M i 0 0 σ 0 2 λ i=0 n σ i 2 M i | (31)

因此

det( λIΣ G ^ )= λ n1 ( λ 2 λ i=0 n σ i 2 M i σ 0 2 i=1 n σ i 2 M i ) (32)

由(32)式可知,矩阵 Σ G ^ n1 个零特征值,其余两个特征值满足如下方程

λ 2 λ i=0 n σ i 2 M i σ 0 2 i=1 n σ i 2 M i =0 (33)

对(33)式应用求根公式,即可得到 G ^ Σ 的最大模特征值,即

ρ( G ^ Σ )= i=0 n σ i 2 M i + ( i=0 n σ i 2 M i ) 2 +4 σ 0 2 i=1 n σ i 2 M i 2

最后,通过等价变形可得

ρ( G ^ Σ )<1 σ 0 2 M 0 +( 1+ σ 0 2 ) i=1 n σ i 2 M i <1

由引理2.1可知,这意味着系统(1)是均方稳定的,当且仅当不等式(4)成立。证明完毕。

附录C:定理3.3的证明

首先构造拉格朗日函数

L( P 0 ,P,F, Λ 1 , Λ 2 )= 1+ B T P 0 B 1 σ 2 B T PB +Tr[ ( ( A+BF ) T P 0 ( A+BF ) P 0 + F T F ) Λ 1 ] +Tr[ ( ( A+BF ) T P( A+BF )P+diag( F T F ) ) Λ 2 ] (34)

其中 Λ i = Λ i T ,i=1,2 是拉格朗日乘子。接下来,通过求偏导可得

L P 0 = 1 1 σ 2 B T PB B B T +( A+BF ) Λ 1 ( A+BF ) T Λ 1 =0 (35)

L P = σ 2 ( 1+ B T P 0 B ) ( 1 σ 2 B T PB ) 2 B B T +( A+BF ) Λ 2 ( A+BF ) T Λ 2 =0 (36)

L F = B T P 0 A Λ 1 +( 1+ B T P 0 B )F Λ 1 + B T PA Λ 2 + B T PBF Λ 2 +Fdiag( Λ 2 )=0 (37)

和方程(6),(11)。在计算 L F 的偏导数时,用到了如下关系:

diag( F T F )= i=1 n E i F T F E i

其中 E i ,i=1,,n 表示仅第 i 个对角元为1,其余皆为零的对角矩阵。由方程(35)和(36)可得

Λ 2 = σ 2 ( 1+ B T P 0 B ) 1 σ 2 B T PB Λ 1

将上式代入(37)并令 Λ=( 1 σ 2 B T PB ) Λ 1 ,通过一些代数运算,最终得到满足方程(17)、(18)和(19)的最优控制器增益 F opt 。证明完毕。

附录D:定理3.5的证明

基于定理3.3,首先定义 P ¯ 0 = 1 σ 2 B T PB 1+ B T P 0 B P 0 P ¯ = σ 2 P 。由(16)式可得

F opt ( I n + σ 2 diag( Λ ) Λ 1 )=( B T P ¯ 0 A+ B T P ¯ A )

在上述方程两端同时右乘 Λ F T

F opt Λ F opt T + σ 2 F opt diag( Λ ) F opt T = B T ( P ¯ 0 + P ¯ )AΛ F T

运用 H 2 范数的计算方法[19]可知

F opt Λ F opt T = B T P 0 B F opt diag( Λ ) F opt T = B T PB

接下来有

B T P 0 B+ B T P ¯ B= B T ( P ¯ 0 + P ¯ )AΛ F T (38)

此外方程(17)可转化为

AΛ A T Λ+AΛ F opt T B T +B F opt Λ A T +B B T ( 1+ B T P 0 B )=0 (39)

在方程(39)两端分别左乘 B T ( P ¯ 0 + P ¯ ) 、右乘其转置,然后把(38)式代入可得

B T ( P ¯ 0 + P ¯ )( AΛ A T ΛB B T ( 1+ B T P 0 B ) )( P ¯ 0 + P ¯ )B=0

由于 A 是对角矩阵,因此有

AΛ A T Λ=B B T ( 1+ B T P 0 B )

然后在(39)式两端再次左乘 B T ( P ¯ 0 + P ¯ ) 并将(41)式代入,得到

F opt =( 1+ B T P 0 B ) B T A T Λ 1

这意味着 F opt σ 2 不相关。特别地,令 σ 2 =0 ,可得

F opt = ( 1+ B T P 0 B ) 1 B T P 0 A

最后,利用定理3.3以及(15)和(21)式既可得到(27)式。证明完毕。

参考文献

[1] Willems, J. and Blankenship, G. (1971) Frequency Domain Stability Criteria for Stochastic Systems. IEEE Transactions on Automatic Control, 16, 292-299. [Google Scholar] [CrossRef
[2] Willems, J.L. and Willems, J.C. (1976) Feedback Stabilizability for Stochastic Systems with State and Control Dependent Noise. Automatica, 12, 277-283. [Google Scholar] [CrossRef
[3] Boyd, S., El Ghaoui, L., Feron, E. and Balakrishnan, V. (1994) Linear Matrix Inequalities in System and Control Theory. Society for Industrial and Applied Mathematics. [Google Scholar] [CrossRef
[4] Jianbo Lu, and Skelton, R.E. (2002) Mean-Square Small Gain Theorem for Stochastic Control: Discrete-Time Case. IEEE Transactions on Automatic Control, 47, 490-494. [Google Scholar] [CrossRef
[5] Zhang, W., Zhang, H. and Chen, B. (2008) Generalized Lyapunov Equation Approach to State-Dependent Stochastic Stabilization/Detectability Criterion. IEEE Transactions on Automatic Control, 53, 1630-1642. [Google Scholar] [CrossRef
[6] Zhang, H., Li, L., Xu, J. and Fu, M. (2015) Linear Quadratic Regulation and Stabilization of Discrete-Time Systems with Delay and Multiplicative Noise. IEEE Transactions on Automatic Control, 60, 2599-2613. [Google Scholar] [CrossRef
[7] Liu, G.M., Su, W.Z. and Chen, J. (2012) Optimal Control of Linear Discrete-Time Systems with Multiplicative Noises. Proceeding of the 31th Chinese Control Conference, Nanchang, 3-5 June 2019, 5948-5953.
[8] Qi, T., Chen, J., Su, W. and Fu, M. (2017) Control under Stochastic Multiplicative Uncertainties: Part I, Fundamental Conditions of Stabilizability. IEEE Transactions on Automatic Control, 62, 1269-1284. [Google Scholar] [CrossRef
[9] Elia, N. (2005) Remote Stabilization over Fading Channels. Systems & Control Letters, 54, 237-249. [Google Scholar] [CrossRef
[10] Sinopoli, B., Schenato, L., Franceschetti, M., Poolla, K., Jordan, M.I. and Sastry, S.S. (2004) Kalman Filtering with Intermittent Observations. IEEE Transactions on Automatic Control, 49, 1453-1464. [Google Scholar] [CrossRef
[11] Schenato, L., Sinopoli, B., Franceschetti, M., Poolla, K. and Sastry, S.S. (2007) Foundations of Control and Estimation over Lossy Networks. Proceedings of the IEEE, 95, 163-187. [Google Scholar] [CrossRef
[12] Xiao, N., Xie, L. and Qiu, L. (2012) Feedback Stabilization of Discrete-Time Networked Systems over Fading Channels. IEEE Transactions on Automatic Control, 57, 2176-2189. [Google Scholar] [CrossRef
[13] Keyou You, and Lihua Xie, (2010) Minimum Data Rate for Mean Square Stabilization of Discrete LTI Systems over Lossy Channels. IEEE Transactions on Automatic Control, 55, 2373-2378. [Google Scholar] [CrossRef
[14] Zhang, H.S., Song, X.M. and Shi, L. (2012) Convergence and Mean Square Stability of Suboptimal Estimator for Systems with Measurement Packet Dropping. IEEE Transactions on Automatic Control, 57, 1248-1253. [Google Scholar] [CrossRef
[15] Gupta, V., Hassibi, B. and Murray, R.M. (2007) Optimal LQG Control across Packet-Dropping Links. Systems & Control Letters, 56, 439-446. [Google Scholar] [CrossRef
[16] Braslavsky, J.H., Middleton, R.H. and Freudenberg, J.S. (2007) Feedback Stabilization over Signal-to-Noise Ratio Constrained Channels. IEEE Transactions on Automatic Control, 52, 1391-1403. [Google Scholar] [CrossRef
[17] Rojas, A.J. (2009) Signal-to-Noise Ratio Fundamental Limitations in Continuous-Time Linear Output Feedback Control. IEEE Transactions on Automatic Control, 54, 1902-1907. [Google Scholar] [CrossRef
[18] Gu, G. (2016) An Equalization Approach to Feedback Stabilization over Fading Channels. IEEE Transactions on Automatic Control, 61, 1869-1881. [Google Scholar] [CrossRef
[19] Zhou, K., Doyle, J. and Glover, K. (1996) Robust and Optimal Control. Prentice Hall.
[20] Horn, R.A. and Johnson, C.R. (1985) Matrix Analysis. Cambridge University Press. [Google Scholar] [CrossRef