1. 引言
线性二次型最优控制问题属于线性系统综合理论中简单而又应用广泛的一类优化型综合问题,是现代控制理论中的最重要的成果之一。优化型综合问题的特点是通过使全面表征系统性能好坏程度的性能指标函数取极大或极小值来确定系统的控制规律。如果系统是线性的,性能指标是状态变量和控制变量的二次型函数的积分,则这样的最优控制问题称为二次型最优控制问题。二次型性能指标具有明显物理意义,代表了大量工程实际问题中提出的性能指标要求。
线性二次型调节器(Linear Quadratic Regulator, LQR)的最优解可以用统一的解析式表示,且可得到一个简单的线性状态反馈控制律而构成闭环最优控制,这对最优控制在工程应用中的实现具有十分重要的意义。同时,线性二次型问题还可以兼顾系统性能指标如快速性、准确性、稳定性和灵敏度等多方面因素。线性二次型问题是最优控制问题中简单而且应用广泛的一类优化问题。线性二次型最优控制器的实现是先计算出使性能指标泛函取极小值的输入量
,而
的作用是通过状态的线性反馈来实现的,即通过确定状态的最优反馈系数来实现最优控制。在20世纪60年代之前,控制系统的设计风格为:手算,利用作图,反复试凑;而在20世纪60年代之后,控制系统的设计风格为:提出目标函数,采用优化方法,使用数字计算机,重视算法。LQR控制器的研究具有普遍意义,易于获得解析解,最为可贵的是能获得线性反馈的结构[1] [2] 。
LQR控制即线性二次型调节器,其对象是现代控制理论中以状态空间形式给出的线性系统,而目标函数为对象状态和控制输入的二次型函数。LQR最优设计是针对状态方程
,通过确定最佳控制量
的矩阵
,使得控制性能指标
达到极小,其中实对称矩阵
和
分别表示各个状态误差和输入能量消耗的相对重要性,
中对角矩阵的各个元素分别代表各项指标误差的相对重要性[3] 。
2. 线性二次型最优控制器的设计
2.1. 最优控制量
的求解过程
Kalman在研究状态方程、线性系统的能控性和能观性的基础上,对线性系统提出二次型目标函数,只有这样,才能获得最优的闭环控制器。线性二次型问题的最优解可以用统一的解析式表示,且可得到一个简单的线性状态反馈控制律而构成闭环最优控制,线性二次型调节器的目标函数中明确地提出消耗控制能量最少,这在经典反馈控制中是没有的。LQR算法是在一定的性能指标下,利用最少的控制能量,来达到最小的状态误差[4] 。
对于线性连续系统提出二次型目标函数,即
(1)
式(1)中,
为
维半正定对称常数的终端加权矩阵;
为
维半正定对称时变的状态加权矩阵;
为
维正定对称时变的控制加权矩阵;始端时间
及终端时间
固定。
当式(1)中的终时
为有限值时,式(1)被称为有限时间状态调节器问题。它突出了在有限时间内完成动态误差小、消耗的控制能量少、稳态误差小的折中要求。
通过黎卡提矩阵微分方程的解可求出最优控制
的表达式;
(2)
(3)
根据以上步骤,得出线性二次型最优控制器结构图如图1所示。
线性二次型最优控制器的特点如下所示:
1) 最优控制式
是线性状态反馈控制律,便于实现闭环最优控制;
2) 黎卡提方程是非线性矩阵微分方程,通常只能采用计算机逆时间方向求数值解。由于黎卡提方程与状态及控制变量无关,因而在定常系统情况下可以离线算出
;
3) 只要时间区间
是有限的,黎卡提矩阵微分方程的解
就是时变的,最优反馈系统将成为线性时变系统,即使对于线性定常系统,加权阵为常阵,求出的
也是时变的。
当终端时间
趋于无穷时,
将趋于某常数,即
可视为恒值,从而最优反馈时变系统随之转换成最优控制定常系统,这样就得到无限时间
状态调节器。无限时间线性定常系统状态调节器和有限时间线性连续系统的状态调节器的区别为:
a) 无限时间线性定常系统状态调节器的被控对象是线性定常系统;b) 无限时间调节器的性能指标中,终端权矩阵为0,即没有终端性能指标。由于
,终端指标已失去了实际意义,不必再予以考虑;c) 在无限时间调节器问题中要求被控系统必须完全能控,以保证最优系统的稳定性。这是由于在控制区间为无限时,如果出现系统状态不能控或不稳定,则不论采取什么控制,都将使性能指标趋于无穷大,也就无法比较各种控制效果的优劣了。但对有限时间调节器来说,由于控制时间
为有限时间,即使出现状态不能控情况,其对性能指标的影响也总是有限的,因而最优控制仍然可以存在。
2.2. 带有状态观测器的最优控制器
在线性系统完全可观的情况下,直接采用状态反馈控制器即可实现线性二次型最优控制,如果系统的状态不完全可观,那么可以通过状态观测器重构不可观的状态,并通过带有观测器的反馈结构实现最优控制[5] [6] 状态观测器的结构如图2所示,带有状态观测器的最优控制器的组成如图3所示。
3. 结语
线性二次型最优控制系统的性能指标是状态变量和控制变量的二次型函数,二次型最优控制系统可

Figure 1. Diagram of a linear quadratic optimal controller
图1. 线性二次型最优控制器结构图

Figure 2. Reconstruction of state 
图2. 状态
的重构示意图

Figure 3. An optimal controller with a state observer
图3. 带有观测器的最优控制器
以兼顾系统性能指标的多方面因素,线性二次型最优控制系统根据确定的性能指标函数,通过求解黎卡提非线性矩阵微分方程来得到最优控制解,即确定最优状态反馈系数来实现最优控制,如果实际系统中一些状态变量不易直接测量到,需要构造状态观测器估计出不可直接测量的状态变量以实现最优状态反馈即最优控制。
附录
1.最优解
的公式推导过程
有限时间线性连续系统状态调节器的最优控制规律为:




最优性能指标为:
式中,
为
维对称非负矩阵,满足黎卡提(Riccati)矩阵微分方程:

其边界条件
证明:
设
是一个时间函数矩阵,且
(1)
(2)
令式(1)等于式(2),有
(3)
式(3)中,
(4)
于是有

显然,若在积分区间内使
,那么性能指标
将为最小。
线性连续系统的状态方程为:
(5)
把式(5)代入式(4),可得:
(6)
把
的表达式代入式(6),可得:

由
的表达式和黎卡提矩阵微分方程可得,
的表达式使
的值为0,由此性能指标
的值最小,所以
即为最优控制解。
2. 黎卡提矩阵微分方程的由来推导
设线性时变系统的状态方程为:

试求最优控制
,使系统的二次型性能指标

取极小值。
由于控制矢量
不受约束,故可用极小值原理求解。
引入
维拉格朗日乘子矢量
,构成哈密尔顿函数

实现最优控制的条件为:
1) 正则方程组
状态方程

协态方程
(1)
2) 极值条件
(2)
初始条件
(3)
3) 横截条件
(4)
由极值条件,且
是正定矩阵,则有:
(5)
将式(5)代入状态方程,则有:
(6)
将式(6)与协态方程联立,写成统一的
维线性齐次微分方程式为:

其解为:
(7)
若终端状态
和终端状态
已知,将
和
代入式(7),则有:

即
(8)
由式(8)和横截条件,可得:

令
则有:
(9)
将式(9)代入式(5),则有:
(10)

将式
对时间
求一阶导数,并将状态方程和式(10)代入,可得:
(11)
将式
代入协态方程,可得:
(12)
由式(11)等于式(12),可得:
