1. 引言
迭代学习控制(Iterative Learning Control,简称ILC)是一种模仿人类通过学习经验获取知识的智能技术,适用于具有重复运动特性的被控系统[1] [2]。其基本机理是利用系统当前次运行的输出与期望轨线的误差,修正当前次控制输入,从而得到系统下次运行的控制输入,目的是使控制系统的跟踪性能不断得以改善。ILC特别适合高精度、强重复性的工程场景,尤其是在传统控制方法难以应对非线性、周期性扰动的系统中表现突出。ILC研究成果突飞猛进,并广泛应用于光盘驱动系统、自动驾驶汽车、数控机床加工、半导体制造、航空航天、3D打印等领域[3]-[12]。
另一方面,在现实世界中,实际系统大多数是分数阶的,与整数阶相比,分数阶模型能够更好地揭示带有分数阶特性的对象的本质及其行为,获得更优良的控制性能[13]。近年来,分数阶迭代学习控制理论的研究受到国内外学者的青睐[14]-[18]。文献[19]提出了Dα型分数阶迭代学习控制算法,在频域内讨论了算法的收敛性,并将迭代学习控制的应用范围推广到分数阶系统,即分数阶迭代学习控制。文献[20]在时域中讨论了分数阶线性系统迭代过程的收敛性,分析了卷积形式的时变系统的分数阶迭代学习控制,提出了广义分数阶时变系统。之后,文献[21]给出了一类受类齿隙迟滞影响的参数化分数阶系统的自适应迭代学习控制算法,并讨论了其收敛性和稳定性。文献[22]研究了具有非置换常系数矩阵的分数阶脉冲时滞系统的迭代学习控制算法。文章[22]探讨了在一个领导者和固定拓扑约束下,具有重复运动的多智能体机器人系统的一致性控制。
然而,具有初态偏移的分数阶系统的迭代学习控制研究甚少,在现有文献中,大部分都假设所研究的系统在每一次迭代过程中初值与期望的初值相同。例如,文献[23]针对线性分数阶奇异系统提出了P型算法,针对时滞系统给出了PDα型算法,但这些算法都没有考虑初态偏移对系统造成的影响。另外,文献[24]在研究基于频率分析的时滞分数阶线性系统迭代学习控制问题时,也将每次迭代初值假设为期望初值设计算法。而在实际的应用中,很难保持每一次迭代初值与期望初值相同。目前,只有少量文献对分数阶系统的初值问题进行了初步研究。而且主要是研究P型或PDα型算法,文献[25]针对一类具有任意初始状态的分数阶线性连续系统,提出了一种具有初始状态学习的开环和开闭环PDα型分数阶迭代学习控制算法。在Lebesgue-p范数的意义下,利用卷积积分的广义Young不等式在迭代域中给出了PDα型算法收敛的充分条件。文献[26]针对分数阶线性时不变系统的随机初值问题,提出了基于初值学习的PDα型分数阶迭代学习控制算法,利用
范数对控制算法的收敛条件进行了严格证明。
但是PDα型控制器可能会有稳态误差,而PIDα型控制器在响应快、稳定性好的同时能够消除稳态误差,功能更加全面,适合高精度控制,相比于PDα型算法,PIDα型迭代学习控制算法在实际应用中更适合重复操作场景。引入初值学习后,在完成高精度任务和含不确定性的重复任务时有更显著的优势。因此,本文针对具有初态偏移的线性分数阶重复系统,提出了一种基于初值学习的PI1−αDα型分数阶迭代学习控制算法,理论证明了系统跟踪误差单调收敛到零。数值仿真验证了该算法的有效性。
2. 预备知识
定义1 对于连续向量函数
,
,
范数为
,
。
引理1 [27] 初值问题
的解为
其中,
,
,
。
定义2 函数
在
上的
阶分数阶微分的定义为
其中,
,
,
为正整数。
为Gamma函数,
。
定义3 对于任意可积函数
,当
时,左侧分数阶积分和右侧分别定义为
, 
, 
定义4 双参数的Mittag-Leffler函数定义为
,
,
,
,其在分数阶积分中的作用非常重要。
特别地,当
时,单参数Mittag-Leffler函数定义为
, 
, 
引理2 如果函数
、
在区间
上连续,且
和
存在,则
引理3 [28] 设
,
,其中
,
,
,则函数
具有以下性质:
(i) 
,
;
(ii) 
,
,
。
引理4 设
,
,其中
,
,
,则
,
,
,所以
,
,其中,
, 
,
。
3. 问题描述及分析
考虑一类分数阶线性时不变系统
	
(1)
其中
、
、
、
和
分别为系统第
次重复操作的状态向量、控制输入向量和输出向量,
和
都为常数矩阵。
下面给出分数阶系统的一些基本假设。
假设1 分数阶线性时不变系统的期望输出
在
上
阶微分存在,对于给定的
,有唯一期望控制输入
和理想状态
满足
	
	(2)
假设2 
为行满秩矩阵。
在现有文献中,大部分都假设所研究的分数阶系统在每一次迭代过程中初态相同,即初态可重置。然而在实际工程应用中,初态偏移是一个常见的问题。
针对系统的控制输入和系统初值,本文设计如下具有初值学习的一阶PI1−αDα型分数阶迭代学习控制算法:
	
	(3)
其中
为第
次迭代学习时对应的跟踪误差,
、
、
为学习增益矩阵,
表示初值。
4. 收敛性分析
定理1 当初值学习的PI1−αDα型迭代学习控制算法(3)作用于分数阶线性时不变系统(1)时,若满足条件:
,则当
时,系统输出
一致收敛于期望输出
,即
。
证明 根据引理1,由系统(1),有
	
	(4)
由式(3)可得
	
	(5)
根据引理2和引理3,得
	
(6)
另外,公式(5)中
	
	(7)
将(6)和(7)两个式子代入式(5),我们可以得到
	
	(8)
将
代入式(8)可得
	
	(9)
将式(9)两边同时取范数,得到
根据定理1中假设
,
。
对式(8)两边同时取范数,整理可得
	
	(10)
其中
,根据引理4,上式中
,
。
将式(8)两端同乘以
,并计算上确界,整理可得
	
	(11)
其中,
。
根据定理1中条件可知,存在一个足够大的
,使得
。故
。证明完毕。
5. 数值仿真
考虑如下分数阶线性时不变系统:
其中,系统的运行区间为
。
给定期望输出为
为了验证控制算法对初值学习的敏感性,首次迭代时的初值
是利用rand函数在区间
上随机选择的,不等于期望初值
。
在初值学习的开环PI1−αDα型控制算法中,
的参数分别设置为0.9、1.8、0.8,
,通过计算可得
,满足定理1中收敛性条件。
Figure 1. The iterative outputs of the PI1−αDα-type control algorithm at the 7th and 16th iterations
图1. PI1−αDα型控制算法在第7、16次的迭代输出
Figure 2. The iterative outputs of the PI1−αDα-type control algorithm with initial value learning at the 7th and 16th iterations
图2. 初值学习的PI1−αDα型控制算法在第7、16次的迭代输出
当传统的PI1−αDα型控制算法被应用于分数阶线性时不变系统时,给定的期望输出
以及第5、10、60次迭代学习时的实际输出如图1所示,系统的跟踪误差变化曲线趋势如图2所示。可以看出,针对具有任意初始状态的系统,在传统的PI1−αDα型控制算法作用下,系统输出与期望输出之间存在偏差;随着迭代次数的增加,在Lebesgue-2范数的意义下,系统在整个区间
上的跟踪误差都收敛有界。
将提出的PI1−αDα型控制算法(3)应用于具有任意初值的系统时,系统第5、10、60次输出如图3所示,跟踪误差曲线如图4所示。显然,系统的输出可以完全跟踪期望输出,在Lebesgue-2范数的意义下,跟踪误差随着迭代次数的增加收敛到零。以上结果表明,对于具有系统任意初值的系统,所提出的算法是可行和有效的。
Figure 3. The tracking error variation trend of the PI1−αDα-type control algorithm
图3. PI1−αDα型控制算法的跟踪误差变化趋势
Figure 4. The tracking error variation trend of the PI1−αDα-type control algorithm with initial value learning
图4. 初值学习的PI1−αDα型控制算法的跟踪误差变化趋势
由仿真效果可知,较之传统的PI1−αDα型控制算法,论文基于初值学习的PI1−αDα控制算法改进效果十分明显,消除了随机初值对系统的不良影响,跟踪效果更好。