您好,欢迎访问三七文档
-56-第三讲自适应控制3.1自适应控制自适应控制也是一种鲁棒控制方法,前面所讲的所有鲁棒控制(包括变结构控制),它们的基本思想是基于被控对象与内环控制的不匹配及不确定性的最坏情形的估计而展开设计的,它们的内环控制律是固定的,外环控制增益根据不确定性的估计来设定;而自适应控制的基本思想是根据一些在线算法改变控制律中的增益值或其他参数,控制器在操作过程中“学得”一套合适的参数。自适应控制尤其适合于机器人这种执行重复的作业任务的场合,通过不断的重复,自适应控制可以改善跟踪性能。根据设计技术不同,机器人自适应控制分为三类,即模型参考自适应控制(MRAC)、自校正自适应控制(STAC)和线性摄动自适应控制。其控制器结构图如图5-4所示。图5-4自适应控制器的基本结构3.2基于逆动力学的自适应控制本节主要讨论自适应控制在机器人控制问题上的应用。刚性机器人适于自适应控制的一个关键特征是参数线性。也就是说,虽然运动方程是非线性的,但如果把方程系数中连杆质量,惯性矩等参数分离出来却可以得到线性的关系,n个连杆的刚性机器人动力学方程可以写成upqqqYqgqqqCqqM),,()(),()((5-1)式中,),,(qqqY是n×r维矩阵;p是r维参数向量。机器人界的学者在20世纪80年代中期得到了这一结果,随之第一个全局收敛的自适应控制律也出现了,这些自适应控制律的结果都是基于逆动力学展开的。首先,系统动力学方程为upqqqYqgqqqCqqM),,()(),()((5-2)逆动力学控制律为ˆˆˆ()(,)()quMqaCqqqgq(5-3)其中10()()dddqaqKqqKqq(5-4)-57-dq是理想的轨迹,dqqe是位置跟踪误差。ˆˆˆˆ,,,MCgp分别为M,C,g,p的估计值。ˆˆˆˆ(,)()(,,)MqCqqqgqYqqqp(5-5)记ˆˆˆ(,)():(,)():CqqqgqhCqqqgqh在以前的分析中,hhMMˆ,ˆ之间的不匹配,导致不好的轨迹跟踪性能,于是调整控制输入qa来克服其影响。而自适应逆动力学则让控制律(5-3)的结构保持不变,更新hMˆˆ和项。(5-3)代入(5-2)得到heKeKqMhqMdˆ)(ˆ10(5-6)可以得到:pqqqYhqMekekeM~),,(~~)(ˆ01(5-7)这里ppphhhMMMˆ~,ˆ~,ˆ~假定Mˆ是可逆的,误差动力学可以写成:ppYMeKeKe~:~ˆ101(5-8)这里:YM1ˆ(5-9)我们可以象以前一样,通过调整增益参数矩阵10,KK使双积分系统稳定。(5-8)式写成状态空间的形式为:pBAxx~(5-10)其中eexBKKIA10010(5-11)我们需要得到一种更新参数向量pˆ的算法并证明整个系统的稳定性。为了达到这个目的,选择一个正定对称矩阵Q,并解下面的Lyapunov方程:0QPAPAT(5-12)选择Lyapunov函数ppPxxVTT~~(5-13)其中P为(5-12)式的唯一正定解,为正定对称矩阵。沿着(5-13)式的解轨迹,对Lyapunov函数V进行微分:]~[~2pPxBpQxxVTTTT(5-14)-58-这就很容易看出,我们按下式选择参数更新律就可以使(5-14)式的第二项变为零:PxBpTT1~(5-15)由于向量p是常数,ppˆ~,于是我们用下式更新pˆPxBpTT1ˆ(5-16)这就有:0QxxVT(5-17)可以证明,整个系统在Lyapunov意义下是稳定的。方程(5-13)说明V是正的,方程(5-17)说明V是非增的,且以0为下界。因此)(~),(tptx均为有界的,并且)(tx还是所谓的平方可积函数,即2L函数。在一些附加的连续性条件下,2L函数当t时总是收敛于0。这就是说,跟踪误差收敛于0。但为了严格证明跟踪误差的确变为零,必须考虑一些其它因素,这在自适应控制文献中占了很大的份额。我们必须保证(5-9)式中的是有界的。第一.由于中包含1ˆM,我们必须保证1ˆM不会变成奇异的。一种方法就是限定估计参数总是落在真实参数的一个邻域内,这再次需要对不确定性要有一个最坏的估计。如果估计参数偏离了真实参数的邻域,估计算法能够重置估计参数pˆ为真实参数邻域的某个边界。第二,由于依赖于操作机的加速度q(包含在(5-9)式的Y项),为了实现参数更新控制律,需要测量或计算估计加速度。近来提出的自适应逆动力学的实现方法中不需要测量关节的加速度,而可以用一阶滤波器来实现利用速度估计加速度:dtdsqssqr,1(5-18)如果时间常数τ很小,则qqsqr(5-19)3.3基于保守性的运动控制方法(Slotine和Li方法)该方法不同于逆动力学自适应控制方法,即使有准确的参数值,控制律也不对机器人的运动方程进行线性化。然而,它克服了逆动力学自适应控制的主要障碍,即它不需要测量或估计操作机的加速度,也不需要估计惯量矩阵的逆。该方法主要采用的手段是利用了机器人动力学保守特性和反对称性。3.3.1基于保守性的运动控制方法的一般概念。给定操作机的动力学方程为()(,)()MqqCqqqgqu(5-20)设控制律为:()(,)()DuMqaCqqvgqKr(5-21)其中:()dddvqqqqq-59-davqq(5-22)rqvqq这里,DK,Λ是对角的正定矩阵。把(5-21)、(5-22)式代入(5-20)式可得0),()(rKrqqCrqMD(5-23)注意到非线性控制律(5-21)和逆动力学控制律是有明显区别的,它在内闭环(5-23)中不能产生一个线性系统,因而它的稳定性分析更困难。为了证明(5-23)的稳定性,考虑Lyapunov函数:1()2TTDVrMqrqKq(5-24)微分(5-24)式并将(5-23)式解出的rqM)(带入1()()22TTTDVrMqrrMqrqKq12(2)2TTTDDrKrqKqrMCr(5-25)应用CM2是反对称矩阵这一事实,及r的定义有:TTTDDTVqKqqKqeQe(5-26)其中00TDDKQK(5-27)这样在误差空间的平衡点0e处是全局渐近稳定的。事实上,如果惯性矩阵()Mq的模有常值的界(这是有可能的,如各关节都是转动关节的情形),直接就可证明该控制律的跟踪误差是全局指数稳定的。在我们前述的逆动力学控制时很容易得出了相同的结论。基于保守性的控制方法与逆动力学控制相比较究竟有多大的优越性,现在仅从稳定性分析上看还不十分清楚,我们将在下两节看到基于保守性的控制方法的优点体现在它的鲁棒控制和自适应控制上。在鲁棒控制方案中,不确定界1ˆ1EMMI的假设不需要了,这就大大简化了不确定界的计算;在自适应控制方案中,它既不需要测量或估计操作机的加速度,也不需要惯量矩阵估计值ˆM是有界的。因此基于保守性的控制方法与逆动力学控制相比,在它的鲁棒控制和自适应控制上具有明显的优势。3.3.2基于保守性的鲁棒控制方法本节我们将基于机器人动力学方程与动力学参数的线性特征和反对称性,应用上述的基于保守性的运动控制方法,导出一种新的鲁棒控制方法,在设计中简化了不确定界的计算。-60-我们将控制律修正为:ˆˆˆˆ()(,)()(,,,DDuMqaCqqvgqKrYqqvaKr)-(5-28)将控制律(5-28)式带入系统动力学方程(5-20)式,有:ˆˆˆDMqCqgMaCvgKr(5-29)由于,qrvraqrv,我们(5-29)式重写为:ˆ(,,,)()DMrCrKrMaCvgYqqva(5-30)我们可以这样选择ˆ,0ˆ(5-31)其中0是动力学参数的名义值(可能做到的最佳估计值),它是个定值的向量。是一个附加的控制项。这样系统(5-30)将变成:(,,,)()DMrCrKrYqqva(5-32)其中0是一个常值向量,表示系统参数的不确定性。如果这种不确定性可以由一个非负的常数来界定,即:0(5-33)那么附加的控制项可以这样选择:TTTTTYrYrYrYrYr;如果;如果(5-34)考虑Lyapunov函数:1()2TTDVrMqrqKq微分V函数,可得到:()TTVeQerY(5-35)控制律(5-34)作用下,系统闭环跟踪误差的最终一致有界性证明可参见逆动力学控制中的定理3。详细证明留作练习。在这里,对常矢量(不随时间变化)的界的确定,要比在逆动力学控制中对时变量的界的确定要容易的多。这里的界仅依赖于机器人的惯性参数,而逆动力学控制中的(,)xt依赖于机器人的状态矢量、参考轨迹及对惯性矩阵ˆ()Mq的估计。-61-3.3.3基于保守性的自适应控制方法在自适应方法中,控制律方程(5-28)中的ˆ,被看做是对真实参数矢量的随时间变化的估计,将控制律(5-28)带入到机器人的动力学方程(5-20)中:ˆˆˆDMqCqgMaCvgKr(5-36)由于vrqvrq,,我们将(5-36)式重写为:(,,,)DMrCrKrMaCvgYqqva(5-37)其中:ˆˆˆˆ,,,MMMCCCggg注意(5-37)式中的Y并不依赖于机械手的加速度,而仅与机械手的给定参考轨迹的加速度及机械手的速度跟踪误差有关。参数ˆ的估计方法采用自适应控制中的标准方法,如:梯度法、最小二乘法等,这里采用梯度更新律:1ˆ(,,,)TYqqvar(5-38)接下来,我们选择Lyapunov函数:11()22TTTDVrMqrqKq(5-39)可以证明跟踪误差全局收敛到零,并且参数估计有界。在给出证明之前,我们首先应认识到自适应控制律与鲁棒控制律的重要不同点。在鲁棒控制律中,系统的状态为q和q;在自适应控制律中,满足微分方程(5-38)的事实(由于向量是常数,ˆ),意味着全状态矢量应包括,状态方程应由方程(5-37)、(5-38)耦合给出。基于上述原因,我们在Lyapunov函数((5-39)式)的选择上,增加了正定项12T。上述的注解对基于逆动力学的自适应控制律的设计同样适用。现在沿着系统(5-37)的解轨迹对Lyapunov函数微分,将有:ˆ()TTTTTDDVqKqqKqYr(5-40)这就很容易看出,我们将(5-38)式带入(5-40)式,将有:0TTTTDDVqKqqKqeQe(5-41)Q的定义与前面一样,表明闭环系统在Lyapunov意义下是稳定的。注意我们只得到了V是半负定的,而不是负定的。这是因为V没有包含的负定项。事实上这种情形在此类自适应控制律设计中经常遇到,也是自适应控制在应用中遇到挑战的基本原因,比如对外扰动缺乏鲁棒性、参数估计缺乏收敛性等。有关自适应控制存在的问题的详-62-细讨论已超出了本课程的范围。回到我们讨论的问题,尽管现在我们仅得到闭环系统(5-37)、(5-38)在Lyapunov意义下是稳定的,进一步的分析可以得到更强的结论。首先从方程(5-41)看,V是非增的,()Vt的值不会比它在0t的大,由于V由一些非负定项的和组成,这就意味着它的每一项,,rq作为时间的函数是有界的。关于跟踪误差,qq,我们也可注意到V是误差矢量()et的二次型函数,积分(5-41)式,有:0()(0)()()tTVtVeQed(5
本文标题:第三讲-自适应控制
链接地址:https://www.777doc.com/doc-6510688 .html