您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 极小值原理及其应用(17).
第四章极小值原理及其应用4.1经典变分法的局限性4.2连续系统的极小值原理4.3最短时间控制问题4.4最少燃料控制问题4.5离散系统的极小值原理4.6小结4.1经典变分法的局限性上面我们用经典变分法解最优控制问题时,得出了最优性的必要条件0UH在得出这个条件时,作了下面的假定:是任意的,即不受限制,它遍及整个向量空间,是一个开集;是存在的。U1UH2在实际工程问题中,控制作用常常是有界的。如飞机舵面的偏角有限制,火箭的推力有限制,生产过程中的生产能力有限制等等。一般,我们可用下面的不等式来表示mi,,2,1iiMtu)(这时属于一个有界的闭集,写成,为闭集。更一般的情况可用下面的不等式约束来表示。TmtutututU)(,),(),()(21()Ut0),(ttUg当属于有界闭集,在边界上取值时,就不是任意的了,因为无法向边界外取值,这时就不一定是最优解的必要条件。考察由图4-1所表示的几种情况,图中横轴上每一点都表示一个标量控制函数,其容许取值范围为。)(tU)(tUU0UHuu*uH0u)(a)(b)(cH*uu*uuH图4-1有界闭集内函数的几种形状对于图4-1(a)仍对应最优解。对于图4-1(b)所对应的解不是最优解,最优解在边界上。对于图4-1(c)常数,由这个方程解不出最优控制来(这种情况称为奇异情况),最优解在边界上。另外,也不一定是存在的。例如状态方程的右端对U的一阶偏导数可能不连续,或由于有些指标函数,如燃料最优控制问题中,具有下面的形式0/uHu0/uH0uuUH/uuUH/),,(tUXfffttttdtUdttUXFJ00),,(这时对U的一阶偏导数不连续。),,(),,(),,,(tUXftUXFtUXHT经典变分法无法处理上面的情况,必须另辟新的途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。1956年前苏联学者庞特里雅金提出这个原理时,把它称为极大值原理,目前较多地采用极小值原理这个名字。庞特里雅金极小值原理写为如下形式:定理(极小值原理):系统状态方程),,(tUXfXnRtX)((4-1)初始条件00)(XtX(4-2)4.2连续系统的极小值原理控制向量,并受下面的约束mRtU)(U终端约束(),0ffGXttfttffdttUXFttXJ0),,(),((4-3)(4-4)(4-5)指标函数要求选择最优控制,使取极小值。取极小值的必要条件是、、和满足下面的一组方程)(tUJJ)(tX)(tU)(tft1正则方程XHHX(协态方程)(4-16)(状态方程)(4-17)2边界条件(4-18)00)(XtX(),0ffGXtt3横截条件(4-19))()()(fTfftXGtXt4最优终端时刻条件(4-20)fTfftGttH)(5在最优轨线和最优控制上哈密顿函数取极小值(4-21))(*tX)(*tU),,,(),,,(mintUXHtUXHU将上面的结果与用古典变分法所得的结果对比可见,只是将这个条件用(4-21)代替,其它无变化。0UH应该指出,当存在,且得出的绝对极小,如图4-1(a)所示时,即为条件(4-21)式。所以极小值原理可以解决变分法所能解决的问题,还能解决变分法不能解决的问题。如何应用条件(4-21)式,这是一个关键,我们将用具体例子来说明。UH0UHH0UH4.3最短时间控制问题节省时间意味着提高生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控制的研究,这方面的研究结果很多,这里先就简单的重积分系统的最短时间控制展开讨论。例4-1重积分系统的最短时间控制状态方程(4-22)uxxx221初始条件为1001)(xtx2002)(xtx(4-23)终端条件为0)(2ftx0)(1ftx(4-24)控制约束为(4-25)1)(tufttt0求出使性能指标(4-26)取极小的最优控制。00ttdtJfttf解因为控制作用有限制(属于有界闭集),故要用极小值原理求解。取哈密顿函数协态方程为(4-28)(4-29))()()()(1221tuttxtfFHT011xH122xH(4-27)积分上面两个方程可得(4-30)(4-31)其中,、是积分常数。11)(cttcct122)(1c2c由表达式(4-27)可见,若要选择使取极小,只要使越负越好,而,故当,且与反号时,取极小,即最优控制为)(tuH)()(2tut1)(tu1)(tu)(tu)(2tH0)(10)(1)(sgn)(222ttttu当当)()()()(1221tuttxtfFHT(4-27)由此可见,最优解取边界值+1或-1,是开关函数的形式。什么时候发生开关转换,将取决于的符号。而由(4-31)式可见,是的线性函数,它有四种可能的形状(见图4-2))(tu)(2t)(2tttcct122)((4-31)tttt0,021cc0,021cc0,021cc0,021cc)(2t)(2t)(2t)(2t)(tu)(tu)(tu)(tu11111111图4-2与的四种形状)(tu)(2ttcct122)((4-31)由图4-2可见,当为的线性函数时最多改变一次符号。也相应有四种序列)(2tt)(tu)(tu1,1,1,1,1,1从上面两式消去t,即可得相轨迹方程(4-33)ctxtx)(21)(221当时,状态方程的解为(4-32)10202120221)()(xtxttxxttx1)(tu下面来求出取不同值时的状态轨迹(也称为相轨迹)。)(tuuxxx221当时,状态方程的解为(4-34)消去,可得相轨迹方程1u202)(xttx10202121)(xtxttxt')(21)(221ctxtx图4-3相轨迹图1x2xO1u1u在图4-3中用实线表示,不同的C值可给出一簇曲线。由(4-32)第一式知增大时增大,故相轨迹进行方向是自下而上,如图中曲线上箭头所示。t)(2txctxtx)(21)(221')(21)(221ctxtx220xttx()220xttx()-在图4-3中用虚线表示。因增大时,减少,故相轨迹进行方向是自上而下。t)(2tx两簇曲线中,每一簇中有一条曲线的半支进入原点。在的曲线簇中,通过原点的曲线方程为(4-36)这半支用表示。1u)(21)(221txtx0)(2tx在的曲线簇中,通过原点的曲线方程为(4-37)半支用表示。1u)(21)(221txtx0)(2tx和这两个半支通过原点的抛物线称为开关线,其方程为(4-38)_)()(21)(221txtxtx图4-4最优相轨迹与开关线MD1x2xRR当初始状态在开关线左侧,如图4-4中D点,从D点转移到原点,并在转移过程中只允许改变一次符号的唯一途径如图所示,即从D点沿的抛物线移到与相遇,在相遇点改变的符号为,再沿到达原点。因此,只要初始状态在开关线左侧,都沿的抛物线转移到,然后改变符号为,并沿到达原点。同样,当初始状态在开关线右侧,如图4-4中的M点,则先沿的抛物线转移到,然后改变符号为,并沿到达原点。),(2010xxu1u_u1u_1u_u1u_1uu1u在图4-4中开关曲线(由和组成)把-平面划成两个区域。开关线左侧(图中划阴影线部分)区域用表示,中的点满足则(4-39)1x2xRR22121xxx1u开关线右侧区域用表示,中的点满足则(4-40)RR22121xxx1u于是最优控制规律可表示为状态的函数,即(4-41)(4-42)根据上面的关系,可以通过非线性的状态反馈来构成。Txxx),(211),(21*xxuxxR当及1),(21*xxuRxx及当*u图4-5重积分系统时间最优控制的框图Z1u1x2x2221xx21sdtd11图4-5表示了重积分系统时间最优控制的工程实现。由图可见时,,即满足(4-39)式;时,,即满足(4-40)式。22121xxxZ0Z1u0Z1u图中的继电函数早期是用继电器实现的,由于继电器在动作时有砰砰声,故这种最优控制又称为“砰砰”控制。当然,现在可以用无接触的电子开关或微处理机来实现这种控制规律,既方便、可靠,又无砰砰声了。例4-2积分环节和惯性环节串联系统的最短时间控制其传递函数为(4-43))(1)()()(asssUsYsW其中为大于零的实数。由(4-43)式可得运动方程为(4-44)auyay令和为状态变量,并有1x2xyxyx21,uaxxxx2221(4-45)控制约束为,最优控制只能取。1)(tu1(1)对于情形,状态方程为其状态轨线相迹为(4-46)1u12221axxxxCaxaaxx22211ln1])([)()(CdxexQeydxxPdxxP(a)u=11x2xr21/xa01u图4-6系统的相轨迹1()ssa如图4-6(a)所示,箭头为状态运动方向。它有一条渐近线,如图中虚线所示。在这簇曲线中,只有到达平衡位置0。(4-47)ax/12r22211ln1:axaaxxr02x(2)对于的情形,状态方程为其状态轨线相迹为(4-48)1u12221axxxxCaxaaxx22211ln1(b)u=-11x2x1u21/xa0r图4-6系统的相轨迹1()ssa如图4-6(b)所示,箭头为状态运动方向。它有一条渐近线,如图中虚线所示。在这簇曲线中,只有到达平衡位置0。(4-49)ax/12r22211ln1:axaaxxr02x将和合并成一条曲线,其方程为(4-50)rr222211ln)sgn(1:xaxaaxxr令(4-51)222221ln)sgn(1)(xaxaaxxF)(),(2121xFxxx(4-52)22211ln1:axaaxxr22211ln1:axaaxxr02x02x于是曲线方程可写为(4-53)0)(),(:2121xFxxxrr图4-71()ssa系统的时间最优相轨迹和开关线BAba1xrrRR-曲线将相平面分成两部分,如图4-7所示。的上半平面包括记为,的下半平面包括记为,那么(4-54)rrrRrRrxxxxRrxxxxR}0),(|),{(}0),(|),{(21212121由于最优控制只取,它们的切换最多一次,根据状态初始位置不同,它们最优控制是不同的,如图中初始状态在A点时,它属于,所以开始。当运动到达时,与交于a点,马上切换为,以后沿运动直到平衡位置0,再除去控制量。当初始状态在B点时,它属于,最优控制应先取,到达交于b点时,马上切换为,以后沿继续运动,直到平衡位置0,切除控制量。1R1*urr1*ur*uR1*ur1*ur综上所述,最优控制的状态反馈规律为(4-55)11),(21*xxu及及RxxRxx),(),(2121最短时间最优控制的方框图如图4-8所示,图中虚线部分是最短时间最优控制器。1ssas12(,)xx
本文标题:极小值原理及其应用(17).
链接地址:https://www.777doc.com/doc-4719134 .html