您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 最优控制ppt第四章
4.1经典变分法的局限性上面我们用经典变分法解最优控制问题时,得出了最优性的必要条件0UH在得出这个条件时,作了下面的假定:是任意的,即不受限制,它遍及整个向量空间,是一个开集;是存在的。U1UH2在实际工程问题中,控制作用常常是有界的。如飞机舵面的偏角有限制,火箭的推力有限制,生产过程中的生产能力有限制等等。一般,我们可用下面的不等式来表示mi,,2,1iiMtu)(这时属于一个有界的闭集,写成,为闭集。更一般的情况可用下面的不等式约束来表示。TmtutututU)(,),(),()(21()Ut0),(ttUg当属于有界闭集,在边界上取值时,就不是任意的了,因为无法向边界外取值,这时就不一定是最优解的必要条件。考察由图4-1所表示的几种情况,图中横轴上每一点都表示一个标量控制函数,其容许取值范围为。)(tU)(tUU0UHuu*uH0u)(a)(b)(cH*uu*uuH图4-1有界闭集内函数的几种形状对于图4-1(a)仍对应最优解。对于图4-1(b)所对应的解不是最优解,最优解在边界上。对于图4-1(c)常数,由这个方程解不出最优控制来(这种情况称为奇异情况),最优解在边界上。另外,也不一定是存在的。例如状态方程的右端对U的一阶偏导数可能不连续,或由于有些指标函数,如燃料最优控制问题中,具有下面的形式0/uHu0/uH0uuUH/uuUH/),,(tUXfffttttdtUdttUXFJ00),,(这时对U的一阶偏导数不连续。),,(),,(),,,(tUXftUXFtUXHT经典变分法无法处理上面的情况,必须另辟新的途径。极小值原理就是解决这类问题的有力工具。用极小值原理求解控制无约束的最优控制问题和古典变分法是完全一样的。1956年前苏联学者庞特里雅金提出这个原理时,把它称为极大值原理,目前较多地采用极小值原理这个名字。下面给出这个原理及其证明,并举例说明其应用。4.2连续系统的极小值原理由于可以利用扩充变量的方法将各类最优控制问题化为定常系统,末值型性能指标情况下的标准形式。我们这里只就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。ft设系统的状态方程为),,(tUXfXnRtX)((4-1)初始条件为00)(XtX(4-2)mRtU)(U控制向量,并受下面的约束(4-3)末值状态必须满足的约束条件为0),(ffttXG(4-4)(4-5)其中(),(),TffffJXttGXttnR性能指标函数为为待定列向量。在本节中,假设函数,,,存在且连续,并假定容许控制是在控制域内取值的任何分段连续函数。这时如果选定了某一容许控制,则容易证明在任意的初始条件下,方程(4-1)唯一的确定了系统状态的变化规律,且是连续的和分段可微的。在这些条件下,我们就定常系统、末值型性能指标、固定、末端受约束情况下给出极小值原理的简单证明。(,,)ifXUtifX(),ffXtt()fXt()Ut()Ut00)(XtX()Xt()Xtft证明:采用扰动法,即给最优控制一个变分,它将引起最优轨线的变分,并使性能指标有一增量,当为极小时,必有,由此即可导出最优控制所应满足的必要条件。在变分法中,是微量,即将最优控制和邻近的容许控制相比较,因而最多只能建立哈密顿函数的相对极小值性质。UXJJ0JUH庞特里亚金极大值原理却将最优控制与控制域内所有可能的值进行比较,因而得出结论,在整个控制域内最优控制使哈密顿函数成为绝对极小值。正是这个性质使得庞特里亚金极大值原理成为寻找最优控制的有力工具。但是这样,的改变量必须看成有限量,而不再是微量。如果让改变的时间很短,则由此引起的最优轨线的改变仍是微量,性能指标的增量也是微量,因而对各关系式的数学处理仍是比较容易的。H()UtUXJ设为最优控制,任选一时刻及一微量,在时间间隔中给一有限大小的改变量,且使得。现在研究由引起的最优轨线的变化。分为三段考虑:()Ut10[,]fttt011[,]tt()UtUUUU()Xt110tt在这一段中,,因而。0U()0Xt211ttt系统的状态方程(4-1)可在初始条件下直接积分。11()()XtXt当时,当时,11()()(,,)ttXtXtfXUtdt11()()(,,)ttXtXtfXUUtdtUUUUU两式相减可得这一段的(4-6)可以对的大小作估计()Xt1()[(,,)(,,)]ttXtfXUUtfXUtdt()Xt111()max(,,)(,,)()tttXtfXUUtfXUttt由于是微量,所以也是微量,因而在精确到一阶微量的情况下,下式成立(4-7)()Xt(,)(,)|XXffXUUfXUUXX将式(4-7)代入(4-6),并注意到微量在微小时间间隔上的积分是高阶微量,即得X1()[(,,)(,,)]ttXtfXUUtfXUtdt在第二段时间间隔得终点,则有或(4-8)其中表示二阶以上的微量。1tt111()[(,,)(,,)]ttXtfXUUtfXUtdt11()[(,,)(,,)]|()ttXtfXUUtfXUto()o31fttt这时又有,系统的状态方程为而状态变量的变分满足方程(4-9)UU(,,)XfXUt()Xt*|UUfXXX引入变量及哈密顿函数(4-10)(4-11)(4-12)()tH(,,,)(,,)THXUtfXUt|()|TUUUUHfXX()()()TfffGtXtXt显然,方程(4-9)和(4-11)为共轭方程,立即求得积分或(4-13)()()TtXtconst11()()()()TTfftXttXt即最终求得了由于的有限改变而引起的最优轨线的变化,特别是末值状态的变化。U()Xt()fXt下面研究由引起的最优性能指标的改变量。由于故有(4-14)UJ(),(),TffffJXttGXtt()()()0()()TTfffGJXtoXtXt综合(4-8)、(4-12)、(4-13)和(4-14)等式,可以建立与有限改变量之间的关系JU1[(,,)(,,)]|()0TTttJfXUUtfXUto已知中的任意时刻,并以表示,当时,上式变为,,10[,]ftttUUU0(,,)](,,)TTfXUtfXUtU0[,]fttt或用哈密顿函数的表达式(4-10)表示可得(4-15)或H(,,,)(,,,)UHXUtHXUt),,,(),,,(mintUXHtUXHU于是定常系统、末值型性能指标、固定、末端受约束情况下极小值原理得以证明。ft总结上述讨论,可将庞特里雅金极小值原理写为如下形式:定理(极小值原理):系统状态方程),,(tUXfXnRtX)((4-1)初始条件00)(XtX(4-2)控制向量,并受下面的约束(4-3)mRtU)(U终端约束(4-4)指标函数(4-5)0),(ffttXGfttffdttUXFttXJ0),,(),(要求选择最优控制,使取极小值。取极小值的必要条件是、、和满足下面的一组方程)(tUJJ)(tX)(tU)(tft1正则方程(协态方程)(4-16)(状态方程)(4-17)XHHX2边界条件(4-18)00)(XtX0),(ffttXG3横截条件(4-19))()()(fTfftXGtXt4最优终端时刻条件(4-20)fTfftGttH)(5在最优轨线和最优控制上哈密顿函数取极小值(4-21))(*tX)(*tU),,,(),,,(mintUXHtUXHU将上面的结果与用古典变分法所得的结果((3-34)~(3-38)式)对比可见,只是将这个条件用(4-21)代替,其它无变化。0UH应该指出,当存在,且得出的绝对极小,如图4-1(a)所示时,即为条件(4-21)式。所以极小值原理可以解决变分法所能解决的问题,还能解决变分法不能解决的问题。如何应用条件(4-21)式,这是一个关键,我们将用具体例子来说明。UH0UHH0UH4.3最短时间控制问题节省时间意味着提高生产率或先发制人取得军事行动的胜利。所以人们很早就开始了对最短时间控制的研究,这方面的研究结果很多,这里先就简单的重积分系统的最短时间控制展开讨论。在前面的绪论中列举了火车快速行驶问题。设火车质量m=1,把运动方程写成状态方程形式,令可化为下面的最短时间控制问题。xxxx21,例4-1重积分系统的最短时间控制状态方程(4-22)uxxx221初始条件为(4-23)1001)(xtx2002)(xtx终端条件为(4-24)0)(2ftx0)(1ftx控制约束为(4-25)1)(tufttt0求出使性能指标(4-26)取极小的最优控制。00ttdtJfttf解;因为控制作用有限制(属于有界闭集),故要用极小值原理求解。取哈密顿函数(4-27)协态方程为(4-28)(4-29))()()()(1221tuttxtfFHT011xH122xH积分上面两个方程可得(4-30)(4-31)其中,、是积分常数。11)(cttcct122)(1c2c由的表达式(4-27)可见,若要选择使取极小,只要使越负越好,而,故当,且与反号时,取极小,即最优控制为)(tuH)()(2tut1)(tu1)(tu)(tu)(2tH0)(10)(1)(sgn)(222ttttu当当由此可见,最优解取边界值+1或-1,是开关函数的形式。什么时候发生开关转换,将取决于的符号。而由(4-31)式可见,是的线性函数,它有四种可能的形状(见图4-2),也相应有四种序列)(tu)(2t)(2tt)(tu1,1,1,1,1,1由图4-2可见,当为的线性函数时最多改变一次符号。)(2tt)(tutttt0,021cc0,021cc0,021cc0,021cc)(2t)(2t)(2t)(2t)(tu)(tu)(tu)(tu11111111图4-2与的四种形状)(tu)(2t从上面两式消去t,即可得相轨迹方程(4-33)ctxtx)(21)(221当时,状态方程的解为(4-32)10202120221)()(xtxttxxttx1)(tu下面来求出取不同值时的状态轨迹(也称为相轨迹)。)(tu在图4-3中用实线表示,不同的C值可给出一簇曲线。由(4-32)第一式知增大时增大,故相轨迹进行方向是自下而上,如图中曲线上箭头所示。t)(2tx当时,状态方程的解为(4-34)消去,可得相轨迹方程1u202)(xttx10202121)(xtxttxt')(21)(221ctxtx图4-3相轨迹图1x2xO1u1u在图4-3中用虚线表示。因增大时,减少,故相轨迹进行方向是自上而下。t)(2tx两簇曲线中,每一簇中有一条曲线的半支进入原点。在的曲线簇中,通过原点的曲线方程为(4-36)1u)(21)(221
本文标题:最优控制ppt第四章
链接地址:https://www.777doc.com/doc-5683184 .html