您好,欢迎访问三七文档
C11.最优控制问题三个基本要素:被控对象/系统的数学模型,物理约束条件及性能指标。数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0xtfxtuttxtx;其中,()xtXRn为状态向量,X为状态向量的可容许集;()utRm为控制向量,为控制向量的可容许集。试确定容许的最优控制*()ut和最优状态轨迹*()xt,使得系统实现从初始状态(0)xt到目标集[(),]0xtftf的转移,同时使得性能指标0[(),][(),(),]tftJxtftfLxtuttdt达到极值。2.分类:(1)系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环)(3)实际应用(时间,燃料,能量,终端)(4)终端条件(固定,自由)(5)被控对象形式(精确,随机)。3.静态最优化问题由优化变量、目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,使目标函数达到最优值(极大值或极小值)。数学描述:min(),,:nnxSfxxRfRR,..()0,:;()0,:nmnlstgxgRRhxhRR静态、动态最优化区别:静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数求极值的问题。动态最优化问题,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解决泛函求极值的问题。C2(静态)1.最优梯度法(1)多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。2.惩罚函数法(1)根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适的无约束优化方法继续完成求解;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。3.拉格朗日乘子法(1)通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继续完成求解;(2)多变量有约束(等式约束,不等式约束)。4.最优梯度法计算梯度定义12()()()()fxxfxfxfxxx,Hessian矩阵22221212222212()()ffxxxfxHxxffxxx,最优梯度法(无约束):迭代(1)()()()()kkkkxxfx,()()()()()()()()()()()kTkkkTkkfxfxfxHxfx,终止误差()()()kpkfx例:(),(0),()fxfxHx;(0)[(0)(0)]fxTfx/[(0)(0)]TfxHfx;(1)(0)(0)(0)xxfx;()fxk,()xk是极小值点。5.拉格朗日乘子法计算有约束最优化:约束为:()0,()0xxgh(1)等式约束:(,)()()THxfxxλg,利用1210,0,0,0,0nmHHHHHxxx解出极大值点或极小值点。(2)不等式约束:()0xh,引入附加变量2iv使得不等式约束变为等式约束:2()0iihxv,再有等式拉格朗日乘子法.6.惩罚函数法计算(1)外部:1)等式约束211122(,)()()()()()mTiiPxfxgxfxgxgx,用/0Px求解出*()x,令求出*x;2)不等式约束()0xh:2112(,)(){min[(),0]}liiPxfxhx3)复合形式:21122(,)()()(){min[(),0]}TiPxfxxxhxgg(2)内部:只适用于不等式约束,惩罚函数11(,)()()liiPxfxhx,21(,)()()liiPxfxhx,1(,)()ln[()]liiPxfxhx利用0Px求解出*()x,令0求出*xC3(变分法)1.一次变分求解0(,)()|JxxJxx,变分规则:1100ttttJdtJdt,dxxdt2.泛函取极值必要条件欧拉方程****(,,)(,,)[][]0gxxtdgxxtdtxx,横截条件方程*******(,,)(,,)[]|(,,)[]|0ffTTtftfgxxtgxxtxgxxttxxx问题描述边界条件横截条件ft固定,()fxt固定00*(),*()ffxtxxtx无ft固定,()fxt自由00*()xtx**(,,)[]|0ftgxxtxft自由,()fxt固定00*(),*()ffxtxxtx*****(,,)(,,)|[]|0ffTttgxxtgxxtxxft自由,()fxt自由且互相独立00*()xtx****(,,)(,,)|0,|0ffttgxxtgxxtxft自由,()fxt自由,且通过()()ffxtx00*()xtx,()()ffxtt*****(,,)(,,)|[]()|0ffTttgxxtgxxtxx3.欧拉方程特殊结果(1)被积函数只依赖于()xt:**12[()]0()dgxxtctcdtx直线(2)被积函数只依赖于t和()xt:**[(,)]0(,)dgxtgxtcdtxx,先求*x,再积分求*x(3)被积函数只依赖于()xt和()xt:*****(,)[()](,)Tgxxxtgxxcx(4)常用积分:1)原点到直线0axbyc的距离为22cab;到平面(1,2,3)1230gxxxaxbxcxd的距离为222dabc;2)曲线长度21x4.角点条件(1)1t,1()xt不相关:1111**************(,,)(,,)(,,)(,,)||,{(,,)[]}|{(,,)[]}|TTttttgxxtgxxtgxxtgxxtgxxtgxxtxxxxxx(2)1t,1()xt相关11()()xtt:1111**********(,,)(,,)(,,)|[]()|(,,)|[]()|TTttttgxxtgxxtgxxtgxxtxxxx5.有约束泛函极值(1)微分方程约束:存在(,,)0fxxt约束,引入拉~乘子()t,拉格朗日函数:(,,)(,,)()(,,)TLxxtgxxttfxxt,变为无约束。(2)等周约束:存在0(,,)ftiitexxtc约束,引入0()(,,)titztexxt,拉格朗日函数为(,,,,)(,,)()[(,,)()]TLxxtzgxxttexxtzt,必要条件为:a)对L的欧拉方程b)*()(,,)iiztexxtc)*0。6.离散欧拉方程10()min[()][(),(1),]NkxkJxkLxkxkk,离散欧拉方程****[(),(1),]((1),(),1)0()()LxkxkkLxkxkkxkxk,()xN自由时横截条件为:**((1),(),1)0()LxNxNNxN7.变分法求解最优控制问题目标:0[(),](,,)ftfftJxttLxutdt,约束00(,,)()0,(),[(),]0fffxutxtxtxxtt,构造哈密顿函数(,,,)(,,)(,,)THxutLxutfxut,正则方程:*(,,),*Hxfxutx,控制方程:(,,,)0Hxutu(哈密顿函数性质:dHHdtt,当H中不显含t,H恒为常数)末端时刻固定时的最优解通式:横截条件()[[]]|0fTTfttxtxx末端时刻自由时的最优解通式:横截条件()[[]]|0fTTfttxtxx,()0TfffHttt问题描述边界条件横截条件H在终端时刻处满足ft固定()fxt固定00*(),*()ffxtxxtx无无()fxt自由00*()xtx*(())*()|fftxttx()fxt受约束00*(),[*()]0fxtxxt*[*()](())*()[[]]|ffTftxtxttxxft自由()fxt固定00*(),*()ffxtxxtx无()ffHtt()fxt自由00*()xtx*(())*()|fftxttx()ffHtt()fxt受约束00*(),[*()]0fxtxxt*[*()](())*()[[]]|ffTftxtxttxx()TfffHtttC4(极小值原理)1.极小值原理提出的意义及核心结论意义:变分法求解最优控制问题基于假设(1)容许控制量()ut和容许状态量()xt都是没有任何约束的;(2)哈密顿函数H对()ut是连续可微的.这在实际系统中往往不能满足。极小值原理有效地克服了经典变分法的局限性,除了可以很好地处理控制向量受约束的情况,还不要求哈密顿函数对控制向量的连续可微性。核心结论:使泛函J取得极小值的最优控制*()ut满足的必要条件:*****[(),(),(),][(),(),(),]HxtutttHxtuttt,0[,]fttt,即在区间0[,]ftt内,对于任意的可容许控制变量()ut,都有最优控制*()ut使得哈密顿函数H取得极小值。2.极小值原理问题描述及求解问题描述:状态方程:00()(,,),()xtfxutxtx,要求在容许控制域中,确定一个分段连续的容许控制*()ut,使得系统产生满足目标约束集[(),]0ffxtt的容许状态轨迹*()xt,同时使得性能指标0[(),](,,)ftfftJxttLxutdt取得极小值。(1)状态无约束——相比变分法的求解,只有控制方程发生变化。即求解*()ut使得H取得极小值。(2)状态有约束——有l个约束[(),]0gxtt,定义新的状态变量221111()[(),]()...[(),]()[(),]nllnxtgxttggxttgfxtt,其中,()ig是单位海威赛德阶跃函数,定义如下:0,[(),]0()1,[(),]0iiigxttggxtt,则有1()0nxt,并且当所有的约束条件都满足时1()0nxt。构造哈密顿函数11TnnHLff,必要条件:a)b)原正则方程,c)11nnxf,d)10n,e)控制方程,f)边界条件增加101()()0nnfxtxt,其余横截条件由上表决定。3.离散系统极小值原理状态方程0(1)[(),(),],(0)xkfxkukkxx,终端时刻和终端状态满足约束方程[(),]0xNN,性能指标为10[(),][(),(),]NkJxNNLxkukk。必要条件:哈密顿函数:[(),(),(1),][(),(),](1)[(),(),]THxkukkkLxkukkkfxkukk,正则方程:*(),(1)[(),(),]()Hkxkfxkukkxk,控制有约束:***[(),(),(1),]Hxkukkk取极小值,控制无约束:*()|0()uukHuk;边界条件:*0(0),[(),]0,*()()()TxxxNNNxNxN终端状态自由或固定:*0(0),[(),]0,*()()xxxNNNxN;终端状态受约束增加*()()()TNxNxN
本文标题:最优控制总结
链接地址:https://www.777doc.com/doc-5319805 .html