最优控制总结

C11.最优控制问题三个基本要素：被控对象/系统的数学模型,物理约束条件及性能指标。数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0xtfxtuttxtx；其中,()xtXRn为状态向量，X为状态向量的可容许集；()utRm为控制向量，为控制向量的可容许集。试确定容许的最优控制*()ut和最优状态轨迹*()xt，使得系统实现从初始状态(0)xt到目标集[(),]0xtftf的转移,同时使得性能指标0[(),][(),(),]tftJxtftfLxtuttdt达到极值。2.分类:(1)系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环)(3)实际应用(时间,燃料,能量,终端)(4)终端条件(固定,自由)(5)被控对象形式(精确,随机)。3.静态最优化问题由优化变量、目标函数及约束条件组成的静态优化问题可以描述为：在满足一系列约束条件的可行域中，确定一组优化变量，使目标函数达到最优值(极大值或极小值)。数学描述：min(),,:nnxSfxxRfRR，..()0,:;()0,:nmnlstgxgRRhxhRR静态、动态最优化区别：静态最优化问题，也称为参数最优化问题，它的三个基本要素是优化变量、目标函数和约束条件，其本质是解决函数求极值的问题。动态最优化问题，也称为最优控制问题，它的三个基本要素是被控对象数学模型、物理约束条件和性能指标，其本质是解决泛函求极值的问题。C2（静态）1.最优梯度法(1)多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。2.惩罚函数法(1)根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适的无约束优化方法继续完成求解;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。3.拉格朗日乘子法(1)通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继续完成求解;(2)多变量有约束(等式约束,不等式约束)。4.最优梯度法计算梯度定义12()()()()fxxfxfxfxxx，Hessian矩阵22221212222212()()ffxxxfxHxxffxxx,最优梯度法(无约束)：迭代(1)()()()()kkkkxxfx，()()()()()()()()()()()kTkkkTkkfxfxfxHxfx，终止误差()()()kpkfx例：(),(0),()fxfxHx；(0)[(0)(0)]fxTfx/[(0)(0)]TfxHfx；(1)(0)(0)(0)xxfx；()fxk，()xk是极小值点。5.拉格朗日乘子法计算有约束最优化：约束为：()0,()0xxgh(1)等式约束：(,)()()THxfxxλg，利用1210,0,0,0,0nmHHHHHxxx解出极大值点或极小值点。(2)不等式约束：()0xh，引入附加变量2iv使得不等式约束变为等式约束：2()0iihxv，再有等式拉格朗日乘子法.6.惩罚函数法计算(1)外部：1)等式约束211122(,)()()()()()mTiiPxfxgxfxgxgx,用/0Px求解出*()x,令求出*x;2)不等式约束()0xh：2112(,)(){min[(),0]}liiPxfxhx3)复合形式：21122(,)()()(){min[(),0]}TiPxfxxxhxgg(2)内部：只适用于不等式约束，惩罚函数11(,)()()liiPxfxhx，21(,)()()liiPxfxhx，1(,)()ln[()]liiPxfxhx利用0Px求解出*()x，令0求出*xC3（变分法）1.一次变分求解0(,)()|JxxJxx，变分规则：1100ttttJdtJdt，dxxdt2.泛函取极值必要条件欧拉方程****(,,)(,,)[][]0gxxtdgxxtdtxx,横截条件方程*******(,,)(,,)[]|(,,)[]|0ffTTtftfgxxtgxxtxgxxttxxx问题描述边界条件横截条件ft固定，()fxt固定00*(),*()ffxtxxtx无ft固定，()fxt自由00*()xtx**(,,)[]|0ftgxxtxft自由，()fxt固定00*(),*()ffxtxxtx*****(,,)(,,)|[]|0ffTttgxxtgxxtxxft自由，()fxt自由且互相独立00*()xtx****(,,)(,,)|0,|0ffttgxxtgxxtxft自由,()fxt自由,且通过()()ffxtx00*()xtx，()()ffxtt*****(,,)(,,)|[]()|0ffTttgxxtgxxtxx3.欧拉方程特殊结果(1)被积函数只依赖于()xt：**12[()]0()dgxxtctcdtx直线(2)被积函数只依赖于t和()xt：**[(,)]0(,)dgxtgxtcdtxx，先求*x，再积分求*x(3)被积函数只依赖于()xt和()xt：*****(,)[()](,)Tgxxxtgxxcx(4)常用积分：1)原点到直线0axbyc的距离为22cab；到平面(1,2,3)1230gxxxaxbxcxd的距离为222dabc；2)曲线长度21x4.角点条件(1)1t,1()xt不相关:1111**************(,,)(,,)(,,)(,,)||,{(,,)[]}|{(,,)[]}|TTttttgxxtgxxtgxxtgxxtgxxtgxxtxxxxxx(2)1t,1()xt相关11()()xtt:1111**********(,,)(,,)(,,)|[]()|(,,)|[]()|TTttttgxxtgxxtgxxtgxxtxxxx5.有约束泛函极值(1)微分方程约束:存在(,,)0fxxt约束，引入拉~乘子()t,拉格朗日函数:(,,)(,,)()(,,)TLxxtgxxttfxxt，变为无约束。(2)等周约束:存在0(,,)ftiitexxtc约束，引入0()(,,)titztexxt，拉格朗日函数为(,,,,)(,,)()[(,,)()]TLxxtzgxxttexxtzt，必要条件为：a)对L的欧拉方程b)*()(,,)iiztexxtc)*0。6.离散欧拉方程10()min[()][(),(1),]NkxkJxkLxkxkk，离散欧拉方程****[(),(1),]((1),(),1)0()()LxkxkkLxkxkkxkxk，()xN自由时横截条件为：**((1),(),1)0()LxNxNNxN7.变分法求解最优控制问题目标：0[(),](,,)ftfftJxttLxutdt，约束00(,,)()0,(),[(),]0fffxutxtxtxxtt，构造哈密顿函数(,,,)(,,)(,,)THxutLxutfxut，正则方程：*(,,),*Hxfxutx，控制方程：(,,,)0Hxutu（哈密顿函数性质:dHHdtt,当H中不显含t，H恒为常数）末端时刻固定时的最优解通式：横截条件()[[]]|0fTTfttxtxx末端时刻自由时的最优解通式：横截条件()[[]]|0fTTfttxtxx，()0TfffHttt问题描述边界条件横截条件H在终端时刻处满足ft固定()fxt固定00*(),*()ffxtxxtx无无()fxt自由00*()xtx*(())*()|fftxttx()fxt受约束00*(),[*()]0fxtxxt*[*()](())*()[[]]|ffTftxtxttxxft自由()fxt固定00*(),*()ffxtxxtx无()ffHtt()fxt自由00*()xtx*(())*()|fftxttx()ffHtt()fxt受约束00*(),[*()]0fxtxxt*[*()](())*()[[]]|ffTftxtxttxx()TfffHtttC4（极小值原理）1.极小值原理提出的意义及核心结论意义：变分法求解最优控制问题基于假设(1)容许控制量()ut和容许状态量()xt都是没有任何约束的;(2)哈密顿函数H对()ut是连续可微的.这在实际系统中往往不能满足。极小值原理有效地克服了经典变分法的局限性，除了可以很好地处理控制向量受约束的情况,还不要求哈密顿函数对控制向量的连续可微性。核心结论:使泛函J取得极小值的最优控制*()ut满足的必要条件:*****[(),(),(),][(),(),(),]HxtutttHxtuttt，0[,]fttt，即在区间0[,]ftt内，对于任意的可容许控制变量()ut，都有最优控制*()ut使得哈密顿函数H取得极小值。2.极小值原理问题描述及求解问题描述:状态方程：00()(,,),()xtfxutxtx，要求在容许控制域中，确定一个分段连续的容许控制*()ut，使得系统产生满足目标约束集[(),]0ffxtt的容许状态轨迹*()xt，同时使得性能指标0[(),](,,)ftfftJxttLxutdt取得极小值。(1)状态无约束——相比变分法的求解，只有控制方程发生变化。即求解*()ut使得H取得极小值。(2)状态有约束——有l个约束[(),]0gxtt，定义新的状态变量221111()[(),]()...[(),]()[(),]nllnxtgxttggxttgfxtt，其中，()ig是单位海威赛德阶跃函数，定义如下：0,[(),]0()1,[(),]0iiigxttggxtt，则有1()0nxt，并且当所有的约束条件都满足时1()0nxt。构造哈密顿函数11TnnHLff，必要条件：a)b)原正则方程，c)11nnxf，d)10n，e)控制方程，f)边界条件增加101()()0nnfxtxt，其余横截条件由上表决定。3.离散系统极小值原理状态方程0(1)[(),(),],(0)xkfxkukkxx，终端时刻和终端状态满足约束方程[(),]0xNN，性能指标为10[(),][(),(),]NkJxNNLxkukk。必要条件：哈密顿函数：[(),(),(1),][(),(),](1)[(),(),]THxkukkkLxkukkkfxkukk，正则方程：*(),(1)[(),(),]()Hkxkfxkukkxk，控制有约束：***[(),(),(1),]Hxkukkk取极小值，控制无约束：*()|0()uukHuk；边界条件：*0(0),[(),]0,*()()()TxxxNNNxNxN终端状态自由或固定：*0(0),[(),]0,*()()xxxNNNxN；终端状态受约束增加*()()()TNxNxN

最优控制总结

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

广告策划的原则

法人治理结构、组织结构及人力资源管理体系设计

【管理制度】医疗器械监督管理条例

第二届创业计划大赛参赛手册

关于申报吉林省农机化推广补助专项资金项目的通知

陈安之超级总裁策略行销班学员作业手册65319143

兰州大学西部环境教育部重点实验室

福建工商行政流通领域食品监督管理系统(132版)

GB T 19245

电机的工艺规程

相关文档

相关搜索