3-极大值原理

第三章极大值原理（MaximumPrinciple）前面介绍的变分法属于经典变分学的内容。经典变分学只能解决容许控制属于开集的一类最优控制问题，而且对轨线x(t)、函数L、f均有连续可微要求。实际工程应用问题中，这些要求一般无法得到满足。为解决容许控制属于闭集的一类最优控制问题，前苏联数学家庞特里亚金（俄文ЛОНТЛЯТИН，英文Pontryagin）受力学中Hamilton原理启发，于1958年提出极大值原理并加以证明。极大值原理将经典变分学推进到现代变分学，成为现代控制理论的重要基石。极大值原理（MaximumPrinciple），或称最大值原理，也有称为极小值原理或最小值原理（MinimumPrinciple）。极大值原理的证明在数学上非常严格，本课程只从工程应用需要的理解程度出发对其进行简单推导。3.1泛函极值的充分条件几个有关定义正常场定义3-1：若（t，x）平面某一区域D上每一点都有曲线族中一条且仅有一条通过，则称曲线族在区域D上形成一个正常场。曲线族上点（t，x）处的切线的角系数称为场在点（t，x）的斜率。中心场定义3-2：若区域D上曲线族的全部曲线都通过一点（t0，x0），即它们形成曲线束，且束心也属于D，同时除束心外，曲线在D内不再相交，曲线布满区域D，则该场为中心场。极值曲线场定义3-3：若正常场或中心场是由某一变分问题的极值曲线族所形成，则称之为极值曲线场。设有泛函若用p(x,t)表示其极值曲线场中极值曲线斜率，则可以证明泛函增量可表示为fttdtttxtxLxJ0]),(),([)(fttdtttxptxtxExJ0]),,(),(),([)(],,[][],,[],,[],,,[tpxLppxtpxLtxxLtpxxE其中称为维尔斯特拉斯E函数。维尔斯特拉斯E函数（WeierstrassErdmannFunction）泛函J在曲线上达到极值的充分条件设泛函J在曲线c上达到极值，可分为弱极值和强极值两种情况，其充分条件分别为：对于弱极值，①曲线c应是满足极值条件的极值曲线；②极值曲线c能够被包含在极值曲线场中；③对于c近旁所有点(x,t)以及近于p(x,t)的值，函数不变号，极小值时E≥0，极大值时E≤0。对于强极值，①曲线c应是满足极值条件的极值曲线；②极值曲线c能够被包含在极值曲线场中；③对于c近旁所有点(x,t)以及任意的值，函数不变号，极小值时E≥0，极大值时E≤0。x),,,(tpxxEx),,,(tpxxE3.2连续系统极大值原理考虑系统状态方程（3-2-1）其中，，m≤n]),(),([)(ttutxftxmnRtuRtx)(,)(初始状态（3-2-2）00)(xtx终态满足（3-2-3）其中，，r≤n。0]),([ffttxrRu(t)属于有界闭集Ω，受不等式≥0（3-2-4）约束，g为p维连续可微函数，p≤m。]),(),([ttutxg求最优控制，满足上列条件，并使性能指标（3-2-5）达到极小值。)(*tufttffdtttutxLttxuJ0)]),(),([]),([)(u(t)有界并受不等式约束，与前面讨论的问题不同。•取可以保证g非负；而由u(t)的分段连续性，有的分段连续性，则进一步有w(t)分段光滑连续。因此，可以采用Lagrange乘子法进行求解。u(t)有界一般可以考虑为是分段连续函数，对不等式约束则要设法转化为等式约束处理。引进新变量Z(t)和w(t)，取（3-2-6）（3-2-7）0)(],),(),([)]([02tZttutxgtZ0)(),()(0twtutwgZ2)(tw•分别取Lagrange乘子，，，构造广义性能指标（3-2-8）nRrRpRfttffffadtZtwxgxtwxftwxLttxtttxuJ0]}),,([]),,([),,({]),([)(]),([)(2TTT求其一阶变分有（3-2-12）定义（3-2-9）（3-2-10）则有（3-2-11）其中（3-2-13）),,(),,(),,,(twxftwxLtwxHT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTTfttffffadttZwxxFttxtttxuJ0),,,,,,(]),([)(]),([)(TZwxtaJJJJJfftfftttftfttFtttFdttJffffff}{}{TT式（3-2-14）中，由于，则有（3-2-14’）（3-2-15）（3-2-16）ffftxtxx)(fffttfttfxdtxFdtdxFxtxFxxFxxxJ0][)(}{TTTTfftttwdtwFdtdwwFwJ0])(TTfftttZdtZFdtdZZFZJ0])(TT（3-2-14）}][){(}{}{}{00fffffttttftttfxdtxFdtdxFxxFxxxxdtxFxxFxxxJTTTTTTTT由泛函极值必要条件及的任意性，得此泛函极值的必要条件为：欧拉方程：（3-2-17）（3-2-18）（3-2-19）横截条件：（3-2-20）（3-2-21）（3-2-22）（3-2-23）0xFdtdxF0wFdtd0ZFdtd0}{ftffxFxFttTT0}{ftxFxxT0ftwF0ftZF0aJZwxxtff,,,,将代入以上各式，可得泛函极值必要条件为：欧拉方程：（3-2-24）（3-2-25）（3-2-26）横截条件：（3-2-27）（3-2-28）（3-2-29）（3-2-30）xgxHT0}{wgwHdtdT0)(ZdtdT0}{ftffHttT0}{ftxxT0}{ftwgwHT0)(ftZT]),,([),,,(),,,,,,(2ZtwxgxtwxHtZwxxFTT将F函数定义式（3-2-10）代入上式，并考虑由和，有；由和，有，以及在最优轨线上有，所以有再由3.1节中泛函达到极值的充分条件，维尔斯特拉斯E函数在泛函极小值时沿最优轨线非负，即有（3-2-31）0)()()(),,,,,(),,,,,(************ZFZZwFwwxFxxZwxZwxFZwxZwxFETTT0wFdtd0ftwF0wF0ZFdtd0ftZF0ZF),,(2tuxgZ0),,,(),,,(*****twxHtwxHE（3-2-32）0),,,(),,,(*****twxHtwxHE（3-2-32）考虑，上式即（3-2-33）uw),,,(),,,(*****tuxHtuxH或（3-2-33’）),,,(min),,,(*****tuxHtuxHu以上即为极大值原理的简单推导。至此可以将庞特里亚金极大值原理表示为：控制变量u(t)是有第一类间断点的分段连续函数，属于m维空间中的有界闭集Ω，满足不等式约束条件≥0（3-2-4）定理3-1：设系统的状态方程为（3-2-1）]),(),([)(ttutxftx]),(),([ttutxg则为把状态x(t)自初始状态（3-2-2）转移到满足边界条件（3-2-3）的终态，其中tf未知，并使性能指标（泛函）（3-2-5）达到最小值，实现最优控制的条件是：00)(xtx0]),([ffttxfttffdtttutxLttxuJ0)]),(),([]),([)((1)设u*(t)是最优控制，x*(t)为由此最优控制产生的最优轨线，则存在与其相对应的协态向量λ*(t)，使x*(t)和λ*(t)满足规范方程组（3-2-34）(2)在最优轨线上与最优控制u*(t)对应的Hamilton函数取最小值（3-2-35）]),(),(),([)(]),(),(),([)(********ttuttxHxtttuttxHtx]),(),(),([min]),(),(),([*****ttuttxHttuttxHu(3)Hamilton函数在最优轨线终点处的值由下式决定（3-2-36）(4)协态向量λ*(t)的终值满足横截条件（3-2-37）0}{ftffttHT(5)状态向量x*(t)满足边界条件（3-2-38）ftfxxt}{)(*T0]),([)(00ffttxxtx3.3极大值原理边界条件的几种典型情况以下几种典型情况的分析将有助于解决实际问题，特别是如何确定解规范方程组的边界条件。（1），固定，tf自由0]),([ffttxffxtx)(由于和不显含tf，由（3-2-36）式有，这为确定tf提供了一个条件；又由（3-2-37）式有，即在终点处对λ无约束。0]),([ffttx0)(]),([ffffxtxttx0ftH)(ft这时，因和已经为规范方程组提供了2n个边界条件，无需λ(t)的任何约束。00)(xtxffxtx)(此时有，h为n-k维连续可微向量函数。因为不显含tf，由（3-2-36）式有。由（3-2-37）式有，即各λi*(t)是的线性组合。（2），受n-k个方程约束，tf自由0]),([ffttx)(ftx)]([]),([ffftxhttx0)]([]),([ffftxhttx0ftHknfknfffftxhtxhtxhtxht2121*])(,;)(,)([)()(T)(fitxh考虑特殊情况，则有knixtxtxhiffifi,,2,1,)()]([knitifi,,2,1,)(*nknitfi,,1,0)(*即状态终值为规范方程组提供n-k个边界条件，其余k个边界条件由协态终值提供。(3)，不受约束，tf自由这时，有，，即协态终值为规范方程组提供所需的n个边界条件。0]),([ffttx)(ftx0]),([ffttx0ftH0)(*ft(4)，属于动点h(tf)，tf自由0]),([ffttx)(ftx这时，x(tf)＝h(tf)，有，因而，0)()(]),([ffffthtxttx)(*ft)(*fffttttHfTT(5)情况同(4)，但tf固定此时不存在，因而横截条件（3-2-36）不存在，即tf不用确定。ft(6)情况同(1)～(4)，但0]),([ffttx此时，只需在相应的横截条件方程中增加和项即可。ft)(ftx以上边界条件处理情况同样也适用于经典变分法求解最优控制问题。3.4极大值原理的典型应用之一——最短时间控制最短时间控制又称为快速控制或时间最优控制，其基本特征是在满足一定约束条件前提下，取一控制作用（最优控制），使系统以最短的时间从初始状态转移到给定的终态。的某个终态，并使性能指标（3-4-4）最小。其中，对x，t连续可微，tf未知。(1)最短时间控制问题提法已知系统状态方程（3-4-1

3-极大值原理

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

创智互联B2C电子商务白皮书

机械制造技术基础实验教学大纲

来自世界建筑巨子破产风波的思索

珠海电厂质量总结趋势分析样表11月30[1]

08经管杯篮球赛策划书定稿

准军事化与制度

解决农村义务教育投入保障中的制度缺陷_对中央转移支付作用及事权体制

第一章管理与管理者-1

标准流程_存货帐管理1

生产运作管理6

相关文档

相关搜索