您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 广告经营 > 现代控制理论第7章ppt
2021年4月6日第7章第1页第7章最优控制7.1基本概念7.2变分法在最优控制中的应用7.3极小值原理7.4动态规划7.5线性二次型最优控制7.6实用最优控制系统本章小结第7章第2页2021年4月6日概述•最优控制作为现代控制理论的重要组成部分,所要解决的主要问题是如何在给定条件下,确定一种合理的控制规律,使被控对象在预先规定意义上的性能指标具有最优值。•早在20世纪50年代初期,随着计算机技术的飞速发展和空间技术的迫切需求,推动人们研究更为复杂的控制系统,并建立了以状态空间法为基础的最优控制理论。通过研究发现,最优控制问题的本质是求解泛函极值问题,属于变分学的理论范畴。•经典的变分理论只能解决容许的控制律属于开集的一类最优控制问题。在开辟求解最优控制问题新途径的工作中,原苏联学者庞特里亚金(Л·С·Понтрягин)的“最小值原理”和美国学者贝尔曼(R.E.Bellman)的“动态规划”占有重要地位,成为解决最优控制中控制律有闭集约束问题的有效工具。•根据控制变量的取值范围有无限制,可将最优控制问题分为无约束最优控制和有约束最优控制。•本章主要介绍求解无约束最优控制问题的变分法和有约束最优控制问题的最小值原理、动态规划、线性二次型最优控制和应用MATLAB求解最优控制问题等内容。2021年4月6日第7章第3页7.1基本概念第7章第4页2021年4月6日7.1.1宇宙飞船登月软着陆的实例实例1:宇宙飞船若实现在月球表面实现软着陆,即登月舱到达月球表面时的速度为零,要寻求登月舱发动机推力的最优变化率,使燃料消耗最少,以便在完成登月考察任务后,登月舱有足够燃料离开月球与母舱会合,从而返回地球。飞船登月舱质量高度垂直速度发动机推力月球重力加速度为常数飞船登月舱不含燃料时的质量登月舱所载燃料质量登月舱登月时的初始高度初始垂直速度()mt()ht()tv()tugMF0h0v第7章第5页2021年4月6日登月舱的运动方程初始条件为()()()()()()()httttgmtmtktvuvu式中k为常数。00(0)(0)(0)hhmMFvv第7章第6页2021年4月6日末端条件式中,为登月舱发动机工作的末端时刻。控制约束条件为()0()ffhtt0vftmax()t0uu式中,为登月舱发动机最大推力。maxu性能指标取为表征燃料能耗量的登月舱着陆时的质量,即()fJmt第7章第7页2021年4月6日7.1.2最优化问题的数学描述从上述实例可以看出,最优控制理论通常是将控制问题严格地抽象为数学模型后再求解的。最优化问题的数学描述,应包括以下四个方面的内容:(1)受控动态系统的数学模型,即受控系统动力学特性的系统状态方程,它反映了动态系统在运动过程中所应遵循的客观规律,是描述被控系统各状态变量之间关系的一组等式。(2)动态系统的初态和终态(末态)即状态方程的边界条件。一个动态过程,归根到底是状态空间从一个状态转移到另一个状态。(3)目标函数(又称性能指标或性能泛函或目标泛函等)。目标函数是一个衡量“控制作用”效果的性能指标。为了实现动态过程中状态从初态转移到终态,可以通过不同的控制来完成,而各种控制效果的好坏,可通过能否达到所规定的目标函数来判别。对于最优化问题的目标函数,其内容与形式主要取决于具体最优化问题所要解决的主要矛盾。第7章第8页2021年4月6日(4)容许控制的集合。每一个实际的控制问题,控制向量u(t)都有一个规定的取值范围,这个取值范围对应于m维控制空间Rm中的一个集合Ω,而u(t)的每一个取值对应于集合Ω中的一个元素。凡属于集合Ω的控制称为容许控制。如果容许控制受到限制,如,则称容许控制属于某一闭集;如果容许控制向量u(t)的取值不受限制,则容许控制属于某一开集。容许控制属于闭集和开集的两类问题,在处理方法上有较大差别。()mtUu最优控制问题的一般提法为:已知被控系统的状态方程及给定的初始状态,规定一个目标集,求一容许控制,使得被控系统在初始时刻由初始状态出发,在终止时刻转移到目标集,并使性能指标满足要求。2021年4月6日第7章第9页7.2变分法在最优控制中的应用第7章第10页2021年4月6日变分法是求解泛函极值的一种经典方法,可以确定容许控制为开集的最优控制函数,也是研究最优控制问题的一种重要工具。本节在简要地介绍泛函及变分学的概念和原理的基础上,着重阐述无约束条件的最优控制变分求解和有等式约束条件的最优控制变分求解方法。第7章第11页2021年4月6日7.2.1泛函与变分法的基本概念给定函数空间U,若对于任何函数()tUx,总有一个确定的值(())Jtx与之对应,则称(())Jtx是函数()tx的泛函,记作(())JJtx。这里()tx通常被称作宗量。泛函可以理解为“函数的函数”,其值由函数的选取而定,这一点与“复合函数”的概念有本质差异。第7章第12页2021年4月6日例如,函数的定积分是一个泛函。设10()()Jxxtdt则()Jx的值由函数()xt而定。当()xtt时11212001()2Jxtdtt当()sinxtt时1100()sin(cos)1cos1Jxtdtt在这里需要注意的是,不定积分()()Jxxtdt并不是一个泛函,因为无论函数()xt如何选取,(())Jxt没有一个确定的值。第7章第13页2021年4月6日又如平面上给定两点之间的曲线长度是一个泛函。设(,)xy平面上有A、B两点,其坐标分别为11(,)Axy和22(,)Bxy,设两点间曲线长度为Jl,取单元弧长为dl,则有22()()dldxdy单元弧长变化率21dlydx因而A、B两点间曲线长度212()1xxJyxlydx其值取决于函数()yx的选取。最优控制问题中的目标函数,由于其值取决于控制()tu和状态()tx的选取,必定是一个泛函,故又称为性能泛函。第7章第14页2021年4月6日为了定义泛函的变分,应先研究宗量的变分。设(())Jtx为连续泛函,()tUx为宗量,其变分表达式为00()(),(),()ttttUxxxxx变分x表示U中点()tx与0()tx之间的差。由于x存在,必然引起泛函数值的变化,并以()Jxx表示。其中为参变数,其值01。当1时,得增加后的泛函值()Jxx;当0时,得泛函原来的值()Jx。若泛函(())Jtx对于任何常数1C,2C及任何1()tUx,2()tUx,都有11221122(()())(())(())JCtCtCJtCJtxxxx,且其增量可以表示为(()())(())((),())((),())JJttJtLttrttxxxxxxx第7章第15页2021年4月6日其中,第一项是()tx的连续线性泛函,第二项是关于()tx的高阶无穷小,则称上式第一项为泛函的变分,记作((),)JLtxx如同函数的微分函数增量的线性主部一样,泛函的变分就是泛函增量的主部。泛函的变分同样可以利用求导的方法来确定。如果泛函(())Jtx满足1212()()()()JttJtJtxxxx以及()()JtJtxx则称该泛函为线性泛函,式中为任意常数。如果泛函的变分存在,则0()(,)JJxxxx第7章第16页2021年4月6日求证如果泛函的变分存在,则0()(,)JJxxxx证明根据泛函变分的定义0000()()(,)(,)JJJLrxxxxxxx由于0(,)Lxx时关于x的连续线性泛函,故00(,)(,)LLxxxx又因0(,)rxx是关于x的高阶无穷小,故00(,)lim0rxx第7章第17页2021年4月6日于是000000000()()(,)lim1lim(,)(,)(,)JJJLrJxxxxxxxxxxx可以利用该结论计算泛函的变分。第7章第18页2021年4月6日例7.2.1求泛函0(,,)TtJFxxtdt的变分J。其中0t,T,0()xt,()xT固定。解根据泛函变分的定义00000((,,))()TtTxxxtTTTxxxtttJFxxxxtdtFFxdtdFxFxdtFxdtdt由于0t,T,0()xt,()xT是固定的,故上式中的第一项为零,从而有0()TxxtdJFFxdtdt若泛函(())Jxt在0()xxt处的变分存在,且在点0()xxt处达到极值,则泛函(())Jxt在0()xxt处的变分00xxJ。第7章第19页2021年4月6日7.2.2泛函极值设()Jx是线性赋范空间nR中某个子集D上的连续线性泛函,点0Dx,若存在某一正数,使集合00(,),nURxxxxx在0(,)UDxx时,均有0()()()0JJJxxx则称泛函()Jx在0xx处达到极小值;若0()()()0JJJxxx则称泛函()Jx在0xx处达到极大值。第7章第20页2021年4月6日对于无约束泛函0(,,)TtJFtdtxx已知(,,)Ftxx及()tx在0[,]tT上连续可微,0t及T固定,且00()txx,()fftxx,()ntRx,上式取极值的必要条件是轨线()tx满足下列欧拉方程:0dFFdtxx7.2.2泛函极值证明由泛函变分的定义可知,泛函变分是泛函增量的线性主部,故0()TtJFxFdtxxx第7章第21页2021年4月6日利用分部积分公式,上式中的第二项为000TTTtttdFdtFFdtdtxxxxxx于是00()TTttdJFFdtFdtxxxxx由于x是任意的,又由泛函取极值的必要条件是0J,故上式为零等价于0dFFdtxx以及000()()0TttTttFFTFtxxxxxx“欧拉方程”或“欧拉-拉格朗日方程”横截条件7.2.2泛函极值第7章第22页2021年4月6日7.2.3横截条件求解欧拉方程,需要由横截条件提供两点边界值。在工程实际问题中,存在着初始时刻和初始状态、末端时刻和末端状态固定或自由的多种情况。本节讨论末端时刻固定和末端时刻自由时的各种横截条件,以及初始时刻自由时的横截条件。在这里把初始状态称为起点,末端状态称为终点。1末端时刻固定时的横截条件当末端时刻固定时,由泛函极值的必要条件可知,横截条件的一般表达式为000()()0TttTttFFTFtxxxxxx只要不是起点和终点均固定的问题,宗量变分()ftx和0()tx不可能同时为零,使泛函一次变分0J,则必有0tTFx或00ttFx。第7章第23页2021年4月6日序号名称横截条件1固定起点和终点00()txx,()TTxx2自由起点和终点00ttFx,0tTFx3自由起点和固定终点00ttFx,()TTxx4固定起点和自由终点00()txx,0tTFx把末端时刻固定时的各种横截条件列成表。表7.1.1末端时刻固定时的横截条件7.2.3横截条件第7章第24页2021年4月6日2末端时刻自由时的横截条件末端时刻自由问题的实质是,末端时刻T不固定,末端状态是自由、或受约束,属于变动端点问题。在变动端点问题中,可以证明,极值仅在欧拉方程的解12(,,)tccxx上达到,其中1c和2c为求解欧拉方程的待定系数,由横截条件给出。因此,泛函极值由12(,,)tccx一类函数确定。末端时刻自由、末端状态变动时的横截条件,可分成如下两种情况讨论。7.2.3横截条件第7章第25页2021年4月6日⑴起点固定,末端自由由于00()txx,故0()0xt。在末端自由情况下,T及
本文标题:现代控制理论第7章ppt
链接地址:https://www.777doc.com/doc-7948842 .html