您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 05线性系统二次型指标的最优控制——线性二次型问题
第五章线性系统二次型指标的最优控制——线性二次型问题返回主目录5.1引言5.2线性二次型问题的提法5.3终端时间有限时连续系统的状态调节器问题5.4稳态时连续系统的状态调节器问题5.5离散系统的线性二次型问题5.6伺服跟踪问题5.7设计线性二次型最优控制的若干问题5.8小结5.1引言用极小值原理解非线性系统的最优控制将导致非线性两点边值问题,这类问题求解是很困难的。即使系统是线性的,但当指标函数是最短时间、最少燃料这种形式,要求得到最优控制的解析表达式,并构成反馈控制(即把表示为的函数)也是非常困难的。返回子目录的确定归结为求解一个非线性矩阵黎卡提(Riccati)微分方程或代数方程。而黎卡提方程的求解已研究得很透彻,有标准的计算机程序可应用,因此,求解既规范又方便。这种问题简称为线性二次型(LinearQuadratic简称LQ)问题,目前应用得十分广泛,是现代控制理论最重要的结果之一。下面我们将看到,若系统是线性的,指标函数是二次型的(指标函数是和的二次函数),则可以求得线性最优反馈控制律。线性二次型问题的实用意义还在于:例如,在飞行器的轨迹优化问题中,根据飞行器的状态方程(一般是非线性的)用极小值原理计算出名义的最优控制和最优状态轨迹,设分别用和表示。把它所得到的最优反馈控制与非线性系统的开环最优控制结合起来,可减小开环控制的误差,达到更精确的控制的目的。因为状态方程只能是对飞行器实际动力学特性的近似描绘,这里存在着模型误差,把加到飞行器上去,所产生的实际状态将不同于(这里我们还未考虑作用在飞行器上的其它扰动作用)。(这里我们还未考虑作用在飞行器上的其它扰动作用)。令状态误差为,我们要使愈小愈好,为此,可根据构成一个最优反馈控制,作为校正信号加到上去,得到的实际控制信号将使飞行器尽可能沿着飞行。由于、应该比较小,它们将满足线性的状态方程,所以可用线性二次型问题设计出反馈控制。我们可用图5-1表示上面的思想。)()()(tXtGtU图5-1线性二次最优反馈控制的应用5.2线性二次型问题的提法一般情况的线性二次型问题可表示如下:其中,为维状态向量,为维控制向量,为维输出向量。设不受约束。设线性时变系统的方程为(5-1)(5-2)返回子目录其中,为维理想输出向量。寻找最优控制,使下面的性能指标最小(5-4)令误差向量为(5-3)其中,是对称半正定常数阵,是对称半正定阵,是对称正定阵。一般将、、取成对角阵。下面对性能指标中的每一项作一说明。因为正定阵,则当,就有。例如设,,则为正定阵,于是它与消耗的控制能量成正比,消耗得越多,则性能指标值越大。故性能指标中这一项表示了对消耗控制能量的惩罚。、可看作加权系数,如认为的重要性大于,则可加大。将选成时间函数,是为了对不同时刻的加权不一样。实际上,为了简单起见常选用常数阵。为半正定阵,则当,就有,表示误差平方和积分,故这项表示对系统误差的惩罚。表示对终端误差的惩罚,当对终端误差要求较严时,可将这项加到性能指标中。总之,性能指标最小表示了要用不大的控制量来保持较小的误差,以达到能量和误差的综合最优。这时(单位阵),理想输出,则,这时,问题归结为用不大的控制量使保持在零值附近。因而称为状态调节器问题。下面讨论几种特殊情况:1)调节器问题。例如电机转速调节系统中,由于外加电压波动使转速偏离要求值,通过施加控制使转速偏差趋于零。这时,,这时要用不大的控制量使跟踪,因而称为跟踪问题。例如,用雷达跟踪飞行器的运动,通过控制使跟踪误差趋于零。2)伺服机问题。5.3终端时间有限时连续系统的状态调节器问题要求寻找最优控制,使最小。这里无约束。、为对称半正定阵,为对称正定阵。终端时间为有限值。(5-5)(5-6)考虑下面的系统状态方程和性能指标返回子目录5.3.1用极小值原理求解上面的问题因无约束,故等同于用经典变分法求解。取哈密顿函数为协态方程为最优解的必要条件如下:(5-7)(5-8)因正定,故存在,由上式可确定最优控制。为寻求最优反馈控制律还需把与状态联系起来。(5-9)控制方程为我们再一次遇到了两点边值问题(已知和),如前所述,一般要试凑再积分协态方程使满足要求。但这里处理的是线性微分方程,可找到更简单的解法。从(5-10)可见,协态和状态在终端时刻成线性关系。(5-10)横截条件为然后再来求出(这种方法称为扫描法)。将(5-11)代入(5-9),再代入(5-5),得(5-11)(5-12)(5-13)由(5-11)和(5-8)可得这启发我们假定:上式对任意都应成立,故方括号内的项应为零,这就得出(5-14)将(5-12)代入(5-13)可得上式是的非线性矩阵微分方程,称为黎卡提(Riccati)矩阵微分方程。一般来说得不出的解析表达式,但可用计算机程序算出的数值解。为了求解,要知道它的边界条件。比较(5-11)和(5-10)可知因此可从到逆时间积分黎卡提微分方程,求出。由(5-9)和(5-11)就可构成最优反馈控制(5-15)又称为最优反馈增益矩阵。最优反馈系统的结构图如图5-2所示。(5-16)图5-2最优反馈系统的结构图注意到与状态无关,故可在系统未运行前,将先计算出来(称为离线计算),把它存储在计算机中。在系统运行时,将从计算机存储元件中取出,与同一时刻测量到的相乘,就可构成最优控制。由此可见,系统运行时的计算量(称为在线计算量)只是一个乘法计算,故可用简单的微计算机来完成。5.3.2矩阵黎卡提微分方程的求解及的性质1、于是可用下面的差分方程来近似黎卡提微分方程(5-17)矩阵黎卡提微分方程是非线性的,一般不能求得闭合形式的解。在数字机上求解时,可用一阶差分代替微分2、求解上式时,以为初始条件,取为负的小量,从到逆时间递推计算,即可出。是对称矩阵,即,表示转置。这可证明如下:因为、、都是对称的,将(5-14)式转置一下,可得因此和一样满足同一黎卡提方程,并且边界条件一样,即。于是,由微分方程解的唯一性可知利用这个对称性,求维的元时,只需积分个方程即可。3、即使系统是定常的,即系统矩阵A,输入矩阵B为常数阵,加权阵和也是常数阵,但仍为时变阵。这从是黎卡提微分方程的解可看出。时变时,反馈控制增益也时变,在实现时总是不太方便。下一段将看到,对线性定常系统,若终端时间,且系统满足一些附加条件时,将变为常数阵。例5-1设系统状态方程为(5-18)(5-19)寻找最优控制使下面的性能指标为最小。解考虑到是对称阵,设为简单起见,上式右端省略了自变量。把上面的、、、和代入黎卡提方程(5-14)式,可得(5-20)(5-21)把状态方程(5-18)和(5-5)式相比较,把性能指标(5-19)和(5-6)式相比较,可得令上式等号左右端的对应元相等,得(5-23)(5-22)由到逆时间积分上面的非线性微分方程组,即可求得。于是最优控制为(5-24)得(5-25)这是一组非线性微分方程。由边界条件、、、和随时间变化的曲线可求出,如图5-3(a)、(b)、(c)所示。图5-3、、、和的时间曲线由图5-3可见,定常系统的反馈系数、都是时变的。当比系统的过渡过程时间大很多时,、只在接近时才有较大的变化,其它时间接近于常数。当时,、和都趋于零,则黎卡提微分方程变为黎卡提代数方程解上面的方程组可得、、的稳态值于是最优控制律可表示为(5-27)最优控制系统的结构图如图5-4所示。图5-4重积分系统最优控制的结构图5.4稳态时连续系统的状态调节器问题对于稳态问题,当系统状态方程和性能指标中的加权阵满足一定条件时,可得出常数的最优反馈增益阵,这样在实现时非常方便,因此有很大的实际意义。我们不加证明地列出下面的结果,然后再对问题中的条件作一些说明。现在来研究工程实践中经常碰到的情况:系统是定常的,积分指标的上限为无穷大。这种线性二次型问题称为稳态问题。返回子目录为维,为维,系统是可控的或至少是可稳的(可稳指不可控的状态是渐近稳定的)。性能指标为(5-28)(5-29)线性定常系统其中不受约束,和为常数对称正定阵。或者可将对的要求改为对称半正定,可观测,或至少可检测(可检测指不可观测的状态是渐近稳定的),是的矩阵平方根:。上节我们已经证明了:使为极小的最优控制是存在和唯一的,且可表示为:(5-30)其中为维常数阵,称为反馈增益阵,为维正定对称阵,满足下面的矩阵黎卡提代数方程对照有限时间调节器的公式(5-14)可见,令,并将时变阵换成常数阵即得到(5-31)式。在5.5中将针对离散型系统求取与(5-30)对应的线性二次型状态调节器的控制规律。(5-31)可以看到,与有限时间的调节器不同,稳态调节器问题附加了两个条件:系统可控或至少可稳;为对称正定阵,或对称半正定并且可观,至少可检测,。下面对这些条件作些解释。也就是受控系统的状态变量必须是渐近稳定的(这时由产生的反馈控制也收敛到零)。因为稳态问题的性能指标积分上限为无穷,为了保证积分值为有限,和要收敛到零。1)系统可控或至少可稳。这个要求是为了保证性能指标的积分为有限值(不趋于无穷)而提出的。如果系统可控,则通过状态反馈可任意配置闭环系统极点,使系统渐近稳定。可控的条件可减弱为可稳,即不可控的状态是渐进稳定的。对有限时间调节器来讲,因为积分上限为有限值,即使系统不可控,状态变量不稳定,但积分指标仍可为有限值,故仍旧有最优解。2)为正定或为半正定并且可观测至少可检测,。这个条件是保证最优反馈系统稳定而提出的,因性能指标取有限值,还不能保证系统稳定。例如只要不稳定的状态变量在性能指标中不出现(未被指标函数所“观测”到)即可。为半正定时就可能出现这种情况,所以必须正定。或者半正定,但还有可观,至少可检。下面用例子来说明。例5-2已知系统方程要寻找最优控制使最小。(5-32)性能指标是(5-33)解设,即未控系统是不稳的,但系统是可控的。若,,即、为正定。黎卡提代数方程(5-31)化为(5-34)(5-35)取正定解由(5-30)求得最优控制代入状态方程(5-32),得闭环特征根变为即最优反馈系统是稳定的。(5-37)从的形式立即可判断出时最小。这时无反馈控制作用,系统保持为开环不稳定。从黎卡提方程来看,这时有有两个解:和。只有可使,从而性能指标为最小,但这时系统不稳定。若(相当于为半正定),则指标蜕化为例5-3考虑下面的不可控系统要求出最优控制使为最小。(5-38)(5-39)(5-40)性能指标为解显然,这个系统的是可控的,而不可控,性能指标中只包含了可控的状态变量。由状态方程和性能指标求得显然为半正定阵。可控性阵为(5-41)(5-42)由对构成的可观性阵为是非奇异阵,故为可观测对。令是奇异的,系统不可控。将阵作下面的分解(5-43)为保证正定,根据塞尔维斯特判据,的各阶主子式应大于零,即代入矩阵黎卡提代数方程(5-31)可得由上式可解得(5-44)(5-45)(5-46)将求得的、、的值代入上面正定性条件,可得若,则上式将导致,发生矛盾若,则可成立,可正定。而由(5-39),时,不可控的状态是稳定的,即系统满足可稳的要求,于是存在正定的最优反馈增益阵。(5-47)最优控制可计算如下(5-48)(5-49)最优闭环系统为当时,闭环系统也是稳定的闭环系统矩阵为它的特征根为(5-50)(5-51)5.5离散系统的线性二次型问题先考虑一般的线性时变离散系统在终端时间有限时的状态调节器问题,再考虑线性定常离散系统在终端时间无限时的稳态状态调节器的问题返回子目录5.5.1终端时间有限的状态调节器问题设系统状态方程为二次型性能指标为(5-53)(5-52)、为半正定阵,为正定阵。要求寻找最优控制序列,使最小。写出哈密顿函数协态方程(5-54)(5-55)横截条件为控制方程为假设(5-56)(5-57)(5-58)把上式代入(5-59)并消去等式两端的,可得必须满足下面的黎卡提矩阵差分方程把(5-58)代入协态方程(5-55)得由状态方程(5-52)和控制方程(5-57)可得所以(5-59)对上式方括号部分应用矩阵求逆引理。令可得矩阵黎卡提差分方程的
本文标题:05线性系统二次型指标的最优控制——线性二次型问题
链接地址:https://www.777doc.com/doc-5766546 .html