您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > LQR和PID控制器在飞行器高度控制中的应用
LQR和PID控制器在飞行器控制中的应用毕凤霞关洋刘冰姜雪莹CONTENTS应用背景ALQR状态反馈调节器设计BPID控制器设计C仿真分析D考虑如下实际问题:飞行器的最优高度控制,飞行器的控制方程如下其中是飞行器的高度,是油门输入,试设计控制律,使得如下性能指标最小:dttRUUtxtxtxQtxtxtxtUtXJT0321321)()()()(]),(),(),([21)](),([)(1tx)(tU问题产生)(2100)()()(2100100010)()()(321321tUtxtxtxtxtxtx初始状态为:对如下给定的Q、R矩阵进行仿真和分析:TTtxtxtx]0,0,10[)](),(),([3212,000000001RQ2000,000000001RQ2,0000000010RQ2,00001000001RQ①②③④线性二次型(LQR)状态调节器设计Part所谓状态调节器问题,就是要求系统的状态保持在平衡状态附近。当某种原因是系统的状态偏离平衡状态时,就对系统进行控制使之回到原平衡状态。对于线性定常系统,任何平衡状态通过线性变换可转化为零状态。为了方便起见,通常将系统的零状态取为平衡状态。有限时间状态调节器只考查系统由任意初态恢复到平衡状态的行为,且性能指标只能在恢复过程中的状态偏差、控制量大小及终端误差之间取得一个合理折中。然而,实际工程问题的要求是,除了保证有限时间内系统对非零初态的响应具有最优性外,还要求系统具有保持平衡状态的能力。这种既有最优性要求,又有稳定性要求的问题只能用无线时间调节器理论去解决。即要求ft设线性时变系统状态方程为:性能指标为:式中,向量,矩阵00)(),()()()()(xtxtutBtxtAtxdttutRtutxtQtxJTT0)]()()()()()([21mnRtuRtx)(,)(维增益矩阵为维时变系统矩阵,为mntBnntA)()(加权是对控制输入加权,是对状态其中为对称正定阵为半正定矩阵,utRxtQtRtQ)()()()(对于无限时间时变状态调节器问题,若阵对完全可控,则存在唯一的最优控制最优性能指标为式中:是对称,非负的,而P(t)是如下黎卡提方程及其边界条件的唯一解)}(),({tBtA)()()()()()()(1*txtKtxtPtBtRtuT)()()(21000*txtPtxJT)(lim)(tptPft01QPAPBBRPAPTT0)(ftp设计无限时域控制器之前,首先判断系统是否可控,在MATLAB中应用如下命令求判断系统能控性若系统可控,则继续求解黎卡提方程,解出系统的反馈矩阵,从而求出最优控制律使系统的性能指标最小。在MATLAB中提供了求解代数黎卡提方程的lqr()函数,其调用格式为:),,,(],,[RQBAlqrEPK)),((bactrbrankr状态调节器最优控制闭环系统结构图如下所示:)()()()()(tutBtxtAtx)()(1tBtRT)(tP)(tu)(t)(txLQR即线性二次型调节器,其对象是现在控制理论中以状态空间形式给出的线性系统,而目标函数为对象状态和控制输入的二次型函数,在现代控制理论中占有非常重要的位置,受到控制界的普遍重视。LQR控制方法的优势在于其控制方案简单,超调量小,且响应速度快。2SECTIONPID控制器PID控制器是根据PID控制原理对整个控制系统进行偏差调节,从而使被控变量的实际值与工艺要求的预定值一致。不同的控制规律适用于不同的生产过程,必须合理选择相应的控制规律,否则PID控制器将达不到预期的控制效果。PID控制器既有比例作用的及时迅速,又有积分作用的消除余差能力,还有微分作用的超前控制功能。当偏差阶跃出现时,微分立即大幅度动作,抑制偏差的这种跃变;比例也同时起消除偏差的作用,使偏差幅度减小,由于比例作用是持久和起主要作用的控制规律,因此可使系统比较稳定;而积分作用慢慢把余差克服掉。只要三个作用的控制参数选择得当,便可充分发挥三种控制规律的优点,得到较为理想的控制效果。仿真3partLQR控制器:应用MATLAB进行仿真,通过lqr()函数来求解系统的反馈矩阵K(t),进而求出控制律。在仿真过程中通过改变Q阵和R阵来观察系统特性的变化所画的状态响应曲线及控制输入U的响应曲线如下图所示:(1)Q=diag(1,0,0),R=2时,由MATLAB求得最优状态反馈矩阵为)()(],0510.2,0772.2,7071.0[tKxtuK02468101214161820-8-7-6-5-4-3-2-1012时间/sec响应Q=diag(1,0,0),R=2时控制输入U的响应曲线02468101214161820-4-20246810时间/sec响应Q=diag(1,0,0),R=2时状态响应曲线x1x2x3(2)Q=diag(1,0,0),R=2000时,由MATLAB求得最优状态反馈矩阵为)()(],4166.0,2517.0,0224.0[tKaxtuKa0102030405060-0.25-0.2-0.15-0.1-0.0500.050.1时间/sec响应Q=diag(1,0,0),R=2000时控制输入U的响应曲线0102030405060-20246810时间/sec响应Q=diag(1,0,0),R=2000时状态响应曲线x1x2x3(3)Q=diag(10,0,0),R=2时,由MATLAB求得最优状态反馈矩阵为)()(],3077.3,3892.4,2361.2[tKbxtuKb02468101214161820-25-20-15-10-50510时间/sec响应Q=diag(10,0,0),R=2时控制输入U的响应曲线02468101214161820-50510时间/sec响应Q=diag(10,0,0),R=2000时状态响应曲线x1x2x3(4)Q=diag(1,100,0),R=2时,由MATLAB求得最优状态反馈矩阵为)()(],6076.4,6112.7,7071.0[tKcxtuKc05101520253035404550-8-7-6-5-4-3-2-1012时间/sec响应Q=diag(1,100,0),R=2时控制输入U的响应曲线05101520253035404550-20246810时间/sec响应Q=diag(1,100,0),R=2时状态响应曲线x1x2x3PID控制器:PID控制时仿真效果如下:020406080100120140160180200-4-20246810PID控制时状态x1的响应曲线020406080100120140160180200-3-2.5-2-1.5-1-0.500.51PID控制时状态x2的响应曲线仿真图020406080100120140160180200-2.5-2-1.5-1-0.500.51PID控制时状态x3的响应曲线020406080100120140160180200-45-40-35-30-25-20-15-10-505PID控制时U的响应曲线PID控制时U的响应曲线分析:增大R05101520-50510时间/sec响应Q=diag(1,0,0),R=2时状态响应曲线x1x2x305101520-10-505时间/sec响应Q=diag(1,0,0),R=2时控制输入U的响应曲线0204060-50510时间/sec响应Q=diag(1,0,0),R=2000时状态响应曲线x1x2x30204060-0.3-0.2-0.100.1时间/sec响应Q=diag(1,0,0),R=2000时控制输入U的响应曲线对比(1)(2)可知,当Q不变,R增大时,达到稳态所需时间变长,即响应时间变慢;但波动幅值变小,反馈矩阵变小。增大Q11时05101520-50510时间/sec响应Q=diag(1,0,0),R=2时状态响应曲线x1x2x305101520-8-6-4-202时间/sec响应Q=diag(1,0,0),R=2时控制输入U的响应曲线05101520-50510时间/sec响应Q=diag(10,0,0),R=2时状态响应曲线x1x2x305101520-30-20-10010时间/sec响应Q=diag(10,0,0),R=2时控制输入U的响应曲线对比(1)(3)可知,当Q对角线上第1个元素增大时,各相应曲线达到稳态所需时间变短,即响应快;但波动幅值变大,反馈矩阵增大。增大Q22时05101520-50510时间/sec响应Q=diag(1,0,0),R=2时状态响应曲线x1x2x305101520-8-6-4-202时间/sec响应Q=diag(1,0,0),R=2时控制输入U的响应曲线0204060-50510时间/sec响应Q=diag(1,100,0),R=2时状态响应曲线x1x2x30204060-8-6-4-202时间/sec响应Q=diag(1,100,0),R=2时控制输入U的响应曲线对比(1)(4)可知,当Q对角线上第2个元素增大时,x1、x2曲线达到稳态所需时间较长,即响应较慢,平缓地趋近与零;状态x3,控制输入U达到稳态所需时间变短,即响应快;反馈矩阵最大。综上所述,Q=diag(1,0,0),R=2时,系统各方面响应较好。矩阵Q变大时,反馈矩阵变大;当Q对角线上第1个元素变大时,各曲线波动幅值变大,达到稳态所需时间变短;当Q对角线上第2个元素变大时,各曲线波动幅值变大,达到稳态所需时间,状态x1、x2增长,状态x3,控制输入U变短;当R变大时,反馈矩阵变小,各曲线波动幅值变小,达到稳态时间变长。根据实际的系统允许,应该适当选择Q和R。根据性能指标函数的调试经验可知,当Q(t)矩阵中的某一元素的权值响应增加时,系统的快速响应性得到提高,同样系统会产生自激,系统损耗了更多的能量,如同PID控制中增大P值的效果。当R(t)阵中某一元素的权值增大时,系统响应迟钝,抖动幅度小,消耗的能量减小,动态性能差。总之,Q(t)、R(t)的选择原则是:如果想提高控制的快速响应性,可以增大Q(t)中相关元素的比重。如果想要抑制控制量的幅值及其消耗的能量,可以增大R(t)中相关元素的比值。LQR&PID02468101214161820-3-2-101时间/sec响应Q=diag(1,0,0),R=2时状态X2响应曲线x12020406080100120140160180200-3-2-101时间/sec响应PID控制时状态x2的响应曲线02468101214161820-50510时间/sec响应Q=diag(1,0,0),R=2时状态X1响应曲线x1020406080100120140160180200-50510时间/sec响应PID控制时状态x1的响应曲线状态X3和U02468101214161820-10-505时间/sec响应Q=diag(1,0,0),R=2时控制输入U的响应曲线0102030405060708090100-60-40-20020时间/sec响应PID控制时输入U的响应曲线02468101214161820-2-101时间/sec响应Q=diag(1,0,0),R=2时状态X3响应曲线x3020406080100120140160180200-3-2-101时间/sec响应PID控制时状态x3的响应曲线LOREMIPSUMDOLORLoremipsumdolorsitamet,consecteturadipisicingelit,seddoeiusmodt
本文标题:LQR和PID控制器在飞行器高度控制中的应用
链接地址:https://www.777doc.com/doc-2885523 .html