您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 通信信道的随机线性控制
通信信道的随机线性控制SekharTatikonda会员IEEEAnantSahai,会员IEEESanjoyMitter终身会员IEEE摘要我们研究线性随机控制系统时,有一个通信信道连接传感器到控制器。问题由信道编码器和解码器以及控制器满足某些给定的控制目标的设计。特别是,我们检查的作用传播对经典的线性二次高斯问题。我们给的条件下,估计和控制之间的持有和确定性等价控制律优化经典的分离性能。然后我们提出了连续的率失真框架。我们目前所能达到的性能界限和显示控制和通信成本之间固有的权衡。特别是,我们证明了最优二次型成本分解为两个方面:一个完整的知识成本与顺序的率失真成本。指数条款确定性等价控制,通信约束的网络控制,顺序,分离,率失真,线性随机系统。一、引言最近的技术进步已经引导网络控制系统的设计活动的增加。在本文中,我们研究一个随机控制问题,那里是一个通信信道连接传感器到控制器。这个问题出现时,控制器和设备,在地理位置上是分离的,有一个带限和可能是嘈杂的通信信道连接。此外,出现时,控制器和设备之间没有大的地理分离的通信约束,但有一个共享的通信介质,被用在在同一地区的其他用户,或作为更大的系统的一部分。虽然我们不明确地检查每一本文的网络问题,我们认为,通信约束的作用,一个基本的了解,将是一个更完整的网络控制理论的本质。我们考虑的系统是由一个设备,一个编码器,信道,解码器,和一个控制器。设备和信道是直接给我们的。我们的任务是设计的编码器,解码器,控制器,以满足某些给定的控制目标。因为我们有一个分布式信息系统模式的选择,[26],可以有显着的影响控制性能是可以实现的。我们讨论了在编码器的信息模式的选择上需要实现控制目标的通信要求的影响。尤其是,我们研究的对象,传播对经典的线性二次高斯(LQG)问题。为此我们提出的顺序的率失真(SRD)框架。我们得到的边界上所能达到的性能和显示控制和通信成本之间固有的权衡。特别是,我们将最优LQG成本分解为两个方面:一个完整的知识成本与顺序的率失真成本。手稿收到2003年6月4日;2003年12月19日修订。由客座编辑P.antsaklis和J.Baillieul推荐。这项工作是由美国陆军研究办公室在穆里格兰特:传感器数据融合在大的daad19-00-1-0466阵列,并由国防部在穆里格兰特:协同控制subaward复杂自适应网络03-132。S.Tatikonda,美国耶鲁大学,纽黑文,CT06520USA(电子邮件:ekhar.tatikonda@yale.edu)。A.Sahai,加利福尼亚大学伯克利分校,CA94720USA。S.Mitter,美国麻省理工大学,剑桥,MA02139USA。数字对象标识符10.1109/tac.2004.834430。有两个经典的概念,在本文中我们研究的分离。第一个概念是状态估计和控制之间的控制理论的分离。我们目前的条件下,确保确定性等价控制律的最优性。这些工作是建立在Bar-ShalomandTse[3]的基础上。第二个是信源编码和信道编码之间的信息理论的分离。特别是,在长时间的延迟的限制下,它是已知的可以不失一般性的,设计的信源编码器和信道编码器分别[11]。这种分离是众所周知的应用广泛,[25],但是,在一般情况下,失败的短期延迟和不稳定的过程。在大量的延迟限制下,[18]表明不稳定过程的估计可以适当修改分离定理,但这个信息理论的结果并不延伸到有限的延迟的情况下。由于延迟是一个重要的问题,在控制中的应用我们不能用信息理论的分离效果,去解决我们的问题。处理这种延迟的问题,我们提出了连续的率失真框架首先介绍[13]和进一步发展[19],[20],和[23]。Bansal和Basar研究一类随机系统的策略[2]和控制测量的同步设计。Borkar和Mitter介绍了LQG控制在通信约束下存在问题的[6]。他们着眼于稳定系统和无声的数字频道。他们提出新的编码方案。不幸的是,他们的计划不能让不稳定的系统工作。我们推广不稳定系统,噪声信道等一些成果。此外,我们给的条件下,我们的编码方案是最优的,分离的原则,和确定性等价控制器优化。Nair和Evans[17]检查均方稳定在一个无噪声信道。。相反,我们研究的LQG性能在噪声和无噪声信道。参考[7]研究非经典信息模式的马尔可夫决策问题中的作用。我们要用不同的信息模式在编码器的LQG问题扩展了这些结果。不受控制的马尔可夫过程的最优顺序量化方案的设计是在[8]中研究。最近,有很多的研究工作确定系统的通信约束下进行的:[10],[19],[21],[22],[15],[1],[27],和[28]。在[21]和[22],我们研究了确定性系统在无噪声和嘈杂的通道。我们这里的工作不同,我们对随机系统,提供了一个通用的分离结果,应用SRD[23]框架的去解决LQG问题,和讨论各种条件下,与设备相匹配的通道。本文应用工作中出现的初步形成[24]和代表第一作者的博士论文的一部分[19]。在第二节中,我们制定的问题。在第三节中,我们研究了LQG问题在不同的信息模式下和不同的沟通渠道的处理方式。在第四部分中,我们介绍顺序的率失真框架和封闭形式的解决顺序的率失真高斯马尔可夫函数的来源。在第五节中,我们研究某些特定的情况下。二、问题描述在这里,我们提出问题的不同的组件。a)设备:我们考虑以下的离散时间,随机,线性系统:Xt+1=FX+GU+Wt,0t(1)在{Xt}是Rxl值状态的过程,{t}是一个RM值控制过程,与{Wt}是独立同分布(IID)的零均值和协方差Kw的高斯随机变量序列。初始位置x0均是零值的高斯协方差kx0。让FRd*d,GRd*m并且设(F,G)是一个可控的对象。解码器的输出过程{Yt}是Rd值的过程。输出Yt表示系统的状态在t时刻的解码器的估计值,见图。1。大写的变量,如X,代表随机变量和小写的变量一样,象代表特定的变量。在本文中,“log”是指俩对数的底。令t=(0,...,t)的。b)信道:信道的输入和输出的空间来分别用表示字母A和B来表示。在本文中,我们把自己限制于时不变的无记忆信道可以被建模为随机内核:P(dBt|at)。具体地,对于每个实现At=at元素在给定的条件概率由P表示P(dBt|at)。在时间t时的编码器产生的信道输入处At=at与该信道根据概率P(dBt|at)输出信道输出符号的Bt。香农容量定义为Ccap=supP(dAt)I(At;Bt),其中I(,;.)是通道的输入和输出之间的互信息。请参阅附录中的互信息进行审查。在本文中,我们研究两个特殊的渠道。无声的数字通道与速率R:该通道的输入和输出的字母是相同的:A=B。字母表的大小为|A|=2R其中R被称为信道的速率。该频道是无噪音,无记忆:P(dBt|at)=δ{Bt=at}(其中δ是Dirac测度)在这种情况下Ccap=R。无记忆的矢量高斯信道:信道的输入和输出的字母:A=B=Rd。他的通道是无记忆的:Bt=+Vt,{Vt}是高斯随机变量独立同分布的序列与零均值和协方差Kv。他输入符号{At}满足功率约束:E(||At||22)≤P,t.他的信道是经常被用来作为一个无线信道的简化模型。该supremizing输入分布P(dAt)可以是零,向量值,高斯随机变量。因此,E(||At||22)=Tr(KA)。参见[9]更多细节。它的容量如下:||||log21Cmax)K(capKVKVKAPAtr用|K|表示K行列式。c)信息模式:我们的任务是设计一个编码器,解码器,控制器来实现我们的控制目标。因此我们需要指定这些组件中的每一个信息模式[26]。有五种类型的信号:状态Xt,通道输入At,输出通道Bt,解码器输出Yt和控制Ut.。以下顺序代表了因果顺序在该系统中的事件发生的时间顺序:X0,A0,B0,Y0,U0,...Xt-1,At-1,Bt-1,Yt-1,Ut-1,(2)。编码器:我们编码器模型在时间t作为一个随机内核:P(dAt|xt,at-1,bt-1,yt-1,ut-1)。确定性的编码器建模为狄拉克模型。一般认为,注意,有五个潜在的反馈的编码器类型。我们将探讨三种不同的信息模式。A)这一信息模式代表了在编码器完整的知识。在这信息的模式,信道输出和解码器的输出是不可用的编码器。在这信息的模式,只有当前状态提供给编码器。信息模式B),随着时间的排序(2),意味着At独立于,Yt-1条件是Xt,At-1,Ut。同样的信息模式C意味着独立的条件是Bt-1,Yt-1,At-1,Ut。解码器:我们模型的解码器在时间t作为一个随机的内核:P(dYt|Yt-1,Bt-1,Ut)。他信息的模式随着时间排序(2)意味着,Yt是独立的,At给的Bt,Yt-1,Ut-1。正如我们将看到的,解码器的输出可以被视为是对设备状态的估计。控制器:我们模型控制器在时间t作为一个随机的内核:P(dUt|yt)。信息的模式随着时间排序(2)意味着,UT是独立的Xt,At,Bt,Yt-1,Ut-1条件是Yt。请注意,我们假设控制器将输入的译码器输出。因此,有解码器和控制器之间是分离结构的。我们给的条件下,这种分离结构可以被假定为不失一般性。显然,更多的信息在编码器可以将导致更好的控制性能。信息模式A)可以被看作是最好的方案和信息模式C)可被视为最坏的情况。有许多信息的模式在这两个极端之间,信息模式B)是一个这样的信息模式。正如我们将看到的,一个模式信息A)的重要特征是编码器知道解码器的状态。我们将讨论这种自然发生的情况下。信息模式B)的重要特征是编码器使用以前的控制信号Ut。这里,我们设想在编码器在地理上与设备并列配置,因此,可以通过观察设备的两个状态以及应用该设备的控制动作的情况。最后,在用信息模式C)建模的情况下,观察编码器是不是用以前的控制信号。d)互连和绩效目标:为了考虑性能的目的,我们需要确保有感兴趣的变量定义的联合测量有效。我们的设备和信道。每个编码器,解码器,控制器满足所需的信息模式,我们可以interconnectthe不同随机内核一起产生以下关节测量:请注意,这个联合措施保持动态的设备和通道以及维护的编码器,解码器和控制器的信息模式。设P表示所有这样的联合措施集:P(dXt-1,dAt-1,dBt-1,dyt-1,dUt-1)。我们的绩效目标的LQG成本Q和S是正定的。我们的目标是最小化的LQG成本(3)在所有的措施在P与所给出的设备,通道一致设定的信息模式。我们也对信道的性能感兴趣,例如的速率和功率,以及在编码信息模式的选择可以最小的LQG性能成本的影响。e)顺序的率失真:一个角色的反馈环节,从编码器的解码器是传达信息的目的是减少控制器的系统状态的不确定性。在时间t的状态的演变是由由于解码器访问控制信号Xt不确定性是由原始的随机变量确定的X0和{Wt},标准的解码器的估计值由下式给出在信道上发送的信息仅于确定X0和{Wt}有关。因此,它是有意义的不受控制的动力学研究:我们将在第四节中,我们介绍顺序率distortionframework失控的动力学。他是了解信息的适当的框架,以控制相关目标,应通过通信信道发送信息。三、LQG性能目标在这里,我们考虑的条件,确保了确定性等价控制器的优化。我们表明,LQG成本可以分解成一个完整的知识成本与一部分知识成本。记得我们的目标是最小化给定的长期平均成本(3)。全状态下观察,这是众所周知的,最佳的稳定状态控制法是线性增益的形式Ut=LXt方式如下和P满足Riccati方程最佳的成本由下式给出此外,这些结果继续持有的LQ问题的过程干扰{Wt}在(1)不再是高斯问题,但不相关的零均值和协方差矩阵Kw常见。如果继续指定了二阶分离统计量结果的把握。这些结果为标准,可以在[5]。通信信道的加入将充分观察到的LQG控制问题的先前所示为部分可观测的LQ控制问题。观测的结构是由两个通信信道编码器和解码器的选择与确定。A.确定性等价我们现在提出的条件,确保确定性等价控制律的最优性:Ut=LYt。在Yt=E(Xt|Bt,U
本文标题:通信信道的随机线性控制
链接地址:https://www.777doc.com/doc-2006136 .html