您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 无线通信协议1(0)
一个放大转发协作通信的动态博弈模型摘要合作无线通信协议是以这样的假设用户总是表现以一个社会有效的方式而设计的。这种假设在商业无线网络中可能没有充分的根据,用户可能在没有任何成本情况下违反合作的规则而获得合作的好处。不遵守规则的合作创造了一个社会难题,其中行为端正的用户对其他用户展示出不确定性。在社会困境中合作是以一个非合作的纳什均衡为特征的,这表明了在没有建立一种机制来检测和减轻不端行为的影响而来维持一个最佳社会合作的困难。在本文中,我们制定的用户互动在合作放大和转发以不完全信息作为一个动态博弈。我们发现存在一个完美贝叶斯均衡。标引词——Adhoc网络,通信系统的安全性,合作的多样性,博弈论1.介绍合作多样性设想提供一些对于单一天线的用户德多输入多输出系统(MIMO)的好处。所设想的性能优势,通过合作多样性协议的实现,如放大转发(AF)协议它表现出极大地提高系统的性能[1]。合作多样性协议的设计是基于直接互惠的原则,目的是凡是用户以获得同样的利益的预期积极地帮助他人实现合作分歧利益时,被帮助用户将会回报。当每个用户服从合作的规则(即后续直接互惠),一个稳定和社会的有效的合作是可以实现。在无线网络中在一个单一的实体控制之下,这可能是真的,因为合作仅限于有一个共同的目标用户。另一方面,在商业无线网络中的用户可能故意不报酬,不采取相应的违反合作的规则获得合作不承担代价好处。请注意,打算偏离规则的合作是出于节约能源的愿望。因此,在商业无线网络中,一个社会性的有效的合作,在没有引入一个通过避免不礼貌的行为的机制前,可能不容易完成。为确保用户遵守规则的合作提出了各种机制。在文献[2,3]中,一个对于Tat策略的GenerousTit被提出,它将驱使一个为Pareto优化纳什均衡的合作博弈的操作意图。基于合作方案的定价在文献[4]中提出,在使用者因为信道使用被收费时,在任何时候,它传送它自己的数据,当它为其他用户传送石,并得到补偿。文献[5]中的定价方案,[4]的范围被扩大到合作的多样性。在前面提到的工作中,合作的的博弈理论正规化,特别是上述作品和文学一般而言,假定一个静态博弈模型,其中让玩家同时作出决定。换句话说,当他们作出决定时,用户没有注意到他们的合作者采取的行动。因此,一个静态博弈模型没有很好捕捉动态的用户互动合作的多样性。在[6]中,最近一个动态贝叶斯游戏框架已经被提出,将模型路由约束在无线AdHoc网络。本文中提出的方法正是由文献[6]的成果启发。在本文中,我们构想用户的互动在合作AF中以不完整的信息作为一个动态博弈。动态博弈公式表示捕捉和合作通信的信息结构。一个动态博弈的瞬时结构定义游戏规则:合作以顺序的方式传输,其中一个来源用户首先传输,然后再决定潜在合作者或者合作(处理接收信息使用AF并传输它)或偏离合作。合作传输的顺序性质是取决于半双工约束的无线设备,即中继终端不能同时在同一频段内接收和发送。一个动态博弈得信息结构的的特点他们每个游戏者都知道什么时候作出决定:在商业无线网络每个用户的意图是事先不知道,因此,游戏的不完整的资料规格代表着每个用户的不确定性,依靠网络中的其他使用者的意图。由于中继终端观测来源终端后作出行动决定,用户的合作互动是一个Stackelberg(领袖跟随)博弈。一个不完整的资料的动态博弈是在贝叶斯框架内被研究的,因此,我们指的是作为贝叶斯博弈的博弈模型。我们表明,所提出的动态博弈模型满足的条件是为了一个完美贝叶斯均衡的存在。论文的其余部分安排如下。第2节中,我们为了合作的AF描叙系统模型。第3节中,我们介绍一个动态博弈模型为了合作多样性使用AF。最后,在第4节,我们目前的结论性意见。2.系统模型我们认为,N-用户的TDMA系统基于合作多样性系统,其中用户为彼此使用合作AF发送信息,我们认为,用户(源终端)在其所有邻近的用户中选择最大的一个潜在的合作者(中继)。我们认为,每个用户(包括有意的接收者)之间的传输经历着独立的瑞利衰落。我们指的在信源和有意接收者,来源和中继器和中继器和接收者之间的信道的γ1,γ2,γ3瞬时信号信噪比(SNR)。信息在M位的一个帧长度以Rb/s的速率被传送。我们假设,所有用户传输时以相同的能耗级别和调制速率。2.1合作的AF在合作的AF中,一个用户放大从它的合作者中收到的信号衰减和噪声的形式,然后将发送给它的接收者。其放大系数,记作β,是一个跨用户信道增益的功能和受接收者能力的限制[1]。2.2合作规则我们认为,用户形成一个合作伙伴关系,其中每个用户断言它的意愿是通过一项议定书握手合作。一个合作的意愿可能表明用户(中继)有足够的有效能力来为了合作而花费。它也可能表明鼓励其他用户的合作行为一个意图。2.3合作的好处和成本合作的好处能够通过平均帧成功率(FSR)来测定FSR=[1-BER]M(1)其中BER是平均接收比特错误概率,由下式给出如果BPRK调制,dzexQxx2221)(。它被显示出来,AF表现关键错误性能增益在SISO文献[7]上。为了握手协议和转发信息比特流,由一个延迟终端的PR合作的成本是能量消耗的总和。PR=PR,data+Phandshake(2)其中PR,data为花费在前向数据上的能量,Phandshake为花费建立合作伙伴关系上的能量。信息比特位的合作传输的所有的能量花费是由pI=pR,data+pS,data给出,其中pS,data是信源终端的能量花费。记phandshake(pS,data,pR,data).2.3.1效用函数在文献[8]中,无线网络的效用函数被定义为一种方法,为一定程度的信息的数量位收到每焦耳的总能量消耗。ui=(Ti(p)/p)bits/Joule(3)在Ti(p)=W×FSR是用户ui的吞吐量,W为带宽,P=pI+phandshake是合作的总成本。请注意,phandshake有助于零效用,因为没有信息位期间转交议定书握手。因此,(3)定义了一个有好行为的效用函数,即pI→0,ui→0和PI→0,ui→0。我们证实效用函数的行为如图.1所示。3.对于合作的放大和转发的动态博弈模型我们认为,合作的好处和它承担的费用是普通常识。也就是说,用户愿意花费自己的资源,以帮助其他用户实现可靠的通信,当他们的合作伙伴获得回报时,以期望实现这些同样的好处时。我们假定理智的和聪明的用户的意图是最大化其个人效用。我们认为阶段博弈是迟早发生的,tk,k=0,1,。。。,其中在每个博弈阶段tk,源和中继站重复互动为期以一个T秒的持续。在一个阶段博弈的多重合作互动的假设跨越多个多重时间段。期间T的每一个阶段博弈TK可能被定义为合作传输以达到预定的目的地所花费的时间。我们认为,阶段博弈T的持续时间对于计算信道变化的效能是足够长。这显然是清楚地表明,当一个源终端i(i∈(1,2,。。。,N))开始传递到网络上时,一个新阶段的博弈开始。我们每个延迟终端j和信源终端i的下个行为的下个特征是在一个动态贝叶斯博弈框架中。3.1中继行为我们假设,中继终端维护私有信息的行为属于他们的行文(即,要么合作,或行为不当)。每个转播终端j在贝叶斯博弈中对应种类标记。这套类型可利用中继终端j构成中继终端的类型空间界定为Θj=(θ0=合作,θ1=行为不当)。因为每个终端j或者符合合作或偏离它,Θj也是博弈的全球型空间,即∀θj∈Θj。依照下面的贝叶斯标记,比赛者j的类型是由θj标记的而其他参赛者的类型是由θ-j标记,而θj,θ-j∈Θj。我们假设,与每个中继终端有关的类型都是独立的。每一个中继终端j绘制一个行动空间Aj,它定义了一套行动aj(tk),提供给θj类型的参赛者。我们认为这种类型的终端J和相关的行动a(tk)未在一个阶段博弈上改变。事实上,服从合作规则的中继并没有在每一个阶段的博弈改变其类型。另一方面,一个行为不端的中继可能改变其总体类型,在每个阶段博弈时。在本文中,我们假定一个失常行为的中继采用行为策略,其中随机的在每一个阶段博弈中改变其行为。分配行为战略σj分配一个有条件的概率超过Aj,即σj=p(aj(tk))|htk,θj)。图2博弈树代表一个实例AF动态贝叶斯博弈的例子,其中中继器采用行为策略,即它随机咋合作和不当行为之间交换。节点N代表分配给每个参赛者的类型。中继终端的行为策略是由在每个时间点的两个节点为代表的。Ck周围的曲线表明中继终端不知道哪个行为(合作或行为不当)类型会分配给它。在动态博弈术语中,中继终端在它的信息集中有两个节点。另一方面,Si有一个单一的类型(其信息集是单一的),也就是说,当它的信息传送时,它传输到网络。例如,一个符合合作中继转播的设备也有一个单独的信息集。请注意,调理是基于博弈的历史和中继的种类。我们定义博弈的历史在博弈的开始阶段,tk是htk=(a(t0),(t1),...,a(tk-1))。它是安全的,一个中继当它选择自己的行动时,违反合作的规则可能不需要遵守博弈历史。我们认为,在一个合作的AF里对一个行动空间和概念类型给出一个深刻的理解。定义B=aj(tk)β在中继终端的放大,其中aj(tk)捕捉中继终端的行为,类型b,θj和β的j是扩增由于在中继器中信道和能量制约。我们在下面说明各种类型的中继终端j,中继终端j服从合作的规则:在这种情况下θj=0,它的行动空间是Aj={1}。终端j将发挥纯策略aj(tk)=1(即σj=1),假设源终端i是类型θi=0,其中htk=(1,1,…,1)。扩增器B因此是动态信道的一个功能,和合作者的能量限制,B=β。中继终端j违反合作规则以概率论的方式:在这种情况下,中继的类型jj是θj=1,且其行动空间被获取,在随机变量Aj中,其中,Aj={0,1}。请注意,错误行为中继将不遵守博弈的规则,也就是说,它不会考虑到博弈的历史,在作出决定时。中继器的行动aj(tk)是从它的类型θj=1到A映射,即aj(tk)=1,以σj和aj(tk)=0与1-σj,其中σj=p(aj(tk))|θj)是行为策略。扩增然后是B∈{0,β},这表明,一个错误行为的终端拒绝以1-σj的概率发送(B=0)或为信息终端(B=β)以概率σj发送比特信息。请注意,一个中继可能总是拒绝着在这种情况,在概率σj=1下aj(tk)∈Aj={0},显然B=0。一个智能(但利己)中继类型为θj=1企图通过降低其能量到一个随意级来欺骗,当为它的合作者发送信号时。中继的目标是最大限度地发挥其中继作用,以尽量减少其合作成本。利己中继器j的行动空间然后是Aj=(0,…,1),其发生的概率σj=p(aj(tk))∈Aj|θj=0)。这将导致一个扩大Bβ,由于0aj(tk)1。请注意,一个终端开发动态的信道展示这样的模棱两可的行为逃避检测机制(如果有的话)。这种由各种中继器类型衍生的效能如图3中所示。3.2来源终端的行为即使每一个潜在的合作伙伴保持私人资料,来源终端信仰每个中继终端j的可能类型。源终端i的信仰μji(θj|θi,htk)定义其概率,中继终端j的类型是θj给源终端i的类型和博弈的历史。我们认为信仰是独立通过整个网络。并且每个源终端i指定一个严格正信仰,在每个中继终端的j(j=1)的类型θj,即μij(θj|θi,htk)0。这是直观有效的在商业无线网络中,其以动态的用户人口为特点,那里可能很难有明确的关于每个使用者的行为的先验知识。中继终端了解博弈的信仰结构,尽管每一个人信仰来源终端目前尚不清楚。值得注意的是,通过保持信仰用户偏离假设,如在现有的合作协议里,其合作伙伴都愿意合作。因此,信仰是一种安全参数,在不端行为的面前确定源终端i的最优策略。用户的信仰是以已对其他用户的合作多样性系统的信任程度为特点的。例如,用户可以从信任的使用者的合作行为中期待一个高的可能性。3.3信仰体系相信系统定义更新来源终端的信仰i,使用贝叶斯规则,在每个博弈阶段最后tk。我们假设每一个源终端i监视器合作互动为了了解中继终端j的类型,使用不端行为检测技术,如[10]中的。检测机制的输出用来更新源终端i的信仰在博弈tk的最后
本文标题:无线通信协议1(0)
链接地址:https://www.777doc.com/doc-2410787 .html