您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第13章-信号博弈及其应用
第四部分:不完全信息动态博弈第十三章信号博弈及其应用主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈第十三章信号博弈及其应用ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•信号博弈(signalinggames)是一类比较简单而应用相当广泛的不完全信息动态博弈,其基本特征是博弈参与人分为信号发送者(Sender,用S表示)和信号接收者(Receiver,用R表示)两类,信号发送者先行动,发送一个关于自己类型的信号,信号接收者根据所接收到的信号选择自己的行动。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng其具体博弈时序如下:1)自然根据特定的概率分布p(ti),从可行的类型集T={t1,t2,…,tn}中选择发送者类型ti,这里,对,p(ti)0且p(t1)+…+p(tn)=1;2)发送者观测到ti,然后从可行的信号集M={m1,m2,…,mJ}中选择一个发送信号mj;3)接收者不能观测到ti,但能观测到mj,他从可行的行动集A={a1,a2,…,aK}中选择一个行动ak;4)双方分别得到收益uS(ti,mj,ak)和uR(ti,mj,ak)。{1,2,,}inControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在信号博弈中,发送者发出的信号依赖于自然赋予的类型,因此,先行动的信号发送者的行动,对后行动的信号接收者来说,具有传递信息的作用。同时,这又使得接收者的行动依赖于发送者选择的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察信号博弈的一种简单情况的扩展式描述(不考虑支付)p1p1t自然发送者发送者2t接受者接受者1m1m2m2m1a1a1a1a2a2a2a2a1x2x3x4x5x6xControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•发送者的信息集为Is(x1)和Is(x2),分别对应于观测到自然的选择为t1和t2,行动为m1和m2,因此,发送者的战略s为:•其中,HS为发送者的信息集集合,即:SsHM12{({}),({})}SSSHIxIxControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng发送者有以下4种纯战略:1)战略(m1,m1)——如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;2)战略(m1,m2)——如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m2,即s(t2)=m2;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng3)战略(m2,m1)——如果自然赋予t1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;4)战略(m2,m2)——如果自然赋予t1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m2,即s(t2)=m2。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于接收者,其信息集为IR({x3,x4})和IR({x5,x6}),分别对应于观测到信号m1和m2,行动为a1和a2,因此,接收者的战略s为:•其中,HR为接收者的信息集集合,即HR={IR({x3,x4}),IR({x5,x6})}。:RsHAControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng接收者有以下4种纯战略:1)战略(a1,a1)——如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a1,即s(m2)=a1;2)战略(a1,a2)——如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng接收者有以下4种纯战略:3)战略(a2,a1)——如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a1,即s(m2)=a1;4)战略(a2,a2)——如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在发送者的4个战略中,根据发送者的类型与发送信号间的相互关系,可将发送者的战略分为两类——混同战略和分离战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•1)对于第1和第4个战略,由于在不同类型时发送者都发出相同的信号,因此称其为混同(pooling)战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在多于两种类型的模型中,还存在部分混同(partiallypooling)战略,其中所有属于给定类型集的类型都发送同样的信号,但不同的类型集发送不同的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•2)对于第2和第3个战略,由于在不同类型时发送者发出不同的信号,因此称其为分离(separating)战略,分离战略意味着不同类型的发送者发出不同的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•与混同战略相似,在多于两种类型的模型中,还存在准分离(semi-separating)战略,其定义与部分混同战略相同。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在信号博弈中还存在与混合战略相类似的战略,称为杂合战略(hybridstrategy)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈第十三章信号博弈及其应用ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•为了求解信号博弈的精炼贝叶斯Nash均衡,需将精炼贝叶斯Nash均衡定义中的条件(1)~(4)分别施加到信号博弈之上。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•1)由于发送者知道自己的类型,其选择发生于单决策结信息集,因此,精炼贝叶斯Nash均衡定义中的条件(1)在应用于发送者时就无需附加任何条件;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•相反,接收者在不知道发送者类型的条件下观测到发送者的信号,并选择行动,也就是说接收者的选择处于一个非单决策结的信息集上,因此,需将精炼贝叶斯Nash均衡定义中的条件(1)应用于接收者的信息集。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当精炼贝叶斯Nash均衡定义中的条件(1)应用于信号博弈接收者的信息集时,可得信号条件(1)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(1)•在观测到M中的任何信号mj之后,接收者必须对哪些类型可能会发送mj,持有一个推断。这一推断用概率分布表示,其中对,且()ijptmitT()0ijptm()1iijtTptmControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•2)给定发送者的信号和接收者的推断,精炼贝叶斯Nash均衡定义中的条件(2)要求接收者选择最优行动,因此,需将精炼贝叶斯Nash均衡定义中的条件(2)施加于接收者的行动。此时,可得到信号条件(2R)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(2R):•对M中的每一mj,并在给定对的推断的条件下,接收者的行动必须使接收者的期望效用最大化,即()ijptm*()jam*()arg(,)kjRjkaAamMaxUmaControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•精炼贝叶斯Nash均衡定义中的条件(2)同样需施加于发送者的选择,但由于发送者的选择发生于单决策结信息集上,发送者拥有完全信息,并且发送者只在博弈的开始时行动,因此,精炼贝叶斯Nash均衡定义中的条件(2)施加于发送者的选择时,必须满足信号条件(2S)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(2S):•对T中的每一ti,在给定接收者战略的条件下,发送者选择的信号必须使发送者的效用最大化,即*()jam*()imt**()arg(,,())jisijjmMmtMaxutmamControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•3)给定发送者的战略,用Tj表示选择发送信号mj的类型ti的集合,即•如果Tj不是空集,则对应于信号mj的信息集就处于均衡路径之上;否则,若任何类型都不选择mj,则其对应的信息集处于均衡路径之外。*imt*{}jiijTtmtmControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对处于均衡路径上的信号,将精炼贝叶斯Nash均衡定义中的条件(3)运用于接收者的推断,可以得到信号条件(3)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(3):•对中每一mj,如果在T中存在ti使得则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和发送者的战略:*ijmtm()()()()()kjjiiijjkktTpmtptp
本文标题:第13章-信号博弈及其应用
链接地址:https://www.777doc.com/doc-5030068 .html