第13章-信号博弈及其应用

第四部分：不完全信息动态博弈第十三章信号博弈及其应用主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈第十三章信号博弈及其应用ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•信号博弈(signalinggames)是一类比较简单而应用相当广泛的不完全信息动态博弈，其基本特征是博弈参与人分为信号发送者(Sender，用S表示)和信号接收者(Receiver，用R表示)两类，信号发送者先行动，发送一个关于自己类型的信号，信号接收者根据所接收到的信号选择自己的行动。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng其具体博弈时序如下：1)自然根据特定的概率分布p(ti)，从可行的类型集T={t1,t2,…,tn}中选择发送者类型ti，这里，对，p(ti)0且p(t1)+…+p(tn)=1；2)发送者观测到ti，然后从可行的信号集M={m1,m2,…,mJ}中选择一个发送信号mj；3)接收者不能观测到ti，但能观测到mj，他从可行的行动集A={a1,a2,…,aK}中选择一个行动ak；4)双方分别得到收益uS(ti,mj,ak)和uR(ti,mj,ak)。{1,2,,}inControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在信号博弈中，发送者发出的信号依赖于自然赋予的类型，因此，先行动的信号发送者的行动，对后行动的信号接收者来说，具有传递信息的作用。同时，这又使得接收者的行动依赖于发送者选择的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察信号博弈的一种简单情况的扩展式描述(不考虑支付)p1p1t自然发送者发送者2t接受者接受者1m1m2m2m1a1a1a1a2a2a2a2a1x2x3x4x5x6xControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•发送者的信息集为Is(x1)和Is(x2)，分别对应于观测到自然的选择为t1和t2，行动为m1和m2，因此，发送者的战略s为：•其中，HS为发送者的信息集集合，即:SsHM12{({}),({})}SSSHIxIxControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng发送者有以下4种纯战略：1)战略(m1,m1)——如果自然赋予t1，则发送者选择m1，即s(t1)=m1；如果自然赋予t2，则发送者选择m1，即s(t2)=m1；2)战略(m1,m2)——如果自然赋予t1，则发送者选择m1，即s(t1)=m1；如果自然赋予t2，则发送者选择m2，即s(t2)=m2；ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng3)战略(m2,m1)——如果自然赋予t1，则发送者选择m2，即s(t1)=m2；如果自然赋予t2，则发送者选择m1，即s(t2)=m1；4)战略(m2,m2)——如果自然赋予t1，则发送者选择m2，即s(t1)=m2；如果自然赋予t2，则发送者选择m2，即s(t2)=m2。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于接收者，其信息集为IR({x3,x4})和IR({x5,x6})，分别对应于观测到信号m1和m2，行动为a1和a2，因此，接收者的战略s为：•其中，HR为接收者的信息集集合，即HR={IR({x3,x4}),IR({x5,x6})}。:RsHAControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng接收者有以下4种纯战略：1)战略(a1,a1)——如果发送者选择m1，则接收者选择a1，即s(m1)=a1；如果发送者选择m2，则接收者选择a1，即s(m2)=a1；2)战略(a1,a2)——如果发送者选择m1，则接收者选择a1，即s(m1)=a1；如果发送者选择m2，则接收者选择a2，即s(m2)=a2；ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng接收者有以下4种纯战略：3)战略(a2,a1)——如果发送者选择m1，则接收者选择a2，即s(m1)=a2；如果发送者选择m2，则接收者选择a1，即s(m2)=a1；4)战略(a2,a2)——如果发送者选择m1，则接收者选择a2，即s(m1)=a2；如果发送者选择m2，则接收者选择a2，即s(m2)=a2；ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在发送者的4个战略中，根据发送者的类型与发送信号间的相互关系，可将发送者的战略分为两类——混同战略和分离战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•1)对于第1和第4个战略，由于在不同类型时发送者都发出相同的信号，因此称其为混同(pooling)战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在多于两种类型的模型中，还存在部分混同(partiallypooling)战略，其中所有属于给定类型集的类型都发送同样的信号，但不同的类型集发送不同的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•2)对于第2和第3个战略，由于在不同类型时发送者发出不同的信号，因此称其为分离(separating)战略，分离战略意味着不同类型的发送者发出不同的信号。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•与混同战略相似，在多于两种类型的模型中，还存在准分离(semi-separating)战略，其定义与部分混同战略相同。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在信号博弈中还存在与混合战略相类似的战略，称为杂合战略(hybridstrategy)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈第十三章信号博弈及其应用ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•为了求解信号博弈的精炼贝叶斯Nash均衡，需将精炼贝叶斯Nash均衡定义中的条件(1)～(4)分别施加到信号博弈之上。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•1)由于发送者知道自己的类型，其选择发生于单决策结信息集，因此，精炼贝叶斯Nash均衡定义中的条件(1)在应用于发送者时就无需附加任何条件；ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•相反，接收者在不知道发送者类型的条件下观测到发送者的信号，并选择行动，也就是说接收者的选择处于一个非单决策结的信息集上，因此，需将精炼贝叶斯Nash均衡定义中的条件(1)应用于接收者的信息集。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当精炼贝叶斯Nash均衡定义中的条件(1)应用于信号博弈接收者的信息集时，可得信号条件(1)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(1)•在观测到M中的任何信号mj之后，接收者必须对哪些类型可能会发送mj，持有一个推断。这一推断用概率分布表示，其中对，且()ijptmitT()0ijptm()1iijtTptmControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•2)给定发送者的信号和接收者的推断，精炼贝叶斯Nash均衡定义中的条件(2)要求接收者选择最优行动，因此，需将精炼贝叶斯Nash均衡定义中的条件(2)施加于接收者的行动。此时，可得到信号条件(2R)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(2R)：•对M中的每一mj，并在给定对的推断的条件下，接收者的行动必须使接收者的期望效用最大化，即()ijptm*()jam*()arg(,)kjRjkaAamMaxUmaControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•精炼贝叶斯Nash均衡定义中的条件(2)同样需施加于发送者的选择，但由于发送者的选择发生于单决策结信息集上，发送者拥有完全信息，并且发送者只在博弈的开始时行动，因此，精炼贝叶斯Nash均衡定义中的条件(2)施加于发送者的选择时，必须满足信号条件(2S)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(2S)：•对T中的每一ti，在给定接收者战略的条件下，发送者选择的信号必须使发送者的效用最大化，即*()jam*()imt**()arg(,,())jisijjmMmtMaxutmamControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•3)给定发送者的战略，用Tj表示选择发送信号mj的类型ti的集合，即•如果Tj不是空集，则对应于信号mj的信息集就处于均衡路径之上；否则，若任何类型都不选择mj，则其对应的信息集处于均衡路径之外。*imt*{}jiijTtmtmControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对处于均衡路径上的信号，将精炼贝叶斯Nash均衡定义中的条件(3)运用于接收者的推断，可以得到信号条件(3)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(3)：•对中每一mj，如果在T中存在ti使得则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和发送者的战略：*ijmtm()()()()()kjjiiijjkktTpmtptp

第13章-信号博弈及其应用

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

制药行业ERP-U8流程应用演示

食品生产制度

第4章建筑排水工程

道路旅客运输企业安全管理规范A

旅游新书

proe模具设计指南(11章)第三章模具布局及收缩

【矿山建设】立井基岩冻结段中深孔爆破尝试

14000环境管理体系及法规（推荐ppt112）

成本与进程管理中文-2.1

财务管理学课件第三章确定性投资决策

相关文档

相关搜索

第13章-信号博弈及其应用

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

制药行业ERP-U8流程应用演示

食品生产制度

第4章建筑排水工程

道路旅客运输企业安全管理规范A

旅游新书

proe模具设计指南(11章)第三章 模具布局及收缩

【矿山建设】立井基岩冻结段中深孔爆破尝试

14000环境管理体系及法规（推荐ppt112）

成本与进程管理中文-2.1

财务管理学课件第三章确定性投资决策

相关文档

相关搜索

proe模具设计指南(11章)第三章模具布局及收缩