您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第14章-精炼贝叶斯Nash均衡的精炼
第四部分:不完全信息动态博弈第十四章精炼贝叶斯Nash均衡的精炼主要内容:一、精练贝叶斯Nash均衡的精炼二、其它形式的精炼均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、精练贝叶斯Nash均衡的精炼二、其它形式的精炼均衡第十四章精炼贝叶斯Nash均衡的精炼ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•一个博弈问题可能存在多个精炼贝叶斯Nash均衡,需要对精炼贝叶斯Nash均衡进行精炼,最简单和直接的方法就是对非均衡路径上的信念施加一些直观、合理的限制。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•常用的设定参与人在非均衡路径上信念的方法有两种:剔除劣战略法和直观标准。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng1.剔除劣战略•产生精炼贝叶斯Nash均衡多重性的一个重要原因就是精炼贝叶斯Nash均衡的定义对参与人在非均衡路径上的信念如何设定,没有给出明确的定义或规定。•因此,当博弈存在多个精炼贝叶斯Nash均衡时,到底哪一个均衡会实际出现,在很大程度上就依赖于如何定义或规定参与人在非均衡路径上的信念。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在精炼贝叶斯Nash均衡中,没有参与人的战略包含始于任何信息集的严格劣战略,因此,精炼贝叶斯Nash均衡排除了参与人选择的战略包含始于任何信息集的严格劣战略的可能性。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在精炼贝叶斯Nash均衡中,任何参与人都不应该认为其他参与人选择严格劣战略(或含有始于某个信息集的严格劣战略的战略)的概率大于0。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:21[]p[1]pLMLLRRR4,22,02,12,23,34,22,02,12,23,33,3LMRLR12ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•博弈存在两个纯战略Nash均衡(L,L’)和(R,R’);•两个纯战略精炼贝叶斯Nash均衡——((L,L),p=1)和((R,R’),p≤1/3)ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•M是参与人l的一个严格劣战略,因此,要让参与人2相信l可能选择了M是不合理的,1-p不可能为正,于是p一定等于l。如果推断1-p0不合理,则((R,R’),p≤1/3)不再是精炼贝叶斯Nash均衡。•此时,只有((L,L),p=1)成为满足这一要求的惟一的纯战略精炼贝叶斯Nash均衡。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:11[]p[1]pLMAABBR2,40,21,22,23,31,22BA1x2x3x2,41,23,30,22,23,31,21,21,21,21,21,2LRM,AA,AB12,BB,BAControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•M并不是参与人2在整个博弈中的严格劣战略,但在参与人1选择A的情况下(即假设参与人1将战略B剔除的情况下),M却是参与人2在信息集I2({x1})的严格劣战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信息集的严格劣战略:•考虑轮到参与人行动的一个信息集。战略si*为始于这一信息集的严格劣战略,如果存在另一个战略si使得对i在给定信息集可能持有的每一推断,并且对每一其他参与人后续战略可能的组合,i在给定信息集根据si选择行动并在其后根据si选择后续战略得到的收益,严格大于根据si*选择行动和后续战略得到的收益。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信念精炼标准1(C1):•在可能的情况下,在每一参与人均衡路径之外的推断中,如果一个节点只有在另一参与人选择始于某些信息集的严格劣战略时,才能够到达,则应认定到达这一节点的概率为0。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:jLLLRRR4,13,23,22,3jLLLRRR4,23,43,21,1i[]r[1]r[]q[]p[1]p[1]qijABix1ixjx1jx2jx3jxControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng,LL,LRRLj,RL,RRjiAB4,14,13,23,23,23,22,32,34,23,44,23,43,21,13.21,1,LL,LR,RL,RRRLiiControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•无论参与人i在信息集Ii({xi,xi+1})上的信念如何,R是参与人i在Γ’(即始于信息集Ii({xi,xi+1})的后续博弈)上的严格劣战略,因此,根据信念精炼标准1可得:1-p=0,1-q=0。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng注意:1)信念精炼标准1只是“在可能的情况下”,作为精炼参与人在均衡路径之外推断的标准,并非任何情况下都适用。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:21[]p[1]pLMLLRRR2,20,22,12,23,31x2xControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•参与人1,M和R都劣于L。在这种情况下,不可能在推断中令到达节点x1和x2的概率都为0,于是信念精炼标准1不再适用。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng2)对于信号博弈的精练贝叶斯Nash均衡,可将信念精炼标准1重新表述如下。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在信号博弈中,M中的信号mj称为T中类型ti的劣信号,如果存在另外一个信号mj’,使得ti选择mj’的最小可能收益大于ti选择mj的最大可能收益,即,,,,kksijksijkaAaAMinutmaMaxutmaControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng信号条件(5)•如果mj之后的信息集处于均衡路径之外,且mj为类型ti的劣信号,则(在可能的情况下)接收者的推断中,认为发送者的类型为ti的概率应该等于0(只要mj不对T中所有的类型都是劣信号,即为适用这一条件的可能情况)。ijptmControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如:1tRL[]p[]quudd3,22,00,11,02tRLuudd1,01,10,02,1接收者接收者[1]q[1]p0.50.5自然ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q]构成博弈的一个混同精炼贝叶斯Nash均衡。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•由于类型为t1的发送者选择R的最大收益为1,而选择L的最小收益为2,因此,发送者的战略(R,L)和(R,R)为始于类型为t1的发送者的信息集的严格劣战略。所以,根据信号条件(5),q=0。因此,博弈的精炼贝叶斯Nash均衡[(L,L),(u,u),p=0.5,q≥1/2]不满足信号条件(5)。•分离精炼贝叶斯Nash均衡[(L,R),(u,d),p=1,q=0]则自然满足信号条件(5)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察下面的例子:1tRL[]p[]quudd3,22,00,11,02tRLuudd1,01,10,12,0接收者接收者[1]q[1]p0.50.5自然发送者发送者ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对任意的q值都是一个混同精炼贝叶斯Nash均衡,于是[(L,L),(u,u),p=0.5,q=0]就是一个满足信号条件(5)的混同精炼贝叶斯Nash均衡。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对Spence劳动力市场模型的分析可以看到,在模型中存在大量的混同、分离以及杂合精炼贝叶斯Nash均衡。但这些均衡中,并非所有的都能满足信号条件(5)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于Spence劳动力市场模型,在任意的精炼贝叶斯Nash均衡中,如果工人选择教育水平e,且企业据此推断工人是高能力的概率为,则工人的工资将等于Hpte,(1),HHHLweptertepterteControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•所以,不论企业在观测到e之后所持有的推断如何,低能力工人选择e*(L)的无差异曲线不会在IL的下方,而选择任何ees时的无差异曲线都不会位于IL的上方,•因此,根据信号条件(5),对低能力的工人而言,任何大于es的教育水平e都是劣信号。所以,对,有。See0LpteControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在此推断下,高能力工人选择任何ees的无差异曲线都位于IH的下方,因此,教育水平es是高能力工人对给定企业的战略与推断的最优反应,所以,高能力工人e=es选择是满足信号条件(5)的分离均衡。ControlScienceandEngineering,HUSTAl
本文标题:第14章-精炼贝叶斯Nash均衡的精炼
链接地址:https://www.777doc.com/doc-5029971 .html