您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第12章-精炼贝叶斯Nash均衡
第四部分:不完全信息动态博弈第十二章精炼贝叶斯Nash均衡主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较第十二章精炼贝叶斯Nash均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在完全信息动态博弈中,假设s*为一子博弈精炼Nash均衡,那么在参与人采用均衡战略s*的情况下,不管博弈的进程如何或是否发生,每个参与人的战略对从任一决策结开始的子博弈(或在其后轮着他采取的行动)都是最优的。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•子博弈精炼Nash均衡中的这种“均衡精炼”的思想,也可应用到不完全信息扩展式博弈中。•作为上述“均衡精炼”思想的自然应用,必然要求每个参与人的均衡战略在其每个信息集上都为最优。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如122LMLRRLLRR3LRLLRR31x2x3x4x5x6x7xControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•不仅要求参与人2的均衡战略在由单决策结构成的信息集上最优,而且还要求参与人3的均衡战略在由多决策结构成的信息集和上最优。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•但对于位于由多决策结构成的信息集(I3({x4,x5})或I3({x6,x7}))上的参与人3,当轮到他行动时,由于对已发生的历史即参与人2是选择了L’还是R’并不清楚,因此也就不知道自己是位于决策结x4(或x6)还是决策结x5(或x7)上。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在这种情况下,参与人3对信息集(I3({x4,x5})或I3({x6,x7}))后的博弈进程就不清楚,因而对自己的选择所导致的博弈结果也就不清楚,从而使得参与人3无法确定自己的最优行动。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•虽然位于多决策结信息集上的参与人,对自己到底位于信息集中哪一个决策结上不能给出一个明确的判断,但一般情况下还是能够对自己位于哪一个决策结,给出一个“大概的估计”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当位于多决策结信息集上的参与人能够用一个定义在该信息集上的概率分布,来对自己位于哪一个决策结进行描述时,就称参与人在该信息集上具有了关于自己位于哪一个决策结的信念(或推断)。而当参与人具有了关于自己位于哪一个决策结的信念(或推断)时,就可借助这种信念(或推断)来指导自己的决策(或选择)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察如下完全但不完美信息动态博弈:21[]p[1]pLMLLRRR2,10,00,20,11,3ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•如果参与人1选择R,则博弈结束(参与人2没有行动)。•如果参与人1选择了L或M,则参与人2就会知道1没有选择R(但不清楚1是选择了L还是M),并在L’和R’两个行动中进行选择,博弈随之结束。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng给出了上述博弈的战略式描述2,10,00,20,11,31,3LMRLR参与人1参与人2ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在两个子博弈精炼Nash均衡中,均衡(R,R’)明显要依赖于一个不可信的威胁,因此,该博弈只有一个合理的纯战略子博弈精炼Nash均衡——(L,L’)ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•根据Selten所给出的子博弈精炼Nash均衡的定义,是无法将不合理的子博弈精炼Nash均衡(R,R’)排除掉的。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•如果能将子博弈精炼Nash均衡的思想推广到多决策结信息集,并在每个信息集上给出一个参与人关于自己位于该信息集中哪一个决策结的信念(或推断),则可以将某些不合理均衡剔除掉。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•给定参与人2的一个推断,[p]表示参与人2位于左边决策结的概率为p,[1-p]表示参与人2位于右边决策结的概率为1-p。•参与人2选择L’的期望收益为:[]1122ELpppControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•而参与人2选择R’的期望收益为:[]0(1)11ERpppControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•由于对任意的p,都有2-p1-p,这就排除了参与人2选择R’的可能性。•因此,在上述博弈中,简单要求参与人2持有一个推断,并且在此推断下选择最优行动,就足以使我们排除不合理的均衡(R,R’)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng考察更一般情形的博弈:21LMLLRRR2,10,20,20,11,3[]p[1]pControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在该博弈中,战略组合(R,R’)也是参与人2的信息集未能达到的一个子博弈精炼Nash均衡。•如果参与人2的信息集一旦能够达到,参与人2的最优选择就依赖于他关于已发生历史的信念,即一旦博弈进入参与人2的信息集,参与人2关于自己位于哪一个决策结的推断。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•参与人2选择L’与R’的期望收益分别为2-p和1+p,因此,如果p1/2,则最优战略为R’;如果p1/2,则最优战略为L’。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng要将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,就必须做到:1)对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念(或推断);2)对参与人i的每个信息集,在给定参与人i在该信息集上的信念(或推断)情况下,参与人的战略是对其他参与人战略的一个最优反应,即参与人的选择必须满足序惯理性(sequentialrationality)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较第十二章精炼贝叶斯Nash均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•精炼贝叶斯Nash均衡既包含了一个战略组合,又包含一个信念系统。•这里信念系统对每个信息集都确定了位于该信息集上的参与人所持有的信念。•这种信念是信念持有人对已发生历史的一个推断,也可理解为他对自己位于信息集上哪一个决策结的“一种估计”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•通过给定参与人在信息集上的信念,来对不完全信息扩展式博弈的均衡进行精炼,是Selten子博弈精炼Nash均衡中“均衡精炼”的思想在不完全信息扩展式博弈中的自然应用。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng给定参与人的均衡战略,参与人的信念必须满足:(1)与战略的一致性(consistencywithstrategies)原则;(2)结构一致性(structuralconsistency)原则;(3)共同信念(commonbeliefs)原则。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•与战略的一致性原则指导不完全信息扩展式博弈中处于均衡路径之上信息集的信念设定;•结构一致性原则应用于处于均衡路径之外信息集的信念设定;•共同信念原则是博弈问题解的特性所决定的对博弈问题的结构要求。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng定义•对于一个给定的不完全信息扩展式博弈中给定的均衡,如果博弈根据均衡战略进行时将以正的概率达到某信息集,称此信息集处于均衡路径之上(ontheequilibriumpath)。•反之,如果博弈根据均衡战略进行时,肯定不会达到某信息集,称之为处于均衡路径之外的信息集(offtheequilibriumpath),简称非均衡路径信息集。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng与战略的一致性:•指对于任一与参与人的战略相一致的信息集,即处于均衡路径之上的信息集,参与人关于已发生历史的信念即博弈如何到达该信息集的信念,应该由贝叶斯法则及参与人的均衡战略共同确定。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng111()tpLRLLRR1LRLLRRLRLLRR22()tp33()tp2222N1x2x3x4x5x6x[]x[]x[1]xx[]y[]y[1]yy1ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•假设在所涉及到的均衡中,参与人1的均衡战略为(L,L,L),也就是说,无论是什么类型的参与人1,他的选择都为L。因此,参与人2位于均衡路径上的信息集为I2({x1,x3,x5})。ControlScienceandEngineering,HUSTAllRightsReserved,2007,Luo
本文标题:第12章-精炼贝叶斯Nash均衡
链接地址:https://www.777doc.com/doc-5030055 .html