您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第4章-Nash均衡解的特性
第一部分:完全信息静态博弈第四章Nash均衡解的特性主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性第四章Nash均衡解的特性ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng一、Nash均衡的意义•观点:Nash均衡是博弈的一种一致性预测——如果所有参与人预测一个特定的Nash均衡会出现,那么所有参与人都不会偏离,这个Nash均衡将会出现。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•将(或)作为博弈的一致性预测,那么(或)就应具有这样的特点:对于博弈中的任一个参与人i,如果他预测到(或)将作为博弈结果出现,那么在他预测到其他参与人的选择为(或)的情况下,自己的选择(或)必须使自己的收益最大化(否则他就不是理性的),即。(,)iiss(,)ii(,)iiss(,)ii(,)iiss(,)iiisiargmax(,)iiiiiisSsussisiControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfengNash均衡的特点:•对任一个参与人i,在给定其他参与人选择的情况下,均衡战略是自己的最优战略。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•Nash均衡具有作为博弈一致性预测的特点——所有参与人的自我肯定。•一个博弈结果(或)如果不是Nash均衡,那么就意味着:至少有一个参与人i,在给定其他参与人的选择(或)的情况下,会偏离(或)。因此,(或)不可能成为博弈的一致性预测。也就是说,一个非Nash均衡的预测将会被参与人(至少一个参与人)自我否定。(,)iiss(,)iiisiisi(,)iiss(,)iiControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例子:斗鸡博弈•两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利(至少心理上是这样的),退下来的丢了面子;若两人都退下来,两人都丢面子。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•存在两个纯战略Nash均衡——(U,D)和(D,U),也就是一个人上去,另一个就必须退下来。-4,-41,-1-1,10,0UD21UDControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•当一个理性的参与人预测到对方将会冲上去时,明智的选择就是退下来;•而当预测到对方将会选择退却时,就应该大胆地冲上去。所以,我们可以将Nash均衡作为“斗鸡博弈”的一致性预测。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•(U,U)和(D,D),也就是两人同时冲上去或同时退下来,不是Nash均衡,也不能成为博弈的一致性预测。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•这是因为,如果参与人预测(U,U)会出现,那么在行动时他不会选择U,因为相对于选择U实现预测的结果,参与人选择D可以使自己的支付变好,从而导致预测的行动和实际的行动不符,这也就意味着这个预测被参与人自我否定。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•非Nash均衡的(U,U)不可能成为一个一致性预测。基于同样的原因,(D,D)也不是一个一致性预测。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例子:•博弈有惟一的Nash均衡——•两个参与人在均衡中的期望收益都为0。0,00,-11,0-1,3LR21UD3111((,),(,))4422ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在参与人2选择均衡战略的情况下,纯战略是参与人1的最优反应;而在参与人1选择均衡战略的情况下,纯战略L是参与人2的最优反应;•在参与人1选择纯战略U而参与人2选择纯战略L的情况下,双方的收益都为0,与均衡中的期望收益相同。211(,)22131(,)44ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•但是,作为非Nash均衡的战略组合(U,L)却不能成为博弈的一致性预测。•这是因为,如果预测到参与人2选择纯战略L的话,参与人1的最优选择又应该是D,此时,参与人1会偏离而选择D。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•给定一个博弈G,R是G中参与人如何行动的数学描述的某个值域,用表示博弈的解。作为博弈的解,应满足如下两个条件:•(1),,都存在一个环境能使π成为参与人在这个博弈G中将如何行动的准确预测;•(2)不存在一个环境能使π成为参与人在这个博弈G中将如何行动的准确预测;()GR()GG()G,\()GRGControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•任何一个满足以上两性质的解,我们称之为博弈的一个精确解(exactsolution)。精确解要求对所有可能情况下参与人将如何行动进行预测,并且其对参与人在各种情况下将如何行动的预测是准确预测,也就是一致性预测。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•一般情况下,同时满足以上两条性质的解难以找到。•将满足第一条性质的解,称为博弈的下解(lowersolution)。下解排除了所有不合理的预测,但也可能排除了合理的预测;•将满足第二条性质的解,称为博弈的上解(uppersolution)。上解包含了所有合理的预测,但也可能包含了不合理的预测。显然,Nash均衡是上解。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性第四章Nash均衡解的特性ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfengNash均衡的存在性定理每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、Nash均衡的意义二、Nash均衡解的存在性三、Nash均衡解的多重性第四章Nash均衡解的特性ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在博弈论中Nash均衡是作为博弈的解——一致性的预测而引入的。•在一个博弈问题中,如果博弈只存在一个Nash均衡,那么Nash均衡作为一致性的预测,应该说是相当有效的。但是,如果博弈中存在多个Nash均衡,那么Nash均衡作为博弈解的意义也就相对弱化了。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•例如,在“斗鸡博弈”中,虽然存在两个纯战略的Nash均衡(U,D)和(D,U)(即一个人冲上去,另一个人退下来),但是,如果用它们作为一致性的预测话,就会面临这样的问题:在博弈中,到底谁冲上去,谁又该退下来?如果两个参与人对“两个均衡到底哪一个会出现”的预测不一致的话,就可能会出现问题。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•参与人1预测博弈的解为:自己上去,对方退下来(即均衡(U,D)),而参与人2则预测博弈的解为:对方退下来,自己上去(即均衡(D,U)),那么博弈真正的结果就会既不是Nash均衡(U,D)也不是(D,U)(Nash均衡,而是非Nash均衡——双方都冲上去,出现两败俱伤的情形。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•因此,传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题),而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)。•事实上,当在一个博弈中存在多个Nash均衡时,目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于Nash均衡的多重性问题,目前解决的思路主要有两种:•第一种是均衡精炼的方法;•第二种解决Nash均衡多重性问题的方法就是非规范式的方法。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng均衡精炼的主要思路•从博弈解的定义入手,在Nash均衡的基础上,通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等,剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性,对所有的博弈问题都适用;如果均衡精炼的方法可以称为规范式的方法的话,ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng非规范式方法的特点•针对一些特定情形下的特定博弈问题,给出具体的解决Nash均衡多重性问题的方法。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng非规范的方法的方式1.焦点效应2.相关均衡ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng焦点效应•在某些存在多个Nash均衡的博弈中,往往会出现这样的现象:所有的参与人都会相互预期博弈中某一特定的均衡将会出现,从而选择执行这个特定的均衡。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng焦点效应•2005年诺贝尔经济学奖获得者Schelling对这种现象进行了详尽的探讨并且证明:在
本文标题:第4章-Nash均衡解的特性
链接地址:https://www.777doc.com/doc-5030081 .html