您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第二章 完全信息静态博弈
静态(Static):参与人同时选择行动且只选择一次(若不同时,则后行动者并不知道前行动者具体采取什么行动)完全信息(Completeinformation):参与人对对手的战略空间,支付函数完全了解,即没有事前不确定性且自然(Nature,虚拟参与人)的初始行动被每一个参与人所观察到。第二章完全信息静态博弈Staticgamesofcompleteinformation本章重点讨论一、博弈论的若干基本概念占优战略均衡(Dominantstrategyequilibrium,DSE)重复剔除占优均衡(Iterateddominanceequilibrium,IEDE)纳什均衡(PureNashequilibrium,PNE)混合战略纳什均衡(MixedstrategyNashequilibrium,MNE)二、纳什均衡应用模型举例古诺(Cournot)寡头竞争模型(1838)伯川德悖论(BertandParadox,1883)豪泰林(Hotelling)价格竞争模型(1929)公共品供给(Hardin,1968)、需求模型基础设施建设:中央政府和地方政府之间的博弈三、纳什均衡的存在性和多重性的讨论博弈:参与人选择行动战略寻找最优目标(Max)支付静态时,策略与行动一致,因为没有任何可能影响参与人行动选择的信息被披露出来博弈分析的目的是预测博弈的均衡结果均衡:是所有参与人的最优战略的组合,一般记为),,,(***1*2nssss其中,是第i个参与人在均衡情况下的最优战略,它是i的所有可能的战略中使ui或Eui最大化得战略。*is用表示由除i之外的所有参与人的战略组成的向量,那么是给定s-i情况下第i个参与人的最优战略意味着*is),,,111niiisssss,,(*''*,),()(iiiiiiiissssussu均衡意味着,对所有的i=1,2,…,n,上式同时成立。囚徒A囚徒B-1,-1-10,00,-10-8,-8坦白抵赖坦白抵赖各方最优战略的组合是(坦白、坦白),这就是一种均衡。占优策略(dominantstrategies)是指这样一种特殊的博弈:某一参与人的策略不依赖于其他参与人的策略选择。换句话说,无论其他参与人如何选择自己的策略,该参与人的最优策略选择是唯一的。被称为劣战略占优战略,对应的所有严格个参与人的是第则略组成向量之外的所有参与人的战表示由除,,(*'**''*,111)(,),()(,),,,iiiiiiiiiiiniiississsssussuisssss一、占优策略均衡/上策均衡占优策略均衡(Dominant-Strategyequilibrium,DSE):由占优策构成的战略组合,记作:),,(**1*nsss囚犯1囚犯25-588占优策略均衡案例1-囚徒困境注意:如果所有人都有(严格)占优战略存在,那么占优战略均衡就是可以预测的唯一均衡。占优战略只要求每个参与人是理性的,而不要求每个参与人知道其他参与人是理性的(也就是说,不要求理性是共同知识)。为什么?5,14,49,-10,0等待小猪大猪按等待按等待是小猪的严格占优战略大猪有无严格占优战略?并不是所有的博弈均衡都是占优均衡.例如,智猪博弈上策均衡在博弈分析中的局限性二、重复剔除的占优均衡重复剔除严格劣战略(IteratedEliminationofStrictlyDominatedStrategies)(排除的)思路:首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解,称为重复剔除的占优均衡(IteratedEliminationofstrictlyDominatedStrategies,IEDE)注意:与占优战略均衡中的占优战略和劣战略不同,这里的占优战略或劣战略可能只是相对于另一个特定战略而言。0,09,-14,45,1按按等待等待小猪大猪Case:boxedpigs因为,则等待对小猪来说是占优战略,基于这一信息,大猪(理性的)认为有理性的小猪会选择“等待”。在这样前提下,大猪最优选择为“按”。于是,(按,等待)是这个博弈的唯一均衡,即IEDE。按等待1104重复剔除严格劣战略4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况A严格劣战略B严格劣战略重复剔除的占优均衡战略组合称为重复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一战略组合,如果这种唯一战略组合是存在的,我们就说该博弈是重复剔除占优可解。注意:如果重复剔除后的战略组合不唯一,该博弈就不是重复剔除占优可解的。),,(**1*nsss1,01,20,30,1M列先生行先生UDL0,12,0R行:没有占优战略列:M严格优于R剔除R行:U优于D列:无占优战略剔除DM优于L(U,M)是重复剔除的占优均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3√√练习:在下列战略式表达中,找出重复剔除的占优均衡√√√√√√注意:1、重复剔除的占优均衡结果与劣战略的剔除顺序是否有关取决于剔除的是否是严格劣战略。2、重复剔除的占优均衡要求每个参与人是理性的,而且要求“理性”是参与人的共同知识。即:所有参与人知道所有参与是理性的,所有参与人知道所有参与人知道所有参与是理性的。显然,参与人的战略空间越大,需要剔除的步骤就越多,对共同知识的要求就越严格。2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)故一般使用严格劣战略剔除。剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)举例:尽管许多博弈中重复剔除的占优均衡是一个合理的预测,但并不总是如此,尤其是当支付某些极端值的时候。8,10-1000,97,66,5参与人B参与人AUDLR若参与人B有1/1000的概率选R,尽管这一概率非常小,但在这种情况下,参与人A的期望效用为:选U选D8×(999/1000)+(-1000)/10007×(999/1000)+6/1000即A选U的期望效用小于选D的期望效用,故当参与人B选R的概率不低于1/1000时,则参与人A将会选D而不选U,即(D,L)优于(U,R)。例如因为LR=UD,得(U,L)为IEDE由于占优均衡和重复剔除的占优均衡要求高,许多博弈不存在上述类型的均衡。如下例:参与人2(4,1)(2,0)(3,5)(4,8)参与人1MLRK上述博弈不存在占优均衡和重复剔除的占优均衡。下面考察战略组合(L,K)。给定参与人2选择K,L是参与人1的最优战略。反个来,给定参与人1选择L,K是参与人选择的最优战略。(L,K)是博弈双方不愿意偏离的战略,即达到相对稳定。该战略组合就是纳什均衡。三、纳什均衡(NashEquilibrium,NE)通俗地说,纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。纳什均衡是各博弈方都不愿意单独改变的战略的组合。纳什均衡数学表述:对于一个战略组合,若称战略组合为纳什均衡。),,(**2*1nsssiSsssussuiiiiiiii,),,(),(***),,(**2*1nsss纳什均衡的定义占优战略均衡是一种纳什均衡.占优战略均衡是比纳什均衡更强、稳定性更高的均衡概念,只是占优战略均衡在博弈问题中的普遍性比纳什均衡要差得多。囚徒A囚徒B-1,-1-10,00,-10-8,-8坦白抵赖坦白抵赖参与人1参与人2ABCD1,50,2-5,02,5纳什均衡有两个但是纳什均衡不一定是占优均衡在博弈分析中,可以首先考察是否存在占优战略均衡,若不存在,再寻找纳什均衡一种纳什均衡求解方法:划线法划线法的基本思路是:(1)针对对方(参与人B)所给的战略,找出一个参与人A的最优战略,并在对应的支付上划一横线;(2)针对参与人A所给的战略,找出一个参与人B的最优战略,并在对应的支付上划一横线;(3)支付均划有横线所对应的战略组合即为纳什均衡。可见,划线法是以策略之间的相对优劣关系,而不是绝对优劣关系为基础的。在分析用得益矩阵表示的博弈问题时具有普遍实用性。例市场进入博弈有一个垄断者巳在市场上(称为在位者);另—个企业想进入(称为进入者)。进入者有两个战略可以选择:进入和不进入;在位者也有两个可选择的战略:默许(共享寡头利润)和斗争(假设采取成本价销售,即低价战略)。假定进入之前的垄断利润为300,进入之后寡头利润为100(各得50),进入成本为10。各种战略组合的支付矩阵如下:进入者在位者进入不进入默许斗争0,3000,300-10,040,50由划线法可得两个纳什均衡:(进入,默许)和(不进入,斗争)。√√√√寻找纳什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3参与人B参与人A(R3,C3)是纳什均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3练习:请用上述划线法寻找下列纳什均衡(1)占优战略均衡、重复剔除的占优均衡和纳什均衡,是根据不同的思路,从不同侧面分析完全信息静态博弈的基本概念和方法。(2)每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。一个参与人的占优战略是对于所有其他参与人的任何战略组合的最优选择,自然它也一定是对于所有其他人的某个特定战略的最优选择,然而,一个战略构成纳什均衡的唯一条件是它是参与人对于其他参与人均衡战略的最优选择。在重复剔除过程中,如果最后剩下来的战略组合是唯一的,它一定是一个纳什均衡)。囚徒困境,(坦白,坦白)是一个占优战略均衡、重复剔除的占优均衡,也是一个纳什均衡;在智猪博弈中,(按,等待)是一个重复剔除的占优均衡,也是一个纳什均衡;在下表中,(R3,C3)是纳什均衡,但不是一个重复剔除的占优均衡(我们无法通过重复剔除劣战略的办法找到均衡解),更不是占优均衡。纳什均衡、占优战略均衡、重复剔除的占优均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3参与人B参与人A(R3,C3)是纳什均衡(3)构成纳什均衡的策略一定是在重复剔除严格劣策略过程中没有被剔除掉的战略组合;但没有被剔除掉的组合不一定是纳什均衡,除非它是唯一的(不适用于严格弱劣战略的情况)。如果一个战略在重复剔除过程的某个阶段严格劣于另一个战略从而被剔除,它不可能是对于其他参与人的均衡战略的最优选择。在囚徒困境博弈中,(抵赖,抵赖)被剔除了,所以它不可能是一个纳什均衡,(坦白,坦白)是一个纳什均衡,所以它;上页表所示博弈中,没有任何一个战略严格劣于另外一个战略,因而没有一个战略组合能被剔除掉,但(R3,C3)是唯一的一个纳什均衡。(3)构成纳什均衡的策略一定是在重复剔除严格劣策略过程中没有被剔除掉的战略组合;但没有被剔除掉的组合不一定是纳什均衡,除非它是唯一的(不适用于严格弱劣战略的情况)。应该注意:上述前一句话并不适用于弱劣战略剔除的情况。如果使用弱劣战略剔除的办法,均衡结果可能与剔除顺序有关。换言之,弱劣战略剔除可能剔除掉纳什均衡。2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)举例1:(R1,C1)与(R1,C3)都是纳什均衡;但剔除如果按(C2、R2、C1、R3)的
本文标题:第二章 完全信息静态博弈
链接地址:https://www.777doc.com/doc-3470929 .html