您好,欢迎访问三七文档
1一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BALRU1,32,5D4,16,2解:由划线解得知有一个纯战略均衡(RD,)再看看它是否有混合战略均衡设B以)1,(玩混合战略,则有均衡条件:2)1(21)(UVA26)1(64)(DVA262得14,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。BALRU5,62,5D4,16,2将博弈改成上述模型,则)1(64)1(252632得542同样,设A的混合战略为)1,(,则)1(25)1(16325121于是混合战略均衡为51,54,21,21。二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1212(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)解1LR2ab112LRLRcd(5,8)(6,7)(2,0)(3,4)(1,2)(3,4)设在1的第二个信息集上,1认为2选a的概率为P,则1选L的支付PPP32)1(2531选R的支付PPPP3233)1(36故1必选R。给定1在第二个决策结上选R,2在左边决策结上会选a,故子博弈精炼均衡为),(,,daRL四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为11qc,其中1q为厂商1的产量。第2个厂商的成本函数为22cqc,其中2q为厂商2的产量,c为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c是厂商2的“私人信息”,厂商1认为c在23,21上呈均匀分布。设市场需求函数为214qqP,其中P为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q,厂商1的问题是12111)14()1(max1qqqqPq因)(22cqq。厂商1不知道c,故目标函数为2/3212112/3121211211)(3max)1)(4(maxdccqqqqdcqcqqqq一阶条件:0)(232/32121dccqq得2/32121)(2123dccqq(1)厂商2的问题是:2221222122)4()4()(max2qqqqcqcqqqcPq一阶条件:402)4(21qqc得24)(12qccq(2)代入式(1):4321238144234124212324212312212/32/312/311212121qqcdcqdcqcq得11q代入式(2):23)(2ccq若1c,则121qq121若信息是完全的且1c,则古诺博弈均衡为15321qq,1252721。这说明信息不完全带来的高效率。2、完美信息动态博弈。会用策略式表达、扩展式表达。用方框找纳什均衡,用树找子博弈精炼均衡。讲理由,看例题。该博弈中有三个纳什均衡:不进入,(进入,进入)进入,(不进入,进入)5进入,(不进入,不进入)前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入如果理论得到这样的结果,无助于预测博弈参与人的行为。此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解。必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”。子博弈精炼纳什均衡是对纳什均衡概念的最重要的改进。它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)。显然,当A选择进入时,B仍选择进入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。因此,B的战略(进入,进入)是不可置信威胁。①{不进入,(进入,进入)}②{进入,(不进入,进入)}③{进入,(不进入,不进入)}6均衡③意味着当A进入时,B选择不进入;而当A选择不进入时,B仍选择进入(B威胁无论如何都不进入市场)。显然,当A选择不进入时,B仍选择不进入是不合理的,B的战略是不可置信的。只有均衡②是合理的:如果A进入,B不进入;如果A不进入,B进入。因为A是先行动者,理性的A会选择“进入”(他知道B是理性的,B不会选择“进入”),而理性的B选择“不进入”。观察博弈树上的三个均衡中,B的不可置信战略中的反应,在第二阶段B开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B的战略在所有子博弈中都是最优的,与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1)(1,2)1a发送者1a2m1t1m2a5.02a(2,7)(10,8)接收者自然N接收者(6,5)(4,1)1a5.01a2m发送者1m2a2t2a(7,3)(3,7)解:有四种可能:混同均衡11mt,12mt21mt,22mt分离均衡11mt,22mt21mt,12mt设)(imu为接收者看见im时认为发送者是1t的后验概率。看11mt,12mt7则5.0)(1mu,非均衡路径上]1,0[)(2mu当接收者看见1m,选1a的支付为5.115.025.0选2a的支付为5.15.775.085.0故选2a。当接收者看见2m,选1a的支付为)(455))(1(1)(222mumumu选2a的支付为)(433))(1(7)(222mumumu当1t选1m,接收者会选2a,1t得支付10,要求1t不选2m,对)(2mu无要求,因1t总会选1m。当2t选1m,接收者会选2a,2t得支付3,要求2t不选2m是不可能的,因2t选2m是占优于选1m的,故此混同均衡11mt,12mt不存在。再看混同均衡21mt,22mt此时]1,0[)(1mu为非均衡路径上的后验概率,5.0)(2mu当接收者看见2m,选1a的支付为355.015.0选2a的支付为3535.075.0故接收者必选2a。当接收者看见1m时,选1a的支付为)(11)(1(2)(111mumumu选2a的支付为)(1)(77)(1(8)(1111mumumumu故必选2a。这样,无论发送者发出1m或2m信号,接收者总选2a,8给定接收者总是选2a。1t会选1m,2t会选2m。故21mt,22mt不是混同均衡。看分离均衡11mt,22mt1)(1mu,0)(2mu接收者看见1m时,必选2a接收者看见2m时,必选1a此时,1t选1m,2t选2m故11mt,22mt是一个分离均衡。最后看分离均衡21mt,12mt0)(1mu,1)(2mu接收者看见1m时,必选2a接收者看见2m时,必选2a给定接收者总选2a11mt,22mt故21mt,12mt不是分离均衡。故只有一个纯战略子博弈精炼分离均衡11mt22mt鹰-鸽(Hawk-Dove)博弈(1)参与人:争食的两只动物-动物1和动物2。动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽}i=1,2支付矩阵如下:(2)此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略9纳什均衡和一个混合策略纳什均衡。两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布,即:首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么可得q*:由4(1-q)=q+3(1-q)得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么可得a*:由4(1-a)=a+3(1-a)得a*=50%。(3)此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。七、狩猎博弈此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。支付矩阵如下:根据划线或箭头法我们可以很容易地知道此博弈有两个纯策略纳什均衡,即:(鹿,鹿)和(兔,兔),也就是两个猎人同时猎鹿或同时猎兔都是纯策略纳什均衡。由于存在两个纯策略纳什均衡,现实中究竟哪个均衡会出现就是一个问题,这是多重纳什均衡下的困境。但是,比较两个纳什均衡,很容易发现两人都猎鹿帕累托优于两人都猎兔,所以,对两个猎人而言,都猎鹿是一个“更好”的纳什均衡,因此,在现实中两个人都决定猎鹿的可能性要更大一些。然而,正如卢梭所言,如果一只野兔碰巧经过他们中的一个人附近,那么也许这个人会去猎兔而使猎鹿失败,因为两个人都猎兔也是一个纳什均衡,这就是人的自私性。此外,在多个纳什均衡下,博弈之外的其他因素有助于我们判断哪个均衡会出现。比如,两个猎人是好朋友,经常合作,那么我们几乎可以100%的肯定他们都会同时选择10猎鹿。如果他们是仇敌,那么我们可以肯定他们不会合作猎鹿,因此他们都会选择各自猎兔。来源:考试大-考博考试不完全信息夫妻博弈混合策略均衡给定妻子分别以q,1-q的概率选择时装、足球,则丈夫选择时装、足球的期望收益相等,即1.q+0.(1-q)=0.q+3.(1-q),解得妻子选择时装、足球的概率分别为(3/4,1/4)给定丈夫分别以p,1-p的概率选择时装、足球,则妻子选择时装、足球的期望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),解得妻子选择时装、足球的概率分别为(1/3,2/3)当妻子以(3/4,1/4)的概率分布随机选择时装表演和足球,丈夫以(1/3,2/3)的概率随机选择时装表演和足球时,双方都无法通过单独改变策略,即单独改变随机选择纯策略的概率分布而提高利益,因此双方的上述概率分布的组合构成一个混合策略纳什均衡。该混合策略纳什均衡给妻子和丈夫各自带来的期望收益分别为:q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3;q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4双方的期望收益均小于纯策略时的期望收益。某些静态贝叶斯博弈的例子1、市场进入博弈一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如表6.1。11表6.1市场进入博弈B高成本低成本默认斗争默认斗争A进入40,50-10,030,80-10,100不进入0,3000,3000,400假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同。假若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。由于
本文标题:化学符号及其意义
链接地址:https://www.777doc.com/doc-2598414 .html