您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第六章(完全但不完美信息动态博弈)
第六章完全但不完美信息动态博弈第一节不完美信息动态博弈一、概念和例子动态博弈中当后行为的博弈方不了解先行为博弈方的部分或全部行为时,称为“不完美信息的动态博弈”。对于这类博弈,当各博弈方对博弈结束时每个博弈方的得益是完全清楚的,称这种博弈为“完全但不完美信息动态博弈”,或简称为“不完美信息动态博弈”。不完美信息动态博弈的基本特征之一是博弈方之间在信息方面的不对称性。以二手车的博弈问题为例。在二手车市场上的买方常常会感觉合算、不合算,而买新车时就没有这种感觉,为什么呢?主要原因是买方在二手车交易中信息较少,而卖方对车子的真实情况和价值比买方具有更多的了解。二手车交易可以抽象成这样一个博弈问题:先是原车主(即卖方)对车子的使用状况,决定了二手车的内在质量好、差两种情况。第二阶段是原车主决定是否要卖(卖价可以只有一种、有高低两种或更多,价格越多问题越复杂);最后是买方决定是否买,这里规定买方要么接受卖方价格,要么不买,不能讨价还价。由于买方对第一阶段卖方的行为(车况好拿来卖还是差拿来卖)不了解,即买方具有不完美信息,这是一个不完美信息的动态博弈。从这个例子可以看出,在不完美信息情况下的博弈方的最优策略不仅仅依赖于其他博弈方的策略,更依赖于他对其他博弈方行为的判断。在对其他博弈方各种行为选择出现概率的大小做出判断,并据此计算自己各种策略的期望得益,找出其中最大期望得益对应的策略就是己方的最优策略。这实际上就是完全但不完美信息动态博弈的标准分析方法。二、不完美信息动态博弈的表示以二手车交易为例,设使用好时对买方而言该车值3千元,使用差时值1千元,卖方要价2千元(可理解为买方想买的档次)。再假设使用差时卖方需要花费1千元才能将车子伪装成使用良好。该博弈双方的得益如图6-1所示。1差好卖不卖卖买买不买不买11(0,0)(0,0)(0,0)22(2,1)(1,-1)(-1,0)图6-1二手车交易扩展式表示不卖起始节点表示第一阶段卖方(即博弈方1)对如何使用汽车的选择,共有“好”和“差”两种可能的选择。第二阶段卖方若选择“不卖”,交易没有发生;如果他选择“卖”,则进行到买方选择的第三阶段,此时买方并不知道卖方的选择究竟是“好—卖”还是“差—卖”,用多节点信息集表示这种不完美性。第三阶段买方不能直接作出针对性的选择,他必须对这个多节点信息集中各节点出现的可能性做出判断。虽然买方在此处只有“买”和“不买”两种选择,但可能的结果却有四种:“买”到好车、差车;“不买”好车、差车。前两种结果对买卖双方都有影响;而后两种结果则只对卖方有影响。当卖方在第二阶段选择卖而买方在第三阶段选择不买时,无论车况好、差,对买方的利益毫无影响;而对卖方来讲,当车况差时因为他要先花1千元进行伪装,卖不出去就会白白损失这笔伪装费,因此他的选择(卖或不卖)的前提条件是要对买方是否会买做出判断;车况好时卖不卖得出去都无损失,只有得益的可能,因此卖总是比不卖好。ExitP25在卖方选择卖的前提下,买方选择买既有赚的可能(车况好),也有亏的可能(车况差),选择不买当然肯定不会吃亏,但也失去了获得利益的机会。因此,买方是否决定买还要对车况是好、差的概率做出判断。第二节完美贝叶斯均衡在完全且完美信息动态博弈中,我们是通过子博弈完美性来保证均衡策略中没有任何不可信的威胁或承诺的。但是,在这里因为存在多节点信息集,包含这些多节点信息集的博弈阶段不构成真子博弈,因此子博弈完美性要求无法满足,也就无法完全排除不可信的威胁或承诺,无法保证均衡策略中所有选择的可信性,子博弈精炼纳什均衡的概念失去了意义,因此必须发展新的均衡概念。一、完美贝叶斯均衡的定义当一个策略组合及相应的判断满足如下四个要求时,称其为“完美贝叶斯均衡”。要求1:在各个信息集处,轮到选择的博弈方必须有关于博弈达到该信息集中每个节点的可能性的“判断”。对多节点信息集,“判断”就是博弈达到该信息集各节点的概率分布;对单节点信息集,可理解为“判断达到该节点的概率为l”。要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。即在各个信息集处,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为选择和其后续策略,意在实现自己的期望得益最大。要求3:在均衡路径上的信息集处,“判断”要符合贝叶斯法则和各博弈方的均衡策略。要求4:在非均衡路径上的信息集处,“判断”也要符合贝叶斯法则和各博弈方在此处可能有的均衡策略。当一个策略组合及相应的判断满足这四个要求时,称为“完美贝叶斯均衡”。根据上述定义可知,子博弈精炼纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例,即在完全且完美信息动态博弈中,子博弈精炼纳什均衡就是完美贝叶斯均衡。二、均衡要求的初步解释以图6.2中的完全但不完美信息动态博弈为例,说明上述要求的重要性。当博弈方1第一阶段的选择不是R时,博弈方2无法看到博弈方1究竟选择的是L还是M。因此当轮到博弈方2选择时(博弈方1第一阶段没选R),他必须对博弈方1的选择做出判断,否则就无法在自己的U和D中做出合理的选择。ExitP171(1,3)RL(p)M(1-p)22UDUD(2,1)(0,0)(0,0)(0,1)图6-2完全但不完美信息动态博弈该博弈除了原博弈之外,不存在任何其他真子博弈(子博弈完美性要求自然满足),子博弈精炼纳什均衡定义实际上就是纳什均衡。把上图变成矩阵式(如下图),该博弈有两个纯策略纳什均衡(L,U)与(R,D)。而(R,D)依赖于一个不可信威胁,即博弈方2威胁当轮到自己选择时(博弈方1没有选R)将唯一地只选D。ExitP22博弈方1博弈方21,31,3UDRLM2,10,00,00,1但是当博弈方1选L的概率很大时(根据是博弈方1不会选严格劣策略M,只有选L才可能获取自己的最大利益),博弈方2选择D的期望得益小于选U的期望得益。Exit实际上,当博弈方1第一阶段没有选R,博弈方2“判断”博弈方1选L的概率为p,选M的概率l-p的情况下,博弈方2选择U的期望得益为:而选D的期望得益为:ppp)1(01ppp1)1(10当p1-p时,即p1/2时,博弈方2选U的期望得益总大于选D的期望得益,根据要求2,博弈方2不会选D,只会选U。这时,博弈方1第一阶段的选择就应该是L,而非M,也非R。因此,博弈方1第一阶段选L,博弈方2在博弈方1第一阶段没有选R的情况下选择U,加上博弈方2对博弈方1选L、M的概率判断p和1-p(p1-p),构成一个满足序列理性要求的策略组合。满足了要求1和要求2事实上已经排除了前面提及的那个依赖于不可置信威胁从而不合理的纳什均衡策略(R,D)。由此可以看出,序列理性的意义在于要求各博弈方遵守最大利益原则作出行为选择,从而排除博弈方策略中不可信的威胁或承诺。对于要求3和要求4,所谓“在均衡路径上”的信息集意味着如果博弈按照均衡策略进行,则该信息集会以正的概率达到,而“不在均衡路径上”的信息集就意味着博弈按均衡策略进行时,达到的概率为0。就图6-2博弈方2的信息集而言,当博弈方1第一阶段的均衡策略选择是R时,该信息集不在均衡路径上;而当博弈方1第一阶段选择不是R时,该信息集就在均衡路径上。ToP13下面再以该博弈为例,分析完美贝叶斯均衡定义中的要求3和要求4。对于要求3,假设均衡策略组合就是上面提到的“博弈方1在第一阶段选择L,博弈方2在第二阶段选择U”。先讨论要求3中的贝叶斯条件。本博弈中两博弈方的选择都是针对获取最大得益的主动选择,没有非主动选择和外生不确定性,因此不需要额外信息帮助“判断”。(1,3)RL(p)M(1-P)22UDUD(2,1)(0,0)(0,0)(0,1)1即对博弈方2来说,“判断”是直接针对博弈方1的上期选择的,因此不存在条件概率问题,贝叶斯法则自动满足。再看博弈方2判断是否符合各方的均衡策略,即看“判断”是否符合博弈方1第一阶段的选择和博弈方2自己本阶段的选择。由于博弈方1的均衡策略是在第一阶段选择L,因此博弈方2只有判断“博弈方1选择L的概率p=1”才与博弈方1的策略相符合,而且这种判断也与博弈方2自己在本阶段的选择U相符合,因此该“判断”正是博弈方2决策和双方策略均衡的稳定基础。上述分析充分说明了在不完美信息博弈中,“判断”和均衡策略之间的相互依存关系,只有两者是一致、协调的,才可能是真正的均衡。这正是要求3的真实含义。再看要求4。对于这里所说的均衡策略组合:“博弈方1在第一阶段选择L,博弈方2在第二阶段选择U”来说,因为博弈方2的多节点信息集在均衡路径上,不存在不在均衡路径上需要“判断”的信息集,因此要求4自动满足。为此,针对另一个纳什均衡策略组合(R,D),即“博弈方1第一阶段选择R,博弈方2第二阶段选择D”来讨论要求4的意义。在该均衡策略组合下,博弈方2的两节点信息集是不在均衡路径上的信息集。要求4要求博弈方2此时在这个信息集的“判断”也要满足贝叶斯法则和双方的均衡策略。同要求3,贝叶斯法则仍然自动满足,因此我们只需要讨论博弈方2的“判断”与双方在此处可能有的均衡策略的一致性。显然,到达这个信息集表明博弈方1在第一阶段偏离了上述均衡策略R,按照前面的分析,博弈方2一定会“判断”博弈方1必然选择L策略(从得益分布情况可知)。而这一判断与博弈方2自己的均衡策略D不符合,从而与要求4相悖。符合自己均衡策略D的“判断”只能是博弈方1选M的概率1-p=l,这意味着博弈方1肯定选择M,然而这一结论又与博弈方1的序列理性相矛盾。因为对博弈方1来说,M既是相对于R的下策,也是相对于L的下策(P14),即使他不愿选R,也只会选L而不会选M。因此,博弈方2的“判断”1-p=1虽然可以与自己的策略D相符合,但却无法与博弈方1在此处可能有的均衡策略L相符合,这意味着该“判断”不满足要求4。因此(R,D)策略组合不可能是该博弈具有真正稳定性的完美贝叶斯均衡。为了进一步理解完美贝叶斯均衡及其4个要求,特别是关于判断的要求3和要求4,再讨论两个例子。例一,以图6.1所示的二手车交易为例。买方在卖方决定卖的情况下,要对车况是好还是差的概率做出判断,可以用两个条件概率p(g|s)和p(b|s)来表示。三.关于判断形成的进一步解释(0,0)好差卖不卖卖不卖买不买买不买1122(0,0)(2,1)(0,0)(1,-1)(-1,0)1为此,买方首先需要知道卖方第一阶段对车子的使用情况,即车况是好的概率p(g)和差的概率p(b),它们构成了本博弈的外生不确定性。当然,这两个概率一般是通过经验性知识和数据,或平均情况得到。只有p(g)和p(b)这两个概率还不能对p(g|s)和p(b|s)做出判断。因为卖方在车况好、差两种情况下对卖和不卖的选择往往是不同的,因此只要知道卖方在好、差两种情况下选择卖的概率p(s|g)和p(s|b)分别是多大,就可以根据贝叶斯法则计算出买方需要的判断:从上式可以看出,现在关键任务是确定卖方在车况好、差情况下选择卖的概率分布p(s|g)和p(s|b)。由于卖方是主动选择和理性行为的,因此上述概率分布取决于卖方自己的均衡策略。由图6.1及前面的分析可知,当车况好时卖方肯定会选择卖(P7),因此p(s|g)=1成立;相反,在车况差时卖不出去就可能受到损失,因此如何选择就需要更多的斟酌。)()()()()()()()()()(bspbpgspgpgspgpspgspgpsgp卖方需要考虑买方选择买的概率的大小。假设买方选择买的概率是0.5,卖方在车况差的时选择卖的期望得益为0.5×1+0.5×(–1)=0,与不卖的得益相等,作为一个风险中性的博弈方,卖方可采用(0.5,0.5)的概率分布选择卖或不卖的混合策略。这时,买方判断p(s|b)=0.5既符合卖方的均衡策略也符合自己的均衡策略。有了p(s|g)=1和p(s|b)=0.5这两个概率判断,再假设已知总体车况好、差的概率p(g)=p(b)=0.5,则根据贝叶斯法则不难算出:这就是买方在自己选择的两节点信息集处对卖方所卖车中好车所占比例的“判断”;对差车所占比
本文标题:第六章(完全但不完美信息动态博弈)
链接地址:https://www.777doc.com/doc-4249878 .html