您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第三章--完全且完美信息动态博弈
第三章完全且完美信息动态博弈本章讨论所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。本章主要内容3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论3.1动态博弈的表示法和特点3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点3.1.1阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒节点或信息集终点例子:仿冒和反仿冒博弈3.1.2动态博弈的基本特点策略是博弈方在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择和行为的完整计划以及由不同博弈方的这种计划构成的组合。结果包括双方(或多方)采用的策略组合、实现的博弈路径以及各博弈方的得益。得益对应每条路径,而不是对应每步选择、行为。动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。后行为的博弈方有更多的信息,处于较为有利的地位,但是,有时先选择、行为的博弈方反而有利,有“先行优势”。案例一红色算我赢,黑色算你输摘自《策略思维》巴里毕业的时候,为了庆祝一番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的入场券。到了准备最后一轮轮盘赌的时候。纯粹处于一个令人愉快的巧合,巴里手里有了相当于700美元的筹码,独占鳌头,第二位是一名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。就在最后一次下注之前,那个女子提出分享下一年舞会的入场券,但是巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏呢?为了帮助大家更好地理解接下去的策略行动,我们先简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的办法就是赌小球落在偶数还是奇数格子(分别用黑色和红色表示),这种玩法的赔率是一赔一,比如一美元赌注变成两美元,不过取胜的机会只有18/37。在这种情况下,即使那名英国女子把筹码全部押上,也不可能稳操胜券;因此,她被迫选择一种风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的赔率是二赔一(假如她赢了,她的300美元就会变成900美元),但取胜的机会只有12/37。现在,那名女子把她的筹码摆在桌面,表示她已经下注,不能反悔。1、巴里应该怎么办?2、什么情况下,那名女子才有赢的可能?案例讨论巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3的倍数上。那么这么做可以确保他领先对方400美元,最终赢得那张入场券:假如他们都输了这一轮,巴里将以400:0获胜;假如他们都赢了,巴里将以1300:900取胜。那名女子根本没有其他选择。她的唯一希望在于巴里先赌。假如巴里先在黑色下注200美元,她应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对她没有半点好处,因为只有巴里取胜她才能取胜(而她将是亚军),自己取胜而巴里失败就是她唯一的反败为胜的希望所在,这就意味着她应该在红色下注。这个案例里,先行者处于不利的地位。3.2可信性和纳什均衡的问题3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法3.2.1相机选择和策略中的可信性问题动态博弈中博弈方的策略是他们自己预先设定的,在各个博弈阶段,针对各种情况的相应行为选择的计划。这些策略实际上并没有强制力,而且实施起来有一个过程,因此只要符合博弈方自己的利益,他们完全可以在博弈中改变计划。我们称这种问题为动态博弈中的“相机选择”问题。不同版本的开金矿博弈—分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信3.2.2纳什均衡的问题第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题。3.2.3逆推归纳法定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。乙不借(1,0)甲不分分(0,4)(2,2)借乙(1,0)(0,4)借3.3子博弈和子博弈完美纳什均衡3.3.1子博弈3.3.2子博弈完美纳什均衡3.3.1子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2子博弈完美纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因是:虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4几个经典动态博弈模型3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人—代理人理论3.4.1寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221cc121111112)](8[)(qqqqqcQPqu212116qqqq221222222)](8[)(qqqqqcQPqu222126qqqq产量得益厂商13单位4.5厂商21.5单位2.25先行优势3.4.2劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力。工会代表的劳方效用应该是工资率和雇佣数两者的函数,即:u=u(W,L),w和L分别表示工资率和厂商雇佣的人数。厂商的利润函数为:(W,L)=R(L)-WL由于该博弈先由工会决定工资率,然后厂商根据工会提出的工资率决定雇佣多少劳动。因此可以用逆推归纳法来分析这个博弈:先分析第二阶段厂商的选择,也就是厂商对工会选择的工资率的W的反应函数L(W)。)(*WLRL0WL厂商的反应函数R(L)斜率为W])([max),(max00WLLRLWLLLW0工会的无差异曲线)(**WL)(*WL0u1u2u3u*W)](,[max*0WLWuW3.4.3讨价还价博弈甲乙二人分享1万元钱的三回合讨价还价博弈甲甲乙接受接受出S1)]10000(,[22SS)10000,(11SS)]10000(,[22SSSS2SS211000010000不接受,出S2不接受,出S(S=10000)三回合讨价还价博弈结果的讨论益越大甲的得益越小,乙的得越大越大,时,当益越小甲的得益越大,乙的得越小越大,时,当225.0015.0无限回合讨价还价SS211000010000SSS211000010000110000*S11000010000*S3.4.4委托人—代理人理论一、委托人——代理人关系经济活动和社会活动中有很多委托人——代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人——代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性委托人——代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人—代理人模型[R(S)-w(S),w(S)-S][R(E)-w(E),w(E)-E][R(0),0][R(0),0]122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束:w(E)-Ew(S)-Sw(E)w(S)+E-S参与约束:22[R(E)-w(E),w(E)-E]拒绝接受拒绝接受[R(0),0][R(S)-w(S),w(S)-S][R(0),0]接受:w(E)-E0接受:w(S)-S0参与约束委托人的选择11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托:R(E)-w(E)R(0)不委托:R(E)-w(E)R(0)委托:R(S)-w(S)R(0)不委托:R(S)-w(S)R(0)数值例子[12,2][0,0][0,0]122偷懒努力拒绝接受不委托委托[7,1]210)(EEERE=2,S=1,W(E)=4,w(S)=2三、有不确定性但可监督的委托人—代理人博弈因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。10022[0,0][0,0][10-w(S),w(S)-S][20-w(S),w(S)-S][10-w(E),w(E)-E][20-w(E),w(E)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托努力:委托:0.9*[20-w(E)]+0.1*[10-w(E)]0不委托:0.9*[20-w(E)]+0.1*[10-w(E)]0偷懒:委托:0.1*[20-w(S)]+0.9*[10-w(S)]0不委托:0.1*[20-w(S)]+0.9*[10-w(S)]0四、有不确定性且不可监督的委托人—代理人博弈122[0,0][0,0][10-w(S),w(10)-S][20-w(20),w(20)-S][10-w(10),w(10)-E][20-w(20),w(20)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托0只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。努力:0.9*[w(20)-E]+0.1*[w(10)-E]0.1*[w(20)-S]+0.9*[w(10-S)]接受:0.9*[w(20)-E]+0.1*[w(10)-E]0委托:0.9*[20-w(20)]+0.1*[10-w(10)]0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10)五、选择报酬和连续努力水平的委托人—代理人博弈R,CC(e)+R(e)
本文标题:第三章--完全且完美信息动态博弈
链接地址:https://www.777doc.com/doc-5310270 .html