您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 博弈论与信息经济学讲义6
博弈论与信息经济学(GameTheoryandInformationEconomics)张玲玲中国科学院研究生院管理学院zhangll@gscas.ac.cn主要内容简介第一章概述-人生处处皆博弈第一篇非合作博弈理论第二章完全信息静态信息博弈-纳什均衡第三章完全信息动态搏弈-子博弈精炼纳什均衡第四章不完全信息静态博弈-贝叶斯纳什均衡第五章不完全信息动态博弈-精练贝叶斯纳什均衡第二篇信息经济学第六章委托-代理理论(I)第七章委托-代理理论(II)第八章逆向选择与信号传递主要内容简介完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)练习:参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;(4),同(3),但妻子先决策,丈夫后决策.第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡•子博弈精练纳什均衡•用逆向归纳法求子搏弈精练纳什均衡•承诺行动与子搏弈精练纳什均衡•逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡•子博弈精练纳什均衡•用逆向归纳法求子搏弈精练纳什均衡•承诺行动与子搏弈精练纳什均衡•逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。多个参与人的情况(2,…,2)如果n很小,逆向归纳法的结果逆向归纳法与子搏弈精练纳什均衡的存在问题如果n很大,结果又如何呢?1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……多个参与人的情况(2,…,2)如果n很大对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。这个链越长,共同知识的要求就越难满足。第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡•子博弈精练纳什均衡•用逆向归纳法求子搏弈精练纳什均衡•承诺行动与子搏弈精练纳什均衡•逆向归纳法与子搏弈精练纳什均衡的存在问题多个参与人的情况蜈蚣博弈四重复博弈和无名氏定理五应用举例逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,0)A2D(0,2)A2D(N,0)A(0,N+1)A1D(0,N-1)A逆向归纳法的结果:一开始,就结束!1D(3,0)A2D(0,4)A每个参与人有多个行动机会的蜈蚣博弈…1、2进行游戏决策,如果1在第一轮决策,得1,2得0,否则进入第二轮,2决策得2,A得0……逆向归纳法与子搏弈精练纳什均衡的存在问题1D(1,1)A?2D(0,3)A1D(98,98)A2D(98,101)A…另一种蜈蚣博弈(100,100)2D(97,100)A1D(99,99)A有两个参与人1、2,若第一次1决策结束,1、2都得n,若2决策结束,1得n-1,B得n+2,下一轮从1、1都是n+1开始,共100次,每个参与人有100个决策结。逆向归纳法的结果:一开始,就结束!1D(2,2)A2D(1,4)A但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于应该依赖于你的参与人未来的行为。特别是,你如何修正你队参与人理性程度的评价。逆向归纳法与子搏弈精练纳什均衡的存在问题逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。他们认为,任何一个有关博弈行为的理论应该是“完备的”,即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博弈行为的条件预测总是很好定义的。泽尔藤将偏离行为解释为参与人在博弈过程中犯的错误,或者说均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能,如果参与人在每个信息集上犯错误的概率是独立的(因而参与人不会犯系统性的错误),那么,不论过去的行为与逆向归纳法的预测如何不同,参与人应该继续使用逆向归纳法预测从现在开始子博弈的行为。第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四重复博弈•有限次重复博弈•无限次重复博弈•参与人不固定时的重复博弈五应用举例重复博弈一次动态博弈也称为“序贯博弈”。重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如囚徒困境。重复博弈的特征:1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构;2、所有参与人都观测到博弈过去的历史;3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。贴现因子:下一期的一单位支付在这一期的价值。注意:在每个阶段,参与人可同时行动,也可不同时行动。重复博弈因为其他参与人过去的历史总是可以观测到的,因此,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的均衡结果。影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。重复博弈和无名氏定理有限次重复博弈—连锁店悖论进入者进入不进入在位者默许斗争默许(-10,0)(0,300)(0,300)(40,50)xx’在位者斗争假定同样的市场上有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就编程了20次重复博弈。假定进入者进入第1个市场,在位者应该如何反应呢?重复博弈和无名氏定理这个博弈的纳什均衡是什么?假定博弈共进行10次,结果会如何?为什么会出现这个结果?倒推论证法假定现在是第十次,结果和一次博弈一样。第九次,即倒数第二次,局中人已经很清楚,最后一次博弈对方肯定要实行低价,因此,现在如何对他施行好心都不会在下一次得到好报,所以,理性人的“我”没有理由实施高价使对方获益。依次类推。3,36,11,65,5高价企业乙企业甲低价高价低价价格大战中的囚徒困境第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四重复博弈•有限次重复博弈•无限次重复博弈•参与人不固定时的重复博弈五应用举例重复博弈无限次重复博弈囚徒困境博弈重复无穷次,结果如何?证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果)。冷酷战略(1)开始选择抵赖;(2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵赖坦白抵赖无限次重复博弈使其走出了囚徒困境,背后的原因是:如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会注意的行为。一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?”,男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。”第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四重复博弈•有限次重复博弈•无限次重复博弈•参与人不固定时的重复博弈五应用举例重复博弈和无名氏定理参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈假定只有一个厂商提供产品,每个消费者只买一次,且每个阶段只有一个消费者。为什么消费者偏好于购买大商店的产品而不相信走街串巷的小商贩?一次博弈的均衡结果重复博弈和无名氏定理参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈如果厂商的贴现因子γ=1/2,则无限次重复博弈的纳什均衡为:厂商从生产高质量的产品开始,继续生产高质量的产品,除非曾经生产过低质量产品,如果上一次生产了低质量的产品,之后永远生产低质量的产品。第一个消费者选择购买,只要厂商不曾生产过低质量的产品,随后消费者继续购买,如果厂商曾件生产过低质量的产品,之后消费者不再购买。重复博弈的均衡结果贴现因子:下一期的一单位支付在这一期的价值。重复博弈和无名氏定理参与人不固定时的重复博弈1,1-1,20,00,0厂商消费者购买不购买高质量低质量质量博弈厂商:如果生产低质量的产品,得到的短期利润是2,但之后每阶段利润为0,如果总是生产高质量的产品,每阶段得到1单位利润,贴现值为1/(1-γ)=2,厂商将不会生产低质量产品。害怕失掉消费者。消费者:γ=1/2,其只关心1阶段的支付,只有当预期高质量时,才会购买。消费者预期不曾生产过低质量产品的厂商将继续生产高质量产品,故选择购买,反之亦然厂商生产过高质量的产品.重复博弈的均衡结果克莱因等认为这个例子可以解释为什么消费者偏好去大商店购买东西而不信赖走街串巷的小商贩。西蒙等用类似博弈解释雇佣关系,认为,企业存在的原因之一正式创造一个“长期的参与人”,这样一个参与人由于对未来利益的考虑而更讲信用。第三章完全信息动态搏弈-子博弈精炼纳什均衡一博弈扩展式表述二扩展式表述博弈的纳什均衡三子博弈精练纳什均衡四重复博弈五应用举例•斯坦克尔伯的寡头竞争模型•轮流出价的讨价还价模型•囚徒的救赎•旅行者困境第三章完全信息动态搏弈-子博弈精炼纳什均衡斯坦克尔伯的寡头竞争模型企业1企业2参与人:企业1、企业2;行动顺序:企业1先选择产量q1,企业2观测到q1,然后选择自己的产量q2。支付:利润,利润是两个企业产量的函数斯坦克尔伯的寡头竞争模型qi:第i个企业的产量C:代表单位不变成本假定逆需求函数为:第i个企业的利润函数为:企业1企业22,1),)((),(21icQPqqqii)()(21qqaQP斯坦克尔伯的寡头竞争模型用你向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:)(),(212212cqqaqqqMax最优化一阶条件意味着:)(21)(1122cqaqSq因为企业1预测到企业2将
本文标题:博弈论与信息经济学讲义6
链接地址:https://www.777doc.com/doc-5835816 .html