您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第13章博弈论和竞争策略
国内外经典教材名师讲堂平狄克《微观经济学》(第7版)第13章博弈论和竞争策略主讲老师:郑炳博弈和策略性决策几个基本概念非合作和合作博弈占优策略:以不变应万变纳什均衡回顾占优策略与纳什均衡的关系极大化极小策略混合策略纳什均衡13.1本章框架结构图重复博弈序贯博弈序贯博弈先行者优势重复博弈无限重复博弈有限重复博弈威胁、承诺和可信性空头威胁承诺和可信性对进入的阻止拍卖拍卖的形式拍卖的类型赢者诅咒一、博弈和策略性决策1.几个基本概念博弈论(gametheory)又称对策论,是描述、分析多人对策行为的理论,在20世纪50年代由数学家约翰·冯·诺依曼(VonNeumann)和经济学家奥斯卡·摩根斯坦(Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。13.2重难点解读任何一个博弈都有三个基本要素:参与者、策略和支付。在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬,即各自得到一笔支付,其支付可以为正,也可以为负。每一个参与者所得到的支付都是所有参与者各自所选择的策略的共同作用的结果。(1)博弈参与人参与人(players)或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与人既可以是个人,也可以是团体(企业或国家)。每个参与人的目标是通过选择行动使自己的效用最大化。(2)策略策略(strategies)是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。(3)支付函数支付函数(payofffunction)也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。(4)支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵(payoffmatrix),也称之为博弈矩阵或收益矩阵。其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表13-1即为一个支付矩阵。表13-1支付矩阵2,37,11,55,6不合作合作乙厂商的策略不合作合作甲厂商的策略2.非合作和合作博弈博弈可分为合作博弈和非合作博弈。合作和非合作博弈之间的基本差别在于签订合同的可能性。在合作博弈中有约束力的合同是可能存在的,而在非合作博弈中它们是不可能的。(1)合作博弈合作博弈(cooperativegame)是指参与者可以谈定能使它们设计联合策略的有约束力的合同。(2)非合作博弈非合作博弈(non-cooperativegame)是指参与者不可能谈判并执行有约束力的合同。二、占优策略:以不变应万变在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,即“以不变应万变”,这样的策略称之为占优策略(Thereisoneoptimalchoiceofstrategyforeachplayernomatterwhattheotherplayerdoes.)。如表13-2所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。这种策略均衡称之为占优策略均衡(equilibriumindominantstrategies)。表13-2广告博弈的支付矩阵10,26,815,010,5不做广告做广告厂商B不做广告做广告厂商A三、纳什均衡回顾1.纳什均衡纳什均衡(Nashequilibrium)指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略(eachpersonismakingtheoptimalchoice,giventheotherperson’schoice)。也就是说,给定其他人的策略,任何人都没有积极性去选择其他策略,从而这个均衡没有人有积极性去打破。2.占优策略与纳什均衡的关系占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者的任何策略选择来说,其最优策略都是惟一的。而纳什均衡只要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。3.极大化极小策略极大化极小策略(maximinstrategy)指博弈者所采取的策略是使自己能够获得的最小收入最大化。所谓最小化收入指采用某一策略所能获得的最小收入。极大化极小策略是一种保守的策略而不是利润最大化策略,博弈者往往是在信息不完全的情况下才采取极大化极小策略。表13-3极大化极小策略如图13-3所示,在理性情况下,(投资,投资)是此博弈的惟一纳什均衡。但是,如果两个厂商都选择极大化极小策略,博弈结果将是(不投资,投资)。10,26,815,010,5投资不投资厂商2不投资投资厂商14.混合策略混合策略是相对于纯策略而言的。纯策略(purestrategies)指一种规定博弈参与者在每一个给定的信息情况下只选择一种特定行动的策略。但是,并不是所有的博弈都存在纯策略纳什均衡。比如,如表13-4所示。这博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。表13-4社会福利博弈0,0-1,1-1,33,2游荡寻找工作流浪者不救济救济政府混合策略(mixedstrategies)纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。(allowtheagentstorandomizetheirstrategies-toassignaprobabilitytoeachchoiceandtoplaytheirchoicesaccordingtothoseprobabilities.)四、重复博弈1.重复博弈重复博弈(repeatedgames)是动态博弈的一种特殊情况。在重复博弈中,一个结构相同的博弈被重复多次。假定条件是:在成员之间采取一种以牙还牙策略(tit-for-tatstrategy)。该策略的内容是:所有的成员一开始是合作的。对于每一个成员来说,只要其他成员是合作的,则他就把合作继续下去。但只要有一个成员一旦背弃协议采取不合作的策略,则其他成员便会采取“以牙还牙”的惩罚和报复策略,即其他成员都采取相同的不合作策略,并将这种不合作的策略在重复博弈中一直进行下去,以示对首先破坏协议者的惩罚和报复。这就是“以牙还牙”的策略。2.无限重复博弈表13-5定价问题如表13-5所示,如果是一次博弈的话,博弈的结果必然是(低价,低价),但假设这个博弈一次次地重复进行,厂商1和厂商2在每个月的第一天同时宣布双方的价格,则此时就形成了一个重复博弈。重复博弈使得(高价,高价)成为可能。20,10-100,0-10,00,0高价低价厂商2高价低价厂商13.有限重复博弈设该博弈重复有限次数,只要双方都是理性的,则最后的纳什均衡是(低价,低价)。可以看出,有限次的重复博弈不能解决囚徒困境中的背叛问题。如果囚徒困境可以重复无数次,那么理性的选择就有可能导致帕累托有效的结果。五、序贯博弈1.序贯博弈序贯博弈(sequentialgames)是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈树”。博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。表13-6修改过的产品选择问题如表13-6所示,假设厂商1可以先推出它的新麦片,然后厂商2再推出一种。一旦厂商1选择脆麦片,则厂商2选择甜麦片;一旦厂商1选择甜麦片,则厂商2选择脆麦片。显然,存在两个纳什均衡解。-5,-520,1010,20-5,-5甜脆厂商2甜脆厂商1图13-1产品选择的博弈的扩展形-5,-510,20厂商2厂商2脆甜20,10-5,-5脆甜厂商1脆甜在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常是使用所谓的“逆向归纳法”,具体包括以下两个步骤:(1)先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。(2)再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。2.先行者优势先行者优势产生于序贯博弈。在序贯博弈中,各博弈方依次行动,先行者获得比后来者更多的利益,因而各博弈方可能会有在他的竞争者行动之前抢先采取特定行动的冲动。六、威胁、承诺和可信性1.空头威胁空头威胁就是做出威胁者没有实施的意愿的威胁。如果威胁者与竞争者是理性的,空头威胁没有任何价值。表13-7计算机和文字处理器的定价如图13-7所示,厂商1是该行业中的“主导”厂商,它不会选择定低价,故对厂商2来说,不构成威胁。10,2020,080,100100,80低价高价厂商2低价高价厂商12.承诺和可信性表13-8(a)生产选择问题由表13-8(a)可知,法奥生产大发动机的威胁是不可信的,对于最终的均衡是没有影响的。8,31,13,03,6大型车小型车莱斯卡摩托大发动机小发动机法奥表13-8(b)修改过的生产选择问题如表13-8(b)所示,不管莱斯卡摩托生产哪种汽车,法奥都生产大发动机。这一博弈收益的改变,使得法奥在博弈中的可信度增加了。8,31,10,00,6大型车小型车莱斯卡摩托大发动机小发动机法奥七、对进入的阻止进入的障碍是垄断势力和利润的重要根源,有时是自然形成的。例如,规模经济、专利和许可证,或者关键投入品的获得都能造成进入壁垒。不过,厂商自己有时也能阻止潜在的竞争者的进入。为了阻止进入,原有厂商必须让任何潜在的竞争者确信进入是无利可图的。这可以通过投资,从而给进入就引起价格战的威胁以可信性而做到。表13-9(a)进入可能性130,070,-10200,0100,20不进入进入潜在进入者低价(商战)高价(接纳)原有垄断者如表13-9(a)所示,如果原有垄断者采取低价策略抵制进入,则原有垄断者可获支付7000万美元;如果原有垄断者不采取低价策略抵制进入,则原有垄断者可获支付1亿美元。所以,原有垄断者的抵制这一威胁是不可信的。换句话说,原有垄断者的威胁只是一种摆设,它不会被真正实施。表13-9(b)对进入的阻止130,070,-10150,050,20不进入进入潜在进入者低价(商战)高价(接纳)原有垄断者如图13-9(b)所示,如果原有垄断者采取低价策略抵制进入,则原有垄断者可获支付7000万美元;如果原有垄断者不采取低价策略抵制进入,则原有垄断者可获支付5000万美元。此时,原有垄断者要进行竞争性商战的威胁是完全可信的。由于能阻止潜在进入者的进入,原有垄断者能赚到1.5亿美元利润。八、拍卖拍卖市场是指通过竞标实现买卖产品的市场。通过鼓励买方之间的竞争,能够从而增加卖方的收入,这是拍卖的一个重要的优势。1.拍卖的形式(1)传统的英国式(或口头式)拍卖:以保留价格起拍,价高者得(2)荷兰式拍卖:以较高价格起拍,逐步降低价格(3)密封投标拍卖:所有的报价同时封存于信封中,报价最高的人将赢得拍卖。赢得拍卖的投标者支付的价格依赖于不同的拍卖规则。在一级密封价格拍卖中,物品的销售价格等于最高报价。在二级密封价格拍卖中,销售价格等同于第二高的报价。2.拍卖的类型(1)私人价值拍卖拍卖的商品对每一个参与人都具有不同的潜在价值。(2)共同价值拍卖其拍卖的商品基本上对每一个投标人都具有相同的价值,尽管不同的投标人对这个共同
本文标题:第13章博弈论和竞争策略
链接地址:https://www.777doc.com/doc-623150 .html