您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第二章 完全信息静态博弈2016 (2)
第二章完全信息静态博弈本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展2.1基本分析思路和方法2.1.1上策均衡2.1.2严格下策反复消去法2.1.3划线法2.1.4箭头法2.1.1上策(优势策略)及均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于(1)其它的策略,至少不低于(2)其他策略的策略。包括严格上策和弱上策。囚徒的困境中的“坦白”;双寡头削价中“低价”。弱上策(弱优势策略)12410312212011211112381132甲上中下乙中右右优势策略均衡(寻找最优策略均衡)-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒1100,10020,150150,2070,70高价低价高价低价寡头2寡头1双寡头的得益矩阵2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中劣势策略反复消除法013110402002参与人1上下参与人2左中右严格下策反复消除法比上策均衡分析的实用面更大些.2.1.3划线法思路:找出每一个博弈方针对其他博弈方每种策略或策略组合的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。划线法:通过在每个博弈方对其他博弈方每个策略或策略组合的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。划线法以策略之间的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈问题时具有普遍的实用性。2.1.3划线法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争上下左中右均衡:给定一方采用该策略组合中的策略,则另一方也愿意采用该策略组合中的策略,该策略组合具有稳定性。2.1.4箭头法箭头法的基本思路是对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。箭头法:通过反映各博弈方选择倾向的箭头,寻找博弈中具有稳定性的策略组合的方法,就是箭头法。2.1.4箭头法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争箭头法注意事项1、应用箭头法,要注意箭尾的数字一定比肩头的小。2、只有在单独该策略选择给当事人带来更高的支付的时候,才画相应的箭头。2.2纳什均衡2.2.1纳什均衡的定义2.2.2纳什均衡的一致预测性质2.2.3纳什均衡与严格下策反复消去法2.2.1相对优势策略均衡与纳什均衡相对优势策略均衡:与严格优势策略均衡和弱优势策略均衡不同,参与人的相对优势策略,是在他的对手选定某个策略的条件下他的优势策略。相对优势策略的组合称为相对优势策略均衡。策略空间:博弈方的第个策略:博弈方的得益:博弈:nSS,1ijiSsiu},;,{11nnuuSSGiij纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什},;,{11nnuuSSG),(**nissi),...,,(**1*1*1niissss),...,,,(),...,,,(**1*1*1**1**1*1niijiiniiiisssssusssssuijiSs),(**nissG纳什均衡的说明1、参与人单独改变策略不会得到好处的策略组合,(或者说具有相互是对其他各方最优对策的策略组合)就叫做纳什均衡。2、纳什均衡是策略组合,而不是参与人策略组合下的相应的支付。3、一个策略组合要成为博弈的纳什均衡,必须在这个策略组合下所有参与人都没有单独改变策略选择的动机;但要论证一个策略组合不是博弈的纳什均衡,只要指出在这个策略组合下有一个博弈参与人有单独改变策略选择的动机就足够了。2.2.2纳什均衡的一致预测性质一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。“预测一致”是指博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测结果相同或无差异。纳什均衡一致预测属性的论证1、预测的结果是某个纳什均衡,则预测的结果肯定是实际的结果。2、预测的某个策略组合是博弈结果,则该策略组合一定是纳什均衡。只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡。纳什均衡的一致预测性质并不能保证各个博弈方的预测是相同的,相同的预测是一致预测的前提而不是结果。2.2.3纳什均衡与严格下策反复消去法上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡命题2.1:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡命题2.2:在n个博弈方的博弈中中,如果一个策略组合是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的),(**niss},;,{11nnuuSSG),(**niss),(**niss},;,{11nnuuSSGG弱劣势策略消除法600800001000010000公明博弈公明要求看不要求看装修行给看不给看弱劣势策略消除会遗漏纳什均衡作为”最终归宿”的纳什均衡221320312223023222甲ABC乙abc最后归宿博弈-下划线法纳什均衡是理性博弈的归宿2.3无限策略分析和反应函数2.3.1古诺的寡头模型2.3.2反应函数2.3.3伯特兰德寡头模型2.3.4公共资源问题2.3.5反应函数的问题和局限性本节研究具有无限多策略,有连续策略空间或可以看作有连续策略空间的博弈模型2.3.1古诺的寡头模型基本假设:产品同质两厂商以产量为决策内容212116qqqq221cc222126qqqq求解思路:定义法思路:只要两博弈方的策略组合(q1*,q2*),满足其中的q1*,q2*相互是对对方的最佳对策,就构成一个纳什均衡,如果该均衡是唯一的,则它一般也是博弈的结果。均衡(2,2)收益(4,4)QQPPqqQ8)(21121111112)](8[)(qqqqqcQPqu221222222)](8[)(qqqqqcQPqu4.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头市场评价——囚徒困境博弈2.3.2反应函数古诺模型的纳什均衡也可以利用划线法的思路求解,只是博弈方的对策是无穷的。)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq对一个一般的博弈,只要得益是策略的的多元连续函数,我们就可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而接触的各个博弈方反映函数的交点就是纳什均衡。这种利用反映函数求博弈的纳什均衡的方法称为“反应函数法”。q2q1图解动态收敛过程R1:q1=(6-q2)/2R2:q2=(6-q1)/22.3.3伯特兰德寡头模型基本假设:两厂商、产品有差别,消费者对价格不十分敏感,厂商策略空间[0,Pmax1],[0,Pmax2]122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu))((2111111PdPbacP))((1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabPd1代表产品2对产品1的替代程度。均衡解)(42)(42)(42)(4222212111112121211121212222212111cbaddbbbcbaddbbdPcbaddbbbcbaddbbdP2.3.4公共资源问题公共草地养羊问题QQVVqqQn100)(1以三农户为例n=3,c=4cqQVquiii)(核心的内容:论证公共资源使用的低效3321332321221321114)](100[4)](100[4)](100[qqqqquqqqqquqqqqqu323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqRq17287257624*3*2*1**3*2*1*3*2*1uuuQuuuqqq竞争:个体利益最大化480296964)100(2QQQuQQQQQu合作:总体利益最大化1728576323047224348uQ1、说明非合作博弈的结果可能是低效率的。2、解释公地悲剧的原因:每个可以利用公共资源的人都相当于面临着一种囚徒困境:在总体上有加大资源利用的可能时,自己加大利用而其他人不加大利用则自己得利,自己加大而其他人也加大利用时,自己不至于吃亏,所以,加大利用是各博弈方的优势策略,优势策略的均衡导致资源的过渡利用。2.3.5反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。2.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和混合策略的引进2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数本节研究不存在纳什均衡和存在多重纳什均衡的博弈2.4.1严格竞争博弈和混合策略的引进严格竞争博弈:各博弈方的利益和偏好始终不一致.一、猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面(1)不存在前面定义的纳什均衡策略组合(2)策略的选择与各方的利益仍然息息相关.(3)策略选择的关键:选择的随机性,以及重视策略选择的概率分布,即不能让对方猜到自己策略混合博弈的特征1、在这类博弈中,不存在纯策略纳什均衡。(纯策略:它给每个参与人具体明确了一个非随机性的行动计划。混合策略则表明,参与人可以按照一定的概率,随机地从纯策略集合中选择一种纯策略作为实际的行动。所以混和策略的均衡结果不是双方选择策略空间中哪个策略,而是以怎样的概率选择这些策略。)2、参与人的收益不仅取决于自己的策略,也取决于其他参与人的策略,而自己与其他参与人以某种概率随机选择不同
本文标题:第二章 完全信息静态博弈2016 (2)
链接地址:https://www.777doc.com/doc-4620063 .html