您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 高鸿业版微观经济学博弈论
返回博弈论字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。返回策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。如前面介绍过的古诺均衡,就属于经济学中的博弈过程。返回三、博奕论模型(对策论模型)(一)博奕论或称对策论是指这样一种竞争状况,其中有两个或两个以上的人(厂商)各自追求自身的利益,而任何一方都不能单独决定其结果。1、零和博弈(不合作博弈)一个参与者所得是另一个参与者所失。所得与所失之和为零。例1:参与人:甲、乙;行动或策略:猜硬币;结果:都为正面或都为反面甲输给乙1角,如果是一正一反,甲赢乙1角;报酬:一个1角硬币乙正反甲正(-1,1)(1,-1)反(1,-1)(-1,1)2、非零和博弈(1)合作博弈(局中人都希望行动或策略保持一致的博弈)例2:参与人:小王、小李;行动或策略:两人约会但都忘记了见面地点;结果:相遇共进晚餐,否则扫兴而归;报酬:共进晚餐每人得到效用100,扫兴而归效用为-20小王AB小李A(100,100)(-20,-20)B(-20,-20)(100,100)返回(2)不合作博弈例3:参与人:邦德、詹妮;行动或策略:坦白或抵赖;结果:一方坦白可释放,另一方抵赖判10年,如果都抵赖各判1年,如果都坦白各判8年;报酬:各自刑期的负数詹妮坦白抵赖邦德坦白(-8,-8)(0,-10)抵赖(-10,0)(-1,-1)(二)上策均衡与纳什均衡1、上策均衡:一个有理性的选手在博弈中不会运用下策囚徒困境:在信息不对称的情况下,若邦德认为詹妮会坦白,则邦德会选择坦白,若邦德认为詹妮会抵赖,则邦德还会选择坦白。同理詹妮的最有利的选择也是坦白。坦白是两个人的上策。当不管对方选择什么策略,己方都能以不变应万变,这种博弈成为上策均衡的博弈。上策均衡即指每一个人都有上策可用,而仅仅是用这一策略的状况。(一个均衡解)返回2、纳什均衡例2:小王AB小李A(100,100)(-20,-20)B(-20,-20)(100,100)(1)纳什均衡:如果给定局中人i的策略是Si*,则局中人j的上策是Sj*;如果给定局中人j的策略是Sj*,则局中人i的上策是Si*。(Si*,Sj*)就是纳什均衡。两个纳什均衡:(A,A)(B,B)例1:乙正反甲正(-1,1)(1,-1)反(1,-1)(-1,1)(2)在零和博弈中,甲乙两人无绝对的上策,上策的选择取决于对方的选择,不存在纳什均衡。无均衡解若策略组合(Si*,Sj*)是上策均衡,则对于i和j而言无论对方选择什么策略(Si*,Sj*)都是上策。若策略组合(Si*,Sj*)是纳什均衡,对于i,当对方选择Sj*时,Si*才是上策;对于j,当对方选择Si*时,Sj*才是上策。上策均衡是纳什均衡的特例。返回第一节基本概念一、博弈论定义:博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于双方或多方的决策。如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。返回二、参与者(PLAYER)参与博弈的利益主体叫做参与者。英文原意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。返回三、策略和策略空间1.策略在给定条件博弈中,参与者完整的一套行动计划叫做策略。例如我国古代著名的谋略故事“田忌赛马”中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等马。这里的赛马计划就是一套完整的行动计划,也就是一个策略。返回2.策略空间参与者可以选择的策略的全体就组成了策略空间。例如在“田忌赛马”中,共有六种行动方案可供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。返回四、报酬函数与报酬矩阵1.报酬函数每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函数。也就是说,第i个参与者的收益取决于所有参与者的策略,而不仅仅是自己的策略,表示成数学式子就是:Ri=Ri(S1,S2,…Sn)。其中Ri表示第i个参与者的收益,Si(i=1,…n)表示第i个参与者所出的策略。返回2.报酬矩阵参与博弈的多个参与者的报酬可以用一个矩阵或框图表示,这样的矩阵或框图就叫做报酬矩阵。例如有甲乙两个供货商组成一个价格卡特尔,双方都有选择遵守约定价格或者违反约定价格的权利。报酬矩阵如下图所示:返回乙守约违约甲守约8,86,10违约10,67,7图8-1返回矩阵中每组数字中的前一个数字表示甲的收益,后一个数字表示乙的收益。当甲守约时,乙如果守约,收益为8,乙如果违约,收益为10;当甲违约时,乙如果守约,收益为6,乙如果违约,收益为7。所以,当甲守约时,乙会选择违约(108);当甲违约时,乙也会选择违约(76)。反之不管乙如何选择,甲都会选择违约,最终的结果是双方都选择违约。报酬矩阵改变,就会影响到双方的决策。例如双方的报酬矩阵变成下图所示:返回乙守约违约甲守约12,122,10违约10,2-4,-4图8-2返回此时双方可能都选择守约,因为当甲守约时,乙会选择守约(1210);当甲违约时,乙也会选择守约(2-4)。反之不管乙如何选择,甲都会选择守约,最终的结果是双方都选择守约。返回博弈过程参与者的决策行为要受到博弈规则的影响,即博弈规则的变化会改变报酬矩阵中的报酬值。比如在图8-1中,由于卡特尔中的每一个供货商都追求自身利益的最大化,并且没有措施来保证遵守价格约定,表面上可能都信誓旦旦的承诺守约,但是实际中双方会违约。返回如果卡特尔追求整体利益的最大化,并且由于历史、政治、制度、惩罚等措施来保证遵守价格约定,双方就可能和平共处,遵守价格约定。在历次中东战争中,由于民族宗教原因,OPEC石油的产量和价格都得到了严格的执行。返回五、均衡及博弈的解当博弈的所有参与者都不想改换策略时所达到的稳定状态叫做均衡,均衡的结果叫做博弈的解。比如图8-1中甲乙两个供货商组成的卡特尔。不管甲如何选择,乙必然选择违约,同样不论乙如何选择,甲必然选择违约。最终双方都选择了违约,并且只要给定的条件不变,双方就都不会改变策略,结果非常稳定,达成均衡。返回在这个均衡中,不管甲如何选择,乙都不会改变策略,同样无论乙如何选择,甲也不会改变策略,这种均衡就叫做占优均衡。这种无论对方如何决策,自己总是会选择的策略叫做占优策略,由双方的占优策略所达成的均衡叫做占优均衡。再比如,在学校中,学生平时学习可能是非常努力也可能是非常懒散;老师可能把考试题出的很难,也可能出的很容易。从博弈论的角度,这里的老师和学生就构成了一个博弈,双方的报酬矩阵如下:返回老师出考题难易学生学习努力90,85100,90懒散50,6090,70图8-3返回由于老师出难题比出容易题要花费更多的时间和精力,所以收益较低,从而无论学生平时努力程度如何,老师一定选择出容易的题;由于学生只要努力学习就会取得更好的成绩,所以无论老师所出考题难度如何,学生一定会选择努力学习,这同样构成一个占优均衡。经常遇到的还有一种均衡,是有条件的均衡,叫做纳什均衡。简单的说就是敌变我变、敌不变我亦不变。在后面第二节中将详细介绍纳什均衡。返回六、囚犯两难困境(prisoners’dilemma)囚犯两难困境是博弈论中一个著名的例子,讲的是甲乙两名嫌疑犯作案后被警察抓住,分别被关在不同的屋子里受审,双方不能互通消息,每名嫌疑犯都面临坦白和不坦白两种选择。警察告诉他们:在两人都坦白的情况下,各判刑10年;在两人都不坦白的情况下,各判刑3年;在一人坦白另一人不坦白的情况下,坦白的一方会被从轻处罚,只被判刑1年,不坦白的一方则被重判15年。可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果。返回1、坦白后不会受到制裁时的情况此时,双方收益矩阵如下:乙不坦白坦白甲不坦白-3,-3-15,-1坦白-1,-15-10,-10图8-4返回如图,在乙不坦白的情况下,如果甲坦白,甲会被从轻处罚,只被判刑1年,乙被重判15年;如果甲也不坦白,由于证据不足,甲乙都只会被判刑3年。在乙坦白的情况下,如果甲也坦白,甲乙会被判刑10年;如果甲不坦白,乙会被从轻处罚,只被判刑1年,甲则被重判15年。可见,在乙不坦白的情况下,甲最好是坦白,从而可以被从轻处罚;在乙坦白的情况下,因为被判刑10年总比15年要好,甲最好也是坦白,所以甲会选择坦白。返回同理,无论甲如何选择,乙的最好选择也是坦白。结果双方都选择坦白,都被判刑10年。可见,我国公安机关”坦白从宽,抗拒从严“的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中,人人都追求完美反而可能会导致社会变得很糟糕。返回2.坦白后会受到制裁时的情况博弈论的一个重要思想就是规则改变报酬矩阵,改变了报酬矩阵就会影响到行为方式。如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到。这个规则将改变报酬矩阵,新的报酬矩阵如下图所示:返回乙不坦白坦白甲不坦白-3,-3-15,-∝坦白-∝,-15-∝,-∝图8-5返回由于坦白后将被灭口,所以收益将是-∝。在乙不坦白的情况下,甲最好是不坦白;在乙坦白的情况下,因为被判刑15年总比死去要好,甲最好也是不坦白,所以甲会选择不坦白。同理,无论甲如何选择,乙的最好选择也是不坦白。结果双方都选择不坦白,各自被判刑3年。返回第二节纳什均衡一、举例假定A、B两个企业都生产白酒,白酒分为高度和低度两种。报酬矩阵如图所示:A企业高度低度B企业高度700,600900,1000低度800,900600,800图8-6返回对于B企业来说,A企业如果选择了生产高度白酒,那么B企业会选择生产什么呢?因为800700,所以B企业会选择生产低度白酒。A企业如果选择了生产低度白酒,因为900600,那么B企业会选择生产高度白酒。对于A企业来说,如果B企业选择了生产高度白酒,因为1000600,A企业就会选择生产低度白酒。如果B企业选择了生产低度白酒,因为900800,A企业就会选择生产高度白酒。返回这里,A企业的决策取决于B企业的决策,同样B企业的决策取决于A企业的决策。但是A企业选择了生产高度白酒以后,只要不变化,B企业就会选择生产低度白酒不变化。反过来也一样,B企业如果选择了生产高度白酒不变化,A企业就会选择生产低度白酒不变化,这实际上是一个纳什均衡,纳什均衡就是在给定别人最优的情况下,自己最优选择达成的均衡。返回通俗的讲,就是给定你的最优选择,我会选择能够使我最优的选择,或者说,我选择在给定你的选择的情况下我的最优选择,你选择了给定我选择情况下你的最优选择。这种均衡最后到底均衡在哪一点,由具体情况决定。在存在帕累托改善的情况下,可能会达到帕累托最优。返回在本例中,B企业选择了生产高度白酒,A企业选择生产低度白酒是一种均衡;B企业选择了生产低度白酒,A企业选择生产高度白酒也是一种均衡。由于在B企业选择生产高度白酒,A企业选择生产低度白酒的时候,A、B两企业的收益都比B企业选择生产低度白酒,A企业选择生产高度白酒时的收益要高,存在着帕累托改善,因此最后可能会达到帕累托最优,即B企业选择生产高度白酒,A企业选择生产低度白酒。返回1.定义设有n个参与者(
本文标题:高鸿业版微观经济学博弈论
链接地址:https://www.777doc.com/doc-6868225 .html