您好,欢迎访问三七文档
第二十八章博弈论初步GameTheory博弈论•博弈论是对策略互动进行一般分析的理论。•博弈论的英文名称为gametheory,是研究决策主体的行为发生直接相互作用的失衡的决策以及这种决策的均衡问题的。博弈论的应用•经济学:市场往往是不完全的,参与者的行为相互影响,因此,个人决策时必须考虑到对方的反应–寡头垄断–卡特尔–外部性•军事和政治策略•1994年,诺贝尔经济学奖授予三位博弈论专家:纳什、泽尔滕和海萨尼。–纳什,50年代研究非合作博弈–泽尔滕,60年代研究动态博弈,提出“精炼纳什均衡”概念–海萨尼,60年代末将不完全信息引入博弈论的研究。一次博弈包含哪些组成部分?•一些参与者(players)•每一个参与者的可能策略(strategies)•每个参与者的每一种可能的策略选择的收益(payoffs)双人博弈•只有两个参与者•两个参与者,两种策略,四种收益组合双人博弈举例•参与者A和B•A有两种策略“上”或“下”•B的两种策略为“左”或“右”•表格中显示的是给参与者带来的四种可能的策略组合的收益,即博弈的收益矩阵(payoffmatrix)。收益矩阵BA收益组合中第一项是A的收益,第二项是B的收益。LRUD(3,9)(0,0)(1,8)(2,1)例如A选择Up,B选择Right,那么A的收益是1,B的收益是8。BALRUD(3,9)(0,0)(1,8)(2,1)收益矩阵PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)收益矩阵而当A选择DownB选择Right,那么A的收益是2,B的收益是1。PlayerBPlayerA一次博弈对应一个策略组合例如(U,R),在此第一个元素是参与者A选择的策略,第二个元素是参与者B选择的策略。LRUD(3,9)(0,0)(1,8)(2,1)博弈的可能结果是什么呢?PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA•如果B选择Right,那么A的最优反应是选择Down。•因为这将使得A的收益从1增加到2。•因此(U,R)不是可能的博弈结果。(U,R)是可能的博弈结果吗?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果B选择Right,A的最优反应就是选择Down。如果A选择Down,B的最优选择就是Right。因此(D,R)是可能的博弈结果。(D,R)是可能的博弈结果吗?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果A选择Down,B的最优选择是Right,因此(D,L)不是可能的博弈结果。(D,L)是可能的博弈结果吗?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果A选择Up那么B的最优反应是Left。如果B选择Left那么A的最优反应是Up。因此(U,L)是可能的博弈结果。(U,L)是可能的博弈结果吗?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡•如果存在一个策略组合,其中每一个参与者的选择都是他的最优选择,此时的策略组合就是一个纳什均衡(Nashequilibrium)组合。•我们的例子中有两个纳什均衡策略组合(U,L)和(D,R)。例子PlayerBPlayerA(U,L)、(D,R)都是博弈的纳什均衡策略。但是哪一个才是最终的解呢?注意:对于参与双方而言(U,L)优于(D,R)。那么(U,L)是否是唯一的均衡解呢?LRUD(3,9)(0,0)(1,8)(2,1)囚徒困境ThePrisoner’sDilemma•我们可以考虑著名的囚徒困境模型来检验最可能的博弈结果是否一定是帕累托有效的结果。可能的博弈结果如何?ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC如果Bonnie选择沉默,Clyde的最优反应是坦白。如果Bonnie选择坦白,Clyde的最优反应还是坦白。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC无论Bonnie采取何种行动,Clyde的最优选择都是坦白。因此,坦白是Clyde的占优策略(dominantstrategy)。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC同样的,无论Clyde采取那种行动,Bonnie的最优反应都是坦白。坦白也是Bonnie的占优策略(dominantstrategy)。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC•唯一的纳什均衡组合是(C,C),尽管对于双方而言(S,S)能够带来更多的收益。•所以,唯一的纳什均衡解不是最优解。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC谁先选择?•在前面的两个例子中,参与者都是同时采取行动的。•这种博弈称为同时博弈(simultaneousplaygames).•但是某些博弈是某个参与者首先采取行动,其他参与者后采取行动。•这类博弈称为序贯博弈(sequentialplaygames)。•首先行动的参与者是领导者,第二个行动的参与者是跟随者。序贯博弈举例•有时博弈不止一个纳什均衡结果,此时很难看出哪一种结果可能发生。•此时如果博弈行动有先后,那么我们就有可能判断出哪一种结果更可能出现。PlayerBPlayerA当同时行动时,(U,L)、(D,R)都是纳什均衡的策略组合,我们无法判断哪一种组合结果出现的可能性更大。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA假如此时博弈行为是有先后的,例如A先行动,B跟随其后行动,那么我们可以用扩展形式(extensiveform)(广延型博弈)重新描述博弈。LRUD(3,9)(0,0)(1,8)(2,1)广延型博弈举例:完美信息UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA先行动。B后行动。UDLLRR(3,9)(1,8)(0,0)(2,1)ABB当A选U时,B一定选L,(U,L)是一个纳什均衡策略。首先观察B的决策广延型博弈解法:反向归纳法UDLLRR(3,9)(1,8)(0,0)(2,1)ABB(U,L)是一个纳什均衡策略组合。(D,R)也是一个纳什均衡策略组合。哪一个是可能的结果?首先观察B的决策UDLLRR(3,9)(1,8)(0,0)(2,1)ABB如果A选择U,B选择L;A得到3。如果A选择D,B选择R;A得到2。然后观察A的决策UDLLRR(3,9)(1,8)(0,0)(2,1)ABB因此(U,L)是可能的纳什均衡结果。如果A选择U,B选择L;A得到3。如果A选择D,B选择R;A得到2。威胁进入不进入斗争不斗争(0,0)(2,1)(1,9)(1,9)进入者在位者在位者A先行动。B后行动。斗争不斗争策略(进入,不斗争)是合理的。但此时原先的在位者只能得到1。他该怎么办?威胁进入不进入斗争不斗争(0,0)(2,1)(1,9)(1,9)进入者在位者在位者A先行动。B后行动。斗争不斗争威胁进入者,只要你进入,我一定斗争。但是,显然不是一个可信的威胁。遏制进入的博弈:可信的威胁进入不进入斗争不斗争(0,2)(2,1)(1,9)(1,9)进入者在位者在位者A先行动。B后行动。斗争不斗争如果存在备用的生产能力,一旦使用,可以降低生产成本,那么威胁变得可信。纯策略(PureStrategies)PlayerBPlayerA再次回到我们同时博弈的初始模型。此时存在两个纳什均衡结果——(U,L)和(D,R)。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerAA要么选择U要么选择D,不能选择两者的组合。U和D是A的纯策略(purestrategies)。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA同样的,L和R是B的纯策略。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA因而,(U,L)和(D,R)是纯策略的纳什均衡(purestrategyNashequilibrium)。是否每种博弈必定存在至少一个纯策略的纳什均衡呢?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA这个新的博弈模型是否存在纯策略的纳什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLRPlayerBA•(U,L)是纳什均衡组合吗?•不是。•(U,R)是纳什均衡组合吗?•不是。•(D,L)是纳什均衡组合吗?•不是。•(D,R)是纳什均衡组合吗?•不是。(1,2)(0,4)(0,5)(3,2)UDLRPlayerBPlayerA因此该博弈在纯策略中不存在纳什均衡结果。尽管如此,如果是混合策略(mixedstrategies),就会有纳什均衡结果了。(1,2)(0,4)(0,5)(3,2)UDLR混合策略MixedStrategies•和A要么选Up要么选Down不同,此时A可以在一种概率分布状态(pU,1-pU)下进行选择。意味着A可以以pU的概率选择Up,以及以1-pU的概率选择Down。•概率分布(pU,1-pU)是A的混合策略。•同样的,B可以在一种概率分布状态(pL,1-pL)下进行选择。意味着B可以以pL的概率选择Left,以及以1-pL的概率选择Right。•概率分布(pL,1-pL)是B的混合策略。PlayerA(1,2)(0,4)(0,5)(3,2)UDLRPlayerB该纯策略博弈中不存在纳什均衡结果。但如果是混合策略(mixedstrategies),就会有纳什均衡结果了。如何计算?PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA如果B选择Left,她的预期收益是251ppUU()(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA251ppUU().421ppUU().(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB如果B选择Left,她的预期收益是如果B选择Right,她的预期收益是PlayerA251421ppppUUUU()()当时,B只可能选择Left。但是B选Left不存在纳什均衡组合。(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA251421ppppUUUU()()(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB当时,B只可能选择Right。但是B选Right不存在纳什均衡组合。PlayerA因此无论B如何行动都不存在纳什均衡结果,B在选Left和Right之间无差异;即(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pL251421ppppUUUU()()PlayerBPlayerA因此无论B如何行动都不存在纳什均衡结果,B在选Left和Right之间无差异;即(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB25142135pppppUUUUU()()/.PlayerA25142135pppppUUUUU()()/.(1,2)(0,4)(0,5)(3,2)U,D,L,pLR,1-pL5352PlayerB因此无论B如何行动都不存在纳什均衡结果,B在选Left和Right之间无差异;即PlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,5352PlayerBPlayerA如果A选择Up,他的预期收益是.)1(01LLLppp(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,5352PlayerBPl
本文标题:第28章 博弈论1
链接地址:https://www.777doc.com/doc-3804745 .html