您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 微观经济学第十章博弈论
第十章博弈论第一节博弈论基础一、博弈论(GameTheory)博弈论研究决策主体的行为相互发生直接作用时的决策,以及这种决策的均衡问题。也就是说,一个主体(一个人或一个企业)的选择受到其他主体选择的影响,并且其选择反过来会影响到其他主体的选择,这类的的决策问题和均衡问题就是博弈论研究的对象。在这个意义上说,博弈论也称为“对策论”。博弈论中的个体决策与传统经济学中的行为个体决策不同。二、博弈论的基本概念1、参与者/局中人(players):在博弈中选择行动以最大化自己效用的决策主体。2、行动(acttions,moves):参与者的决策变量。3、战略(strategies):参与者选择行动的规则。4、信息(information):是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。5、支付/收益(payoff):是参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数,也是是每个参与人真正关心的东西。6、结果(outcomes):是指博弈分析者感兴趣的要素的集合。7、均衡(equilibrium):是所行参与人的最优战略或行动的组合。上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的是使用博弈规则决定均衡。三、博弈的分类1、合作博弈(cooperativegame)和非合作博弈(non-cooperativegame):人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如果有,就是合作博弈;反之,则是非合作博弈。现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈。2、静态博弈(staticgame)与动态博弈(dynamicgame):按参与人行动的先后顺序划分,静态博弈:参与者同时决策,或非同时决策但后决策者不知道先决策者的行动。动态博弈:参与者的行动有先后,后决策者能观察到县决策者的行动,并据此选择行动。3、完全信息博弈(gamesofcompleteinformation)和不完全信息博弈(gamesofincompleteinformation):完全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识;否则,就是不完全信息。第二节完全信息静态博弈一、博弈的标准式(nomalformrepresentation)例:囚徒困境。囚徒面临的问题可用下图所示的双变量矩阵表来描述。-1,-1-9,00,-9-6,-6囚犯B囚犯A沉默招认沉默招认在此博弈中,每一囚徒有两种战略可供选择:招认、沉默)。在一组特定的战略组合被选定后,两人的收益由矩阵中相应单元的数据来表示。博弈的标准表述包括:(1)博弈的参与者,(2)每一参与者可供选择的战略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的收益。可以用支付矩阵表述一个博弈。假定有n个参与者参加博弈,序号分别为1,2,…,n,第i个参与者可以选择的战略集合(i的战略空间)为Si,每个具体的战略si为Si的元素。令(s1,s2,…,sn)为每个参与人选定一个战略的组成的战略组合,ui表示在该战略组合下参与人i的收益收益函数:ui(s1,s2,…,sn),表述的标准形式为:nnuuSSG,,;,,11二、占优战略均衡(Dominant-stragetyequilibrium)一般来说,由于每个参与者的效用(支付)是博弈中所有参与人的战略的函数,因此每个参与者的最优战略选择依赖于所有其他参与人的战略选择。但在—些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstragety)。的严格占优战略。是局中人相对于)均成立,则称合(中每一种可能的战略组间对其他局中人的战略空)()(,即的收益都大于于战略选择,战略对于其他局中人的任一的两个战略,如果为参与者,中,假定在博弈issssssSSSSsssssusssssussissuuSSGiiniiniiniiiiniiiiiiiinn',,,,,,,,,,,,,,,',,,'',,;,,11111111111111三、重复剔除严格劣战略均衡(interateddominanceequilibrium)在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在绝大多数博弈中,不存在占优战略均衡。在囚徒困境中,“招认”是每个囚犯的占优战略。博弈的结果是两人都选择“招认”,尽管福利不是最大。-1,-1-9,00,-9-6,-6囚犯B囚犯A沉默招认沉默招认占优战略均衡:略均衡。)称为占优战组合(的占优战略,那么战略均为参与者,中,对于所有参与人在博弈niiiinnsssssisiuuSSG*,,*,*,*,,**,,;,,11111小猪大猪按等待按等待3,12,47,-10,0考虑下面的“智猪博弈”。两猪共槽吃食,按下在房间另一端的按钮,能出食8单位,按下按钮者将付出2单位的代价。若大猪先到食槽,能吃到7单位的食,小猪只能吃到1单位的食;若小猪先到食槽,能吃到4单位的食,大猪能吃到4单位的食。的严格劣战略。是局中人相对于)均成立,则称合(中每一种可能的战略组间对其他局中人的战略空)()(,即的收益都小于任一战略选择,战略如果对于其他局中人的的两个战略,为参与者,中,假定在博弈issssssSSSSsssssusssssussissuuSSGiiniiniiniiiiniiiiiiiinn',,,,,,,,,,,,,,,,',,,'',,;,,11111111111111如果把“理性的参与者不会选择严格劣战略”作为局中人的理性假设,并且局中人的理性是博弈中的共同知识,则可以通过重复剔除严格劣战略来选择均衡。小猪大猪按等待按等待3,12,47,-10,0在此博以中,小猪的占优战略为“等待”,而大猪不存在占优战略。此时,不存在占优战略均衡。严格劣战略:在智猪博弈中,“按”是小猪的严格劣战略,理性的小猪不会选择“按”;而大猪知道小猪是理性的,不会选择“按”。因此,博弈就变成右边的形式。显然,“等待”是大猪的严格劣战略,大猪不会选择“不按”。(按,等待)为均衡结果。小猪大猪等待按等待2,40,0考虑下面的博弈:局中人A的战略空间为(上,下)、局中人B的战略空间为(坐,中,右),收益矩阵如下:1,01,20,10,30,12,0局中人B局中人A左中上下右“右”是B的相对于“中”的严格劣战略。理性的B不会选择“右”,而理性的A也知道B不会选择“右”,博弈就变为:1,01,20,30,1局中人B局中人A左中上下此时,“下”是A的相对于“上”的严格劣战略。理性的A不会选择“下”,而理性的B也知道A不会选择“下”,博弈就变为:1,01,2局中人B局中人A左中上此时,“左”是B的相对于“中”的严格劣战略。理性的B不会选择“下”,而理性的A也知道B不会选择“下”,博弈的结果就是:(上,中)。上面的过程可称为“重复剔除严格劣战略”,得到的唯一均衡为重复剔除严格劣战略均衡。尽管“重复剔除严格劣战略”的过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上,它仍有两个缺陷:第一,每一步剔除都需要参与者间相互了解的更进一步假定,如果我们要把这一过程应用到任意多步,就需要假定“参与者是理性的“共同知识”(commonknowledge,是与信息有关的一个重要概念。共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识)。0,44,05,34,00,45,33,53,56,6局中人B局中人A左中上中右下第二,这一方法对博弈结果的预测经常是不精确的。例如,在下面的博弈中,就没有可以剔除的严格劣战略。四、纳什均衡(Nashequilibrium)设想在博弈论预测的博弈结果中,为使该预测是正确的,局中人自愿选择的战略必须是理论给他推导出的战略。这样,每个局中人要选择的战略必须是针对其他参与者选择战略的最优战略。这种理论推测结果可以叫做“战略稳定”或“自动实施”的,因为没有参与人愿意独自离弃他所选定的战略,我们把这一状态称为纳什均衡。)(:是以下最优化问题的解即什均衡。)是该博弈的一个纳(均成立,则称战略组合对所有)()()的最优反应战略,即(他局中人选择战略是(至少不劣于)对其,战略满足对任一局中人)中,如果战略组合(人博弈在niiiiiniiniiiiniiiiniiinnnssssssussssSsssssssussssssussssssisssuuSSGn*,,*,,*,,*,*max**,,*,**,,*,,*,,*,**,,*,*,*,,*,**,,*,*,,*,***,,*,*,,;,,11212111211121112121110,44,05,34,00,45,33,53,56,6局中人B局中人A左中上中右下在右边的博弈中,对于A选择“上”时,B的最优战略为“左”;对于A选择“中”时,B的最优战略为“中”;对于A选择“下”时,B的最优战略为“右”;对于B选择“左”时,A的最优战略为“中”;对于B选择“中”时,A的最优战略为“上”;对于B选择“右”时,A的最优战略为“下”;(下,右)满足纳市均衡的条件。-6,-60,-9-9,0-1,-1囚犯B囚犯A沉默招认沉默招认(招认,招认)是重复剔除严格劣战略均衡。(招认,招认)是纳什均衡。纳什均衡和重复剔除严格劣战略均衡的关系:如果用重复剔除严格劣战略把除战略组合外所有的战略组合都剔除掉,则该所存战略组合就是此博弈惟一的纳什均衡。)(nsss*,,*,*21由于重复剔除严格劣战略并不一定会只剩下惟一的战略组合,作为解的概念,纳什均衡比重复剔除严格劣战略更强。下面的例子表明一个博弈可以有多个纳什均衡。1,20,00,02,1女男歌剧拳击歌剧拳击性别博弈(歌剧,歌剧)和(拳击,拳击)都是纳什均衡。五、几个命题的纳什均衡。略组合是该博弈中唯一合,则这一战)外的所有其他战略组剔除掉除战略组合(劣战略中,如果重复剔除严格人博弈在命题一:nnnsssuuSSGn*,,*,*,,;,,2111劣战略中被剔除。合不会在重复剔除严格什均衡,则这一战略组)是该博弈中唯一的纳中,战略组合(人博弈如果在命题二:nnnsssuuSSGn*,,*,*,,;,,2111“斗鸡博弈”也有多个纳什均衡。1、古诺的双头垄断模型六、应用举例假定:双头垄断,非勾结,产量竞争;同质产品,生产的边际成本为0;市场需求为线性需求曲线:P=a–bQ=a–b(q1+q2);决策:假定对方不改变产量决策,追求利润最大化。化为标准形式:参与人:厂商1、厂商2),0[),,0[2211SqSqii战略集:收益:企业的收益就是其利润额,这样在一般的两个参与者标准式博弈中,参与者1的收益分别为:221222122121121121)()()()()()(bqqbqaqCqqqbabqqbqaqCqqqba每个厂商要选择的战略必须是针对其他参与者选择战略的最优战略,因而两个厂商各自的反应函数就是其最优反应。两个厂商的反应函数:22)(,22)(11222211qbaqqqqbaqqq根据纳什均衡的定义,博弈的均衡解(q*1,q*2)必须同时满足两个反应函数:3)**(*32***{31*31*{2*2*2*2*{2121211221aqqbaPbaqqQbaqbaqqbaqqbaq2、公地的悲剧有n户村民的村庄,每年在村庄公共牧场上放牧羊只。以gi表示第i户村民放牧的羊数,全村牧羊总数G=g1+g2+…+gn。假定购买和照看每只羊的成本为c,c不随意户村民拥有的羊的数目而变化。当草地上羊的总数为G时,一户村民养一只羊的价值为v(G)。由于一
本文标题:微观经济学第十章博弈论
链接地址:https://www.777doc.com/doc-3819233 .html