您好,欢迎访问三七文档
第二章完全信息动态博弈扩展式博弈主要内容:一、扩展式博弈二、扩展式博弈的战略及Nash均衡三、两种博弈描述形式的比较一、扩展式博弈•在静态博弈中,参与人同时进行决策,而在动态博弈中,参与人的行动顺序有先有后,此时用扩展式博弈对其进行描述;•扩展式博弈(extensiveformgame):是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。•动态博弈中的序列结构:(1)每个参与人在什么时候行动;(2)每个参与人行动时,所面临的决策问题,包括参与人行动时可供他选择的行动方案、所掌握的信息。扩展式博弈的定义:扩展式博弈包括以下要素:(1)参与人集合;(2)参与人的行动顺序,即每个参与人在何时行动;(3)序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息;(4)参与人的支付函数。{1,2,...,}n例子:新产品开发博弈•试用扩展式博弈对两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素:(1)参与人是企业1和2;(2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择——“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择——“开发”和“不开发”,但企业2行动时已经知道企业1的行动;(4)两个企业的支付如下:ab对手不开发,获利润800万元需求大对手开发,获利润300万元开发():投入2千万元资金对手不开发,获利润200万元企业需求小对手开发,赔400万元不开发():不投入资金,利润为0•由于上述博弈较为简单,我们用文字描述的方法给出了其扩展式描述。但对于更为复杂的博弈问题,文字描述所给出的模型就会显得繁冗拖沓,极不直观。•此时,可以采用博弈树对一个扩展式博弈进行描述;•博弈树:就是由结和有向枝构成的“有向树”。最上端的一个点(用空心圆表示),表示博弈的开始。将“企业1”标示在点x1上,表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。表示博弈达到该点时企业的所得,其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得。称为博弈树的结(node)决策结考察上图中的博弈树,可以得到这样的信息:(1)博弈中的参与人是企业1和企业2;(2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”;(4)给出了博弈中各企业的支付。•除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从上图中知道以外,完全信息动态的“新产品开发博弈”扩展式描述所需要的信息,都可以从上图中得到。•问题:如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来?•在完全信息动态的“新产品开发博弈”中,企业2决策时,企业1已经做出选择。此时,企业2面临的决策情形就有以下两种:(1)企业2知道企业1的选择;(2)企业2不知道企业1的选择。•对于第一种情形,企业2知道企业1的选择,即知道企业1选择了“开发”还是“不开发”,因此,企业2知道博弈是从x1到了x2还是从x1到了x3。•对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从x1到了x2还是从x1到了x3。•实际上,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”。•为了说明“企业2在行动时是处在x2点还是处在x3点”,需要引入信息集(informationset)的概念。•信息集:信息集Ii是参与人i决策结的一个集合,它满足以下两个条件:(1)Ii中的每个决策结都是参与人i的决策结;(2)当博弈到达Ii时,参与人i知道自己处在该信息集中的某个决策结,但不知道是哪一个。•因此,信息集Ii可用来描述:当轮到参与人i行动时,他所了解的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。•设X为一决策结集合,用Ii(X)表示参与人由决策结集X构成的一个信息集。•例如,I2({x2,x3})表示企业2的由决策结集{x2,x3}构成的信息集,I2({x2})和I2({x3})分别表示企业2的由决策结集{x2}和{x3}构成的信息集。•在博弈树中,属于同一信息集的决策结一般用虚线连接起来。•在以后的讨论中,我们假设博弈树中的博弈都是从上往下进行的,因此,在不引起歧义的情况下,我们不标出博弈树中枝的方向。•在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动。企业2行动时,只知道博弈要么到达点x2,要么达到点x3,但具体在哪一点,企业2不清楚。也就是说,企业2只知道自己位于决策结集合{x2,x3}上,但不知道位于{x2,x3}中哪一个决策结上。下图表示参与人3选择时,知道参与人1的选择,但不知道参与人2的选择。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7x下图表示参与人3选择时,知道参与人2的选择,但不知道参与人1的选择。122LRLRLLRRLRLLRR1x2x3x4x5x6x7x33下图表示参与人3选择时,既不知道参与人2的选择,也不知道参与人1的选择。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7x3下图表示参与人3选择时,既知道参与人2的选择,也知道参与人1的选择。122LRLRLLRRLRLLRR1x2x3x4x5x6x7x3333•对于多阶段的动态博弈问题,一般还假设参与人满足“完美记忆”(perfectrecall)要求,即假设参与人不会忘记以前知道和做过的事情。•在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么我们也就无法对博弈进行预测。•但在现实生活中,不满足“完美记忆”要求的情形比比皆是。例如,人们在玩扑克时,往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌。二、扩展式博弈的战略及其Nash均衡•问题:(1)给定一个博弈的扩展式,如何求解该博弈问题的均衡解?(2)对于战略式博弈,可以用Nash均衡来描述其解,对于博弈树所描述的扩展式博弈,是否同样可以用Nash均衡来描述它的均衡解?•对于一个博弈的战略式描述,必须定义三个要素:参与人、参与人的战略以及参与人在相应战略组合下的支付。•一个扩展式博弈实际上已经定义了博弈的参与人及其支付,因此,如果能定义其战略,则意味着给出了一个扩展式博弈的战略式描述,同时也就意味着可以用Nash均衡来描述该博弈的解。•战略:参与人在博弈中的行动规则,它规定了参与人在博弈中每一次轮到自己行动的情形下,应该采取的行动。•在博弈树中,由于参与人在博弈中每一次轮到自己行动的情形可以用一个信息集来表示,因此,参与人在扩展式博弈中的战略实际上就是参与人在每个信息集上的行动规则。•用Hi表示博弈树中参与人i的信息集的集合,即Hi=(Ii);用Ai(Ii)表示参与人i定义在信息集Ii上的行动集,Ai(Hi)表示参与人定义在所有信息集上的行动集合,即•参与人i的一个纯战略si就是从信息集集合Hi到行动集合Ai(Hi)的一个映射关系,即其中,对()()iiiiiiIHAHAI:()iiiisHAH,()()iiiiiiIHsIAI•根据上述定义,参与人i的一个纯战略可以解释为参与人i在各个信息集上的行动组合。•在以后的讨论中,可以用参与人i在每个信息集上的行动集Ai(Ii)的笛卡尔积来表示参与人i的战略集Si,即()iiiiiIHSAI例如:12EF3,01,2AB2,11x3x11,1CD2x4x5x6x7x•参与人2的信息集为I2({x2}),参与人2在I2({x2})上的行动集为{C,D}。所以,参与人2的战略集为{C,D};•参与人1的信息集为I1({x1})和I1({x3}),其中参与人1在I1({x1})上的行动集为{A,B},在I1({x3})上的行动集为{E,F}。所以,参与人1的战略集为{A,B}×{E,F},即{A,E}、{A,F}、{B,E}和{B,F}。•给定一个博弈的扩展式描述,可以得到参与人的战略以及参与人在各战略组合下的支付,所以,由一个博弈的扩展式描述可以得到该博弈的战略式描述。12EF3,01,2AB2,11x3x11,1CD2x4x5x6x7x3,01,11,21,1212,12,12,12,1CD(,)AE(,)AF(,)BE(,)BF12EF3,01,2AB2,11x3x11,1CD2x4x5x6x7x扩展式描述战略式描述三、两种博弈描述形式的比较1.战略式博弈从本质上来讲是一种静态模型。2.扩展式博弈从本质上来讲是一种动态模型。1.战略式博弈从本质上来讲是一种静态模型•战略式博弈从本质上来讲是一种静态模型,它假设所有的参与人同时选择战略并实现博弈在各种情形下的结果,至于博弈中参与人何时行动,战略式博弈并不考虑。•虽然战略式博弈也可用来对动态博弈进行建模,但从所得到的模型中,我们无法直观地观察到动态博弈所具有的动态特性。2.扩展式博弈从本质上来讲是一种动态模型•扩展式博弈从本质上来讲是一种动态模型,它不仅直观地给出了博弈的结果,而且还对博弈的过程进行详尽的描述,如给出博弈中参与人的行动顺序,以及参与人行动时的决策环境和行动空间等等。•我们已经看到,给出博弈的扩展式描述,可得到博弈的战略式描述。在许多情况下,给出博弈的战略式描述,也能构造出博弈的扩展式描述。-4,-40,-6-6,0-1,-1小偷2小偷1抵赖坦白坦白抵赖囚徒困境的战略式描述囚徒困境的扩展式描述小偷1小偷2-8,-80,-10-10,0坦白抵赖-1,-1坦白坦白抵赖抵赖小偷2小偷1-8,-80,-10-10,0坦白抵赖-1,-1坦白坦白抵赖抵赖•注意:到目前为止,对于战略式描述的博弈问题,我们可以直接得到其Nash均衡。但是,如果是扩展式博弈的话,则需要先给出博弈的战略式描述,才能得到其Nash均衡。•究其原因,主要在于Nash均衡本身只是一个静态的解的概念。
本文标题:05-扩展式博弈
链接地址:https://www.777doc.com/doc-4885361 .html