您好,欢迎访问三七文档
第二部分:完全信息动态博弈第六章扩展式博弈主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较第六章扩展式博弈ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng一、扩展式博弈•所谓扩展式博弈(extensiveformgame)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng研究博弈问题的具体进程必须弄清楚的两个问题(1)每个参与人在什么时候行动(决策);(2)每个参与人行动时,他所面临决策问题的结构。这包括参与人行动时可供他选择的行动方案,以及参与人行动时所了解的信息。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。•对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng扩展式博弈的定义:扩展式博弈包括以下要素:(1)参与人集合;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案以及他所了解的信息;(4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。{1,2,...,}nControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•如果要用扩展式博弈对一个博弈问题进行建模,那么除了要说明博弈问题所涉及到的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构,进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例子:“新产品开发博弈”•试用扩展式博弈对两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素:(1)参与人是企业1和2;(2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择——“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择——“开发”和“不开发”,但企业2行动时已经知道企业1的行动;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng(4)两个企业的支付如下:ab对手不开发,获利润800万元需求大对手开发,获利润300万元开发():投入2千万元资金对手不开发,获利润200万元企业需求小对手开发,赔400万元不开发():不投入资金,利润为0ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在上述例子中,我们用文字描述的方法给出了博弈问题的扩展式描述。对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。但可以想象,如果我们遇到的是更为复杂的博弈问题,文字描述所给出的模型就会显得繁冗拖沓,极不直观。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•因此,我们需要寻找一种简便易行的扩展式博弈的描述方式。下面我们就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式——博弈树。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•所谓博弈树就是由结和有向枝构成的“有向树”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng最上端的一个点(用空心圆表示),表示博弈的开始。将“企业1”标示在点x1上,表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。表示博弈达到该点时企业的所得,其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng称为博弈树的结(node)决策结ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng回过来再考察上图中的博弈树,可以得到这样的信息:(1)博弈中的参与人是企业1和企业2;(2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”;(4)博弈中企业的支付。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•也就是说,除了“企业2行动时是否观测到企业1的选择”这一点,暂时无法从上图中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素),都可以从上图中得到。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng问题:•如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来?ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在完全信息动态的“新产品开发博弈”中,企业2决策时,企业1已经做出选择。此时,企业2面临的决策情形就有以下两种:(1)企业2知道企业1的选择;(2)企业2不知道企业1的选择。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于第一种情形,企业2知道企业1的选择,即知道企业1选择了“开发”还是“不开发”,因此,企业2知道博弈是从x1到了x2还是从x1到了x3。这就意味着当轮到企业2决策时,他知道自己是在点x2上还是在点x3上;ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从x1到了x2还是从x1到了x3。因此,当轮到企业2决策时,他不知道自己是在点x2上还是在点x3上。所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚,需要引入“信息集”(informationset)的概念。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•在博弈树中,参与人i的一个信息集(用Ii表示)是参与人i决策结的一个集合,它满足以下两个条件:(1)Ii中的每个决策结都是参与人i的决策结;(2)当博弈到达信息集Ii(即博弈到达Ii中某个决策结)时,参与人i知道自己是在信息集Ii中的决策结上,但不知道自己究竟在Ii中哪个决策结上。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•因此,参与人i的信息集Ii可以用来描述:当轮到参与人i行动时,他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng例如•在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动。企业2行动时,只知道博弈要么到达点x2,要么达到点x3,但具体在哪一点上,企业2不清楚。也就是说,企业2只知道自己位于决策结集合{x2,x3}上,但不知道位于{x2,x3}中哪一个决策结上。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng•设X为一决策结集合,用Ii(X)表示参与人的由决策结集X构成的一个信息集。•例如,I2({x2,x3})表示企业2的由决策结集{x2,x3}构成的信息集,I2({x2})和I2({x3})分别表示企业2的由决策结集{x2}和{x3}构成的信息集。•可以在博弈树中将同一信息集中的决策结用虚线连接起来。ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng下图表示参与人3选择时,知道参与人1的选择,但不知道参与人2的选择的博弈情形。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7xControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng下图表示参与人3选择时,知道参与人2的选择,但不知道参与人1的选择的博弈情形。122LRLRLLRRLRLLRR1x2x3x4x5x6x7x33ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng下图表示参与人3选择时,即不知道参与人2的选择,也不知道参与人1的选择的博弈情形。122LRLRLLRR3LRLLRR31x2x3x4x5x6x7x3ControlScienceandEngineering,HUSTAllRightsReserved,2007,LuoYunfeng下图表示参与人3选择时,即知道参与人2的选择,也知道参与人1的选择的博弈情形。122LRLRLLRRL
本文标题:第6章-扩展式博弈
链接地址:https://www.777doc.com/doc-5030112 .html