经济博弈论4

第四章对称信息动态博弈有一些博弈是动态进行的，譬如，打牌，下棋等。这些博弈的特点是参与人在选择行动的时候，存在着一定的时间顺序，而后行动的参与人在选择自己的行动时，已经观察到先行动参与人所选择的行动。第一节动态博弈的策略与子博弈精炼纳什均衡4.1.1动态博弈的扩展式表述彝族与汉人的盐——狐皮交换：在中国西南地区的崇山峻岭中，生活着许多少数民族，包括彝族。这些少数民族过去曾经生活在与世隔绝的深山老林里面，他们是怎么获得生活必需品——食盐的呢？他们获得食盐的方式非常特别。彝族同胞会定期在深山老林与汉人生活区交界的某个地方，譬如山脚下的某个老树下放一些山货，譬如狐皮，药材等，过一段时间再去看看汉人取走山货后，汉人的回报所放在老树下面的食盐，把它们取走。彝族同胞与汉人皮货商之间就进行着这样的心照不宣的交换。彝族同胞定期在老树下面放一些山货，而汉人皮货商过段时间去取，同时也放一些食盐在那里，等彝族同胞取走。他们之间就成年累月地进行着这样的交换。我们在图4.1中，画出来了这样的交换过程。图4.1狐皮与山货交易博弈在图4.1中，从上到下进行着博弈：开始是彝族同胞决定放多少张狐皮，是0张，1张，2张，………，等等这些可汉彝胞族001汉1彝族1010能的选择；然后是汉人皮货商决定回报多少食盐，是0斤，1斤，2斤，…………,等等这些可能的选择。然后又开始第二轮，由彝族同胞决定放多少狐皮，然后又由汉人皮货商决定回报多少食盐，………,等等。图4.1给出了所谓“对称信息动态博弈”的一个“博弈树”图。博弈树是倒着的，第一个节点是“树根”。每一个节点是某个参与人进行决策的位置，叫做“决策结”；从“决策结”发出来的“树枝”是参与人选择的一个行动。每一个行动在这里都是放多少狐皮或者食盐。这样的博弈有一个特点，就是每一个参与人在决策自己的行动的时候，都观察到了其他参与人之前的行动。大家是轮流进行自己的行动选择的。这样的博弈叫做“对称信息动态博弈”，而图4.1就是动态博弈的“扩展式表述”。4.1.2，动态博弈：策略与纳什均衡例4.1西班牙叛乱与纯属构想出来的例子不同，这里提供的例子却是一个来源于真实历史的古罗马战事。在约公元前75年，西班牙发生了一起反对罗马的叛乱，有意思的是，叛乱的这帮人却是在西班牙的一部分罗马军人和一些膜拜罗马的西班牙人。历史学家推测，西班牙叛军的头目塞多留（QuintusSertorius）当时是想利用西班牙这张牌来使自己登上罗马帝国的最高统治宝座。罗马派出两支罗马军团去西班牙绞杀叛军，一支是由名震四海的贵族名将皮乌斯（MetellusPius）率领，另一支由后起之秀庞培（Pompey）带领，并且由庞培统领整个两支军团的行动。庞培当时很有钱，对自己的军队也有大量投入，但他当时很年轻，并且出身贫贱。因此皮乌斯对罗马让他听命于庞培很有些不服。这两支罗马军队兵分两路，庞培挺进到新迦太基（NewCarthage），营救出来在那里被叛军包围的小股罗马驻军。然而，当他们行进到劳罗（Lauro）时，却被塞多留的叛军主力围困，庞培在这里动弹不得。皮乌斯军团驻扎在西班牙西部（见图4.2），这两支罗马军团被叛军分割隔离开，形势对叛军有利。塞多留为了保证罗马的两支军团被持久分隔，派出副手赫图勒斯（Hirtuleius）驻守皮乌斯军营东部的拉米尼姆城（Laminium），力图阻止皮乌斯与庞培军团会合。图4.2西班牙叛乱中赫图勒斯与皮乌斯形势分析：皮乌斯有两种策略选择：1、直接进攻赫图勒斯驻守的拉米尼姆城，如果成功，既打开了进军西班牙东部的通道，实现与庞培的会合，又消灭了一支叛军部队。然后，他就可以高歌猛进向劳罗进发，与庞培会合，组成联军击败塞多留。但是，资料显示，拉米尼姆城地势险峻，利于防守。直接攻打拉米尼姆城可能导致皮乌斯失利，成功的可能性很小。2、皮乌斯先到海滨城市加德斯（Gades），然后沿水路去新迦太基，对包围庞培的塞多留进行反包围，与庞培联手击败叛军主力，消灭塞多留。这样做的好处是既可取得战争胜利，又能向目中无人的暴发户庞培显示罗马贵族的气势和实力。因此，第二个方案应该是比第一个方案更好的选择。赫图勒斯也有两个策略：1、直接进军新迦太基，与那里的小部分西班牙叛军会合，迎战可能来犯的皮乌斯。这一策略的优点是，如果皮乌斯真的来犯新迦太基，则以逸待劳的叛军击溃皮乌斯的可能性较大；但是，实际情况很可能相反，当皮乌斯知道赫图勒斯去了新迦太基后，他就不会来新迦太基了，而是北上直接端掉赫图勒斯的窝子拉米尼姆城，然后进军西班牙东部与庞培会合，这样使得西班牙战局有利的一方直接倒向罗马军团。2、赫图勒斯呆在拉米尼姆不动，当皮乌斯军团出发后，再进军皮乌斯将途经的巴埃蒂斯河（Baetis）滩截击皮乌斯。此时，叛军会以疲惫之师与占据有利地形的罗马军团交手，取胜的可能性不大，但好处是叛军不会丢失拉米尼姆城，而且可以将皮乌斯拖入战事，阻止罗马军团在西班牙东部的策略会合。策略分析：图4.3策略分析之决策树赫图勒斯皮乌斯皮乌斯新迦太基拉米尼姆城皮乌斯取胜新迦太基对赫图勒斯有利拉米尼姆城新迦太基赫图勒斯取胜对皮乌斯有利留守拉米尼姆然后进军巴埃蒂斯河在图4.3中，我们将上述双方的策略及出招的顺序用一个“博弈树”表示出来。这种图由于在形状上象一棵树，“树根”在左，向右延展出来的是“树枝”。在该图中，每一个策略链条的末端，都有一个结果，譬如，如果赫图勒斯选择直接进军新迦太基，皮乌斯随后进军拉米尼姆城，则皮乌斯获胜。这就是策略链条：“新迦太基→拉米尼姆”所带来的后果。在所有可能的策略链条中，策略链条的后果之间对于双方都存在可比较性。对皮乌斯来说，后果“皮乌斯取胜”显然比“对赫图勒斯有利”要好，而对赫图勒斯而言，后果“对赫图勒斯有利”显然要比“对皮乌斯有利”要好。我们在图4.4中，将这种后果的可比较性用具体的数字来刻画。数字的选择是任意的，但也不是完全任意的，它们要反映出上面谈到的后果可比较性。图3.4图4.4用数字表示后果的策略分析之决策树赫图勒斯知道，当他选择直接进军新迦太基时，皮乌斯会选择进军空城拉米尼姆，叛军局势逆转。当他留守拉米尼姆，等皮乌斯先行动。他也可以猜出来，此时皮乌斯会绕道加德斯去新迦太基，他就选择进军巴埃蒂斯河滩截击皮乌斯。赫图勒斯可比较两种选择的后果，毕竟因为0比-1大，所以他会选择留守拉米尼姆城，而在此情形，可预测皮乌斯会选择绕道加德斯进军新迦太基。因此，双方赫图勒斯皮乌斯皮乌斯新迦太基拉米尼姆城（-1，2）新迦太基（1，0）拉米尼姆城新迦太基（2，-1）（0，1）留守拉米尼姆然后进军巴埃蒂斯河会在巴埃蒂斯河滩展开一场厮杀。当时的真实情况就是这样的，赫图勒斯呆在拉米尼姆不动，而在皮乌斯向着加德斯进发后，赫图勒斯就奔袭巴埃蒂斯河滩。但是，尽管赫图勒斯采用了其最佳策略，不幸的是他没料到皮乌斯的行军速度太快，结果是在巴埃蒂斯河滩以逸待劳的罗马军团痛击了赫图勒斯的疲惫之师，叛军兵败，落荒而逃。随后，神勇之师皮乌斯军团经加德斯成功增援新迦太基的罗马军队，与庞培联手反包围了劳罗城，击败叛军。皮乌斯成了罗马的英雄，而庞培则用了许多年才重新树立起自己的声誉，成为罗马帝国名将，辅佐朱利尤斯.恺撒（JuliusGaesar），这已是后话了。例4.2连锁店博弈两个连锁店A与B销售几乎是同样的产品，它们在考虑是否进入同一个区域市场的决策问题。A先决策，然后是B决策。图4.5连锁店博弈图4.5给出的是一个“连锁店博弈”，是对称信息动态博弈。倘若每家连锁店都进入，则供给太多，售价下跌，每家公司都亏损3千万。若只有一家公司在此地经营，则进入者获1千万元的利润。在动态博弈中，一个策略指在所有的决策结（图4.4中的结点）上选择什么行动的规定。行动不同于策略。在每个决策结上对应于参与人有一个行动空间，而所有可能的策略构成策略空间。博弈树最下端的结点被称为“终点结”。终点结下面的向量是“支付向量”。支付向量中的分量数字从左向右依次对应博弈在这里结束后按同样先后顺序进行行动选择的参与人得到的支付。如果一个博弈树没有终点结，则称其为无限次动A进入不进入BB进入不进入进入不进入(-3,-3)(1,0)(0,1)(0,0)态博弈，否则称为有限次动态博弈。在前面我们描述的博弈称为（对称信息）静态博弈，指参与人同时选择（或一个参与人在进行行动选择时不能事先看到其他参与人的行动选择）行动，此时，行动与策略是相同的。这里分析的是（对称信息）动态博弈，但也可以用类似于前章中的用矩阵表达的方式来表达，即“策略式”表述。所以，策略式与扩展式表述是等价的，不同的是前者表述静态博弈时比较方便，而后者更适于表述动态博弈。下面，我们用表4.1再来表示图44.5给出的动态博弈。表4.1策略式表述的市场进入博弈B(进入，进入)(进入，不进入)(不进入，进入)(不进入，不进入)A进入－3，－3－3，－31，01，0不进入0，10，00，10，0B的每一个策略是在其所有决策结上给出行动选择的一个规定。B有两个决策结，每个决策结上有两个行动，故共有四个策略。用一个向量表示B的一个策略，向量中左边的分量对应于A选“进入”时（左边决策结）B的行动选择，右边分量对应于A选“不进入”（右边决策结）B的行动选择。A只有一个决策结，两个行动，故只有2个策略。用划线法找到三个纯策略纳什均衡：｛不进入，(进入，进入)｝｛进入，(不进入，进入)｝和｛进入，(不进入，不进入)｝其中B的策略(x，y)是指当A选进入时B选x，A选不进入时B选y。在这三个纯策略纳什均衡中，第一和第三个均衡是不可信的。第一个均衡含有“不可置信”的威胁：B威胁A——无论A是否进入，B都会进入。但事实上，一旦A进入，B的最优选择是“不进入”而不是“进入”。第三个均衡含有“不可置信”的承诺——B向A承诺，无论A是否进入，B都“不进入”。但事实上，一旦A不进入，B的最优选择是“进入”而不是不进入。所以，第一和第三个纳什均衡是不可信的，不能作为理性人行为的预测。所以，这种纳什均衡不能作为建立在理性人基础上的预测，我们将其去掉。由此看来，用策略式表述动态博弈可能存在一个问题：即含有不合理预测的均衡，或者说纳什均衡是一个太宽的概念。4.1.3子博弈精炼纳什均衡纳什均衡在动态博弈中不仅可能含有“不可置信”的威胁，而且还可能含有“不可置信”的承诺。这是因为，在动态博弈中，由于参与人在未来实施策略所规定的行动时，还有改变行动的机会，这样的机会主义行为，就是含有“不可置信”的威胁，或者“不可置信”的承诺的原因。为了避免动态博弈中不可信的均衡，谢林提出了“子博弈精炼纳什均衡”（sub-gameperfectNashequilibrium）的概念，后经Selten在数学上给出了具体的刻画。所谓“子博弈”，是指从任意决策结开始的一个博弈，包括原来的整个博弈也是一个广义的子博弈。譬如，在狐皮与食盐的交易博弈中，从任意一次投放，无论是彝族同胞投放狐皮，还是汉人投放食盐开始，一直进行下去，就构成一个子博弈。定义4.1一个策略在一个子博弈上面的限制，是指该策略在子博弈中所有决策结上规定的行动所构成的子博弈上面的策略。定义4.2一个纳什均衡在一个子博弈上面的限制，是指所有均衡策略在该子博弈上面的限制所构成的策略组合。定义4.3一个纳什均衡是子博弈精炼纳什均衡，是指该纳什均衡在所有子博弈上面的限制都是对应子博弈上面的纳什均衡。显然，子博弈纳什均衡所规定的行动，一定会得到实施，不存在机会主义行为。我们应将含有不可置信威胁或承诺的纳什均衡剔除，我们就需要用子博弈精炼纳什均衡进行预测。为了获得有关子博弈精炼纳什均衡的进一步刻画，我们下面先对对称信息动态博弈进行公理化描述：我们将从博弈开始的一段连续的树枝称为一段“历史“，譬如在图4.5中，（进入）是一个历史，（进入，，不进入）也是一段历史。定义4.4一个组合,,,()iNHPu是一个对称信息动态或者扩展式表述博弈，如果下列条件成立：（i）交代参与人集合1,2,,Nn,n为自然数；（ii）序列（有限或无限）集合H，满足：·空序列（历史）H。·若11,...,,

经济博弈论4

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

某某机械制造有限公司工作标准（DOC112页）

77365_一个完美的土方工程施工组织设计

工程流体力学复习

关于加快发展休闲旅游农业的意见

品牌文化：白酒品牌稳健发展的翅膀和灵魂

奇瑞东方之子整合传播方案（带VIc策划）-09yz--1921@msn.cn

危机意识管理强势管理-讲义

对环境的察觉复习-PowerPoint演示文稿

加油站培训教材

安徽省实施《中华人民共和国消防法》办法(doc6)(1)

相关文档

相关搜索