经济博弈论(博士)第四章.05-11-18使用稿

主讲人：王慧敏河海大学商学院河海大学商学院授课教师：王慧敏4.3子博弈精炼纳什均衡第四章完全信息动态博弈4.2扩展型博弈的策略及均衡4.1扩展型博弈表述4.4子博弈精炼纳什均衡应用举例4.1扩展型博弈表述在静态博弈中，所有参与人同时行动（或行动虽有先后，但没有人在自己行动之前观测到别人的行动）。在动态博弈中，参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行动者的行动。扩展型表述的引入博弈专家习惯于用战略式表述描述和分析静态博弈，而用扩展式表述（extensiveformrepresentation）来描述和分析动态博弈。4.1扩展型博弈表述扩展型表述所“扩展”的主要是参与人的战略空间。战略式表述简单地给出参与人有些什么战略可以选择，而扩展式表述要给出每个战略地动态描述：谁在什么时候行动，每次行动时有些什么具体行动可供选择，以及知道些什么。简单地说，在扩展式表述中，战略对应于参与人的相机行动规则（contingentactionplan），即什么情况下选择什么行动，而不是简单的、与环境无关的行动选择。扩展型表述的引入4.1扩展型博弈表述1.参与人集合：，此外，我们将用N代表虚拟参与人“自然”；2.参与人的行动顺序（theorderofmoves）:谁在什么时候行动；3.参与人的行动空间（actionset）：在每次行动时，参与人有些什么选择。4.参与人的信息集（informationset）：每次行动时，参与人知道些什么；5.参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）；6.外生事件（即自然的选择）的概率分布扩展型表述的要素ni,,14.1扩展型博弈表述n个人有限战略博弈的扩展式表述可以用博弈树来表示。为了说明这一点，我们考虑房地产开发博弈的例子，我们假定该博弈的行动顺序如下：1)开发商A首先行动，选择开发或不开发；2)在A决策后，自然选择市场需求的大小；3)开发商B在观测到A的决策和市场需求后，决定开发或不开发。扩展型表述的表示方式4.1扩展型博弈表述房地产开发博弈树：A开发不开发NN大小大小开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)(1/2)(1/2)(1/2)(1/2)BBBB注意：支付向量的顺序与博弈树上行动顺序是对应的！4.1扩展型博弈表述博弈树基本构造：1.结（nodes）：包括决策结（decisionnodes）和终点结（terminalnodes）两类。决策结是参与人采取行动的时点，终点结时博弈行动路径的终点。在上例中，决策结包括空心圆和所有六个实心圆，终点结包括对应八个支付向量的点。2.枝（branches）：枝是从一个决策结到它的直接后续结的连线（有时用箭头表述），每一个枝代表参与人的一个行动选择。比如，在上图中，开发商A有两个选择，分别用标有“开发”和“不开发”的两个枝表示。4.1扩展型博弈表述博弈树基本构造：3.信息集（informationset）：博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列条件的决策结：1)每一个决策结都是同一参与人的决策结；2)该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处于哪一个决策结。我们引入信息集的目的是描述下列情况：当一个参与人要作出决策时他可能并不知道“之前”发生的所有事情。一个信息集可能包含多个决策结，也可能只包含一个决策结（称为单结信息集（singletons））。可以用虚线将属于同一信息集的两个决策结连起来4.1扩展型博弈表述囚徒困境博弈的扩展式表述：一般假定博弈满足“完美回忆”（perfectrecall）的要求。完美回忆指没有参与人会忘记自己以前知道的事情，所有参与人都只到自己以前的选择。B坦白抵赖A坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)4.2扩展型博弈的策略与均衡纯战略：同样的纯战略，既可以解释为扩展式的，也可以解释为战略式的。不同之处在于：在扩展式表述博弈，参与人式相机行事，即“等待”博弈到达自己的信息集（包含一个或多个决策结）后再决定如何行动；在战略式表述博弈，参与人似乎是在博弈开始之前就制定出了一个完全的相机行动计划，即“如果…发生，我们将选择…”。4.2扩展型博弈的策略与均衡如何从扩展式表述构造战略式表述为了说明这个问题，我们考虑房地产开发博弈的例子不开发B开发不开发A开发不开发开发(-3,-3)(1,0)(0,1)(0,0)B房地产开发博弈的扩展式表述4.2扩展型博弈的策略与均衡如何从扩展式表述构造战略式表述开发商B（－3，－3）（－3，－3）（1，0）（1，0）（0，1）（0，0）（0，1）（0，0）（开发，开发）（开发，不开发）（不开发，开发）（不开发，不开发）开发商A开发不开发战略式表述4.2扩展型博弈的策略与均衡逆向归纳法：逆向归纳法实际上是重复剔除劣战略方法在扩展式博弈中地应用。我们从最后一个决策结开始往回倒推，每一步剔除在该决策结上参与人的劣选择，因此，在均衡路径，每一个参与人在每一个信息集上的选择都是占优选择。上述逆向归纳法的过程不适用于无限博弈和不完美信息博弈。逆向归纳法也不适用于无限博弈并不意味着无限博弈没有纳什均衡存在。4.3子博弈精炼纳什均衡4.3.1引言在纳什均衡中，存在一个很严重的缺陷：纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略选择是给定的，就是说，参与人并不考虑自己的选择对其他人选择的影响。本节将要讨论的泽尔腾（Selten）的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进，它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开。正如纳什均衡是完全信息静态博弈解的基本概念一样，子博弈精炼纳什均衡是完全信息动态博弈解的基本概念。4.3子博弈精炼纳什均衡4.3.1不可置信的存在为了说明上述论点，我们考虑上一节讨论过的房地产开发博弈的例子。不开发B开发不开发A开发不开发开发(-3,-3)(1,0)(0,1)(0,0)B房地产开发博弈的扩展式表述4.3子博弈精炼纳什均衡分析结果：这个博弈有三个纳什均衡，分别为：（不开发，『开发，开发』），（开发，『不开发，开发』）和（开发，『不开发，不开发』）用博弈论的语言来说，纳什均衡（不开发，『开发，开发』）是不可置信的（notcredible），因为它依赖于B的一个不可置信的威胁战略；B的战略是不可置信的，因为给定A选择开发，B不会实施这个威胁。（开发，『不开发，开发』）是这个博弈的唯一子博弈精炼纳什均衡。4.3子博弈精炼纳什均衡4.3.2子博弈精炼纳什均衡泽尔腾（Selten，1965）引入“子博弈精炼纳什均衡”（subgameperfectNashequilibrium）概念的目的是将那些包含不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈结果的一个合理预测。简单地说，子博弈精炼纳什均衡要求均衡战略地行为规则在每一个信息集上都是最优地。我们首先给出子博弈的概念，粗略的说，子博弈是愿博弈的一部分，它本身可以作为一个独立的博弈进行分析。正式地，我们有下述定义：4.3子博弈精炼纳什均衡4.3.2子博弈精炼纳什均衡定义：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结（包括终点结）组成，它满足下列条件：（1）x是一个单结信息集，即；（2）对于所有的，如果，那么解释：条件（1）说的是一个子博弈必须从一个单结信息集开始。条件（2）说的是，子博弈的信息集和支付向量都直接继承自原博弈。要求子博弈满足上述两个条件的目的是保证子博弈对应于原博弈中可能出现的情况。)(xTxxh)()(1xTx)(1''xhx)(''xTx4.3子博弈精炼纳什均衡例如：不开发B开发不开发A开发不开发开发(-3,-3)(1,0)(0,1)(0,0)B原博弈x开发不开发(-3,-3)(1,0)(b)子博弈1X’开发不开发(0,1)(0,0)(c)子博弈24.3子博弈精炼纳什均衡4.3.2子博弈精炼纳什均衡定义：扩展式博弈的战略组合是一个子博弈精炼纳什均衡，如果（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。另外：简单地说，一个战略组合是子博弈精炼纳什均衡，当只当它在每一个子博弈（包括原博弈）上都构成一个纳什均衡。如果整个博弈是唯一的子博弈，纳什均衡与子博弈精炼纳什均衡是相同的；如果有其他子博弈存在，有些纳什均衡可能不构成子博弈精炼纳什均衡。),,,,(1nissss4.3子博弈精炼纳什均衡D1URD‘LU‘(2,0)(1,1)(3,0)(0,2)214.3子博弈精炼纳什均衡4.3.2子博弈精炼纳什均衡这里还需强调一下上述定义中的“在每一个子博弈上给出纳什均衡”这句话。如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”（equilibriumpath），博弈树上的其他路径称为非均衡路径（out-of–equilibriumpath）。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的。“在每一个子博弈上给出纳什均衡”意味着，构成子博弈精炼纳什均衡的战略不仅在均衡路径的决策结上是最优的，而且在非均衡路径的决策结上也是最优的。子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则。4.3子博弈精炼纳什均衡4.3.3用逆向归纳发求解子博弈精炼纳什均衡对于有限完美信息博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。因为有限完美信息博弈的每一个决策结都是一个单独的信息集，每一个决策结都开始一个子博弈。1.给定博弈到达最后一个决策结，该决策结上行动的参与人有一个最优选择，这个最优选择就是该决策结开始的子博弈的纳什均衡（如果该决策结上的最优行动多于一个，那么我们允许参与人选择其中的任何一个；如果最后一个决策者有多个决策结，那么每一个决策结开始的子博弈都有一个纳什均衡）。2.然后倒回到倒数第二个决策结（最后决策结的直接前列结），找出倒数第二个决策者的最优选择（假定最后一个决策者的选择是最优的），这个最优选择与我们在第一步找出的最后决策者的最优选择构成从倒数第二个决策结开始的子博弈的一个纳什均衡。4.3子博弈精炼纳什均衡4.3.3用逆向归纳发求解子博弈精炼纳什均衡3、如此不断直到初始结，每一步都得到对应子博弈的一个纳什均衡，在这个过程的最后一步得到的整个博弈的纳什均衡也就是这个博弈的子博弈精炼纳什均衡例如：房地产开发博弈就是这样一个两阶段完美信息博弈。用逆向归纳法求解这个博弈的精炼均衡的步骤如下：4.3子博弈精炼纳什均衡4.3.3用逆向归纳发求解子博弈精炼纳什均衡在第二阶段，B的最优行动规则是：{不开发，开发}，即，如果A在第一阶段选择了开发，B在第二阶段选择不开发；如果A在第一阶段选择了不开发，B在第二阶段选择开发。因为A在第一阶段预测到B在第二阶段会按这个规则行动，A在第一阶段的最优选择是开发。用逆向归纳法得到的精炼均衡是（开发，{不开发，开发}）。不开发B开发不开发A开发不开发开发(-3,-3)(1,0)(0,1)(0,0)B房地产开发博弈4.3子博弈精炼纳什均衡4.3.3用逆向归纳发求解子博弈精炼纳什均衡上述分析表明，用逆向回归法求解子博弈精炼纳什均衡的过程，实质是重复剔除劣战略过程在扩展式博弈上的扩展：从最后一个决策结开始依次剔除掉每个子博弈的劣战略，最后生存下来的战略构成精炼纳什均衡。根据定义，逆向归纳法只适用于完美信息博弈。但是，有些非完美信息博弈也可以运用逆向归纳法的逻辑求解。4.3子博弈精炼纳什均衡4.3.4承诺行动与子博弈精炼纳什均衡我们已经看到，有些纳什均衡之所以不是精炼均衡，是因为它们包含了不可置信的威胁战略。这一点意味着，如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数，原来不可置信的威胁就可能变

经济博弈论(博士)第四章.05-11-18使用稿

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

从品牌传播角度谈地产广告的卖点整合

浙江富阳世纪大厦工程施工组织设计方案

电子设计可靠性工程2元器件选用

某矿铜矿重大危险源监控和重大隐患整改制度

摄影大赛策划书

如何减少工厂浪费

乡镇XXXX年人才工作总结

静安动力国际企划提案

美国万通公开上市与

蓄电池牵引车项目可行性研究报告

相关文档

相关搜索