《博弈论原理模型与教程》第02章Nash均衡第02节重复剔除劣战略行为

1《博弈论：原理、模型与教程》第一部分完全信息静态博弈第2章Nash均衡2.2重复剔除劣战略行为（已精细订正！）1、定义2-3【例2-3】【例2-4】【例2-5】2、定义2-4第2.1节占优行为第2.2节重复剔除劣战略行为第2.3节Nash均衡2在“囚徒困境”中，“坦白”是小偷的占优战略，也就是说，相对于战略“抵赖”，“坦白”在任何情况下都是小偷的最优选择。因此，小偷只会选择战略“坦白”。反过来也可以这么理解：相对于战略“坦白”，小偷选择“抵赖”所得到的支付都要小于选择“坦白”所的得到的。既然选择“抵赖”的所得总是小于选择“坦白”的所得，小偷当然就不会选择“抵赖”，这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。考察更一般的n人博弈情形。在n人博弈中，如果存在参与人i的占优战略is，那么他在博弈中的战略选择问题就很简单：选择占优战略is。但在大多数博弈问题中，参与人的占优战略并不存在。虽然不存在占优战略，但在某些博弈问题中，参与人i在对自己的战略进行比较时，可能会发现这样的情形：存在两个战略is和is（is，isiS），is虽然不是占优战略，但与is相比，自己在任何情况下选择is的所得都要大于选择is的所得。在这种情况下，理性参与人i的选择又有什么样的特点呢？虽然不能确定参与人i最终会选择什么样的战略，但可以肯定的是，理性参与人i绝对不会选择战略is。因为参与人i选3择战略is，还不如直接选择战略is（因为参与人i在任何情况下选择is的所得都要大于选择is的所得）。定义2-3在n人博弈中，如对于参与人i，存在战略is，isiS，对jnijjiSs1，有),(),(iiiiiissussu则称战略is为参与人i的劣战略，或者说战略is相对于战略is占优。在博弈中，如果战略is是参与人i劣战略，那么参与人i肯定不会选择战略is。这也是相当于参与人i将战略is从自己的战略集iS剔除掉，直接从战略集}{\iisS中选择自己的战略。参与人的这种选择行为称之为剔除劣战略行为。剔除劣行为也是理性参与人选择行为的基本特征之一。考察战略式博弈niniuuuSSSG,,,,;,,,,;11。如果战略is是参与人i的劣战略，那么参与人i将只会从战略集}{\iisS中选择自己4的战略。令}{\iiisSS，构造一个新的战略式博弈niniuuuSSSG,,,,;,,,,;11。此时，对战略式博弈G的求解问题就可以转换为对G的求解。【例2-3】考察图2-4中的战略式博弈，其中参与人1有两个战略——1a和2a，参与人2有三个战略1b，2b和3b。从图2-4中可以看出：战略2b相对于战略3b占优，也就是说3b是参与人2的劣战略。因此，对图2-4中博弈问题的求解就可以转换为对图2-5中博弈的求解。1a1b3b2b1，02a参与人13，21，12，22，00，1图2-4战略式博弈参与人25遵循上面的求解思路，如果在新构造出来的战略式博弈G中，存在参与人j的某个劣战略js，那么又可以构造出一个新的战略式博弈G，其中参与人j的战略集为}{\jjjsSS。此时，对战略式博弈G的求解问题就可以转换为对G的求解。而参与人的这种不断剔除劣战略的行为称为重复剔除劣战略行为。【例2-4】考察图2-6中的战略式博弈，其中参与人1有三个博弈——1a，2a和3a，参与人2有三个战略1b，2b和3b。3a1a1b3b2b1，02a参与人13，21，13，22，02，1图2-6战略式博弈参与人22，11，33，21a1b2b1，02a参与人13，22，20，1图2-5战略式博弈参与人26从图2-6中可以看出：战略3b是参与人2的劣战略。因此，对图2-6中博弈问题的求解就可以转换为对图2-7中博弈的求解。从图2-7中又可以看出：战略3a是参与人1的劣战略。因此，对图2-7中博弈问题的求解就可以转换为对图2-8中博弈的求解。也就是对图2-6中原博弈问题的求解就可以转换为对图2-8中博弈的求解。1a1b2b1，02a参与人13，23，22，1图2-8战略式博弈参与人23a1a1b2b1，0参与人13，33，22，1图2-7战略式博弈参与人22，11，32a7如果以上重复剔除劣战略的过程可以不断进行下去，直到新构造出来的博弈中每个参与人都只有一个战略，那么由所有的参与人剩下的唯一战略所构成的战略组合就是原博弈问题的解，称之为“重复剔除的占优均衡”。此时，也称原博弈问题是“重复剔除劣战略可解的”。【例2-5】考察图2-9中的战略式博弈，其中参与人1有三个战略——1a、2a和3a，参与人2有三个战略1b，2b和3b。从图2-9中可以看出：战略3b是参与人2的劣战略。因此，对图2-9中博弈问题的求解就可以转换为对图2-10中博弈的求解。从图2-10中又可以看出：战略3a是参与人1的劣战略。因此，对图2-10中博弈问题的求解就可以转换为对图2-11中博弈的求解。3a1a1b3b2b1，02a参与人13，11，13，32，02，2图2-9战略式博弈参与人22，41，33，28从图2-11中又可以看出：战略1b是参与人2的劣战略。因此，对图2-11中博弈问题的求解就可以转换为对图2-12中博弈的求解。2a1a2b3，3参与人12，2图2-12战略式博弈参与人21a1b1，02a参与人13，13，32，2图2-11战略式博弈2b参与人23a1a1b2b1，0参与人13，13，32，2图2-10战略式博弈参与人22，41，32a9在图2-12中，参与人2只有一个战略2b，参与人1选择战略1a，因此原博弈问题的解为战略组合),(21ba。而),(21ba就是所谓的重复剔除的占优均衡。在某些博弈问题中，参与人i在对自己的战略进行比较时，还可能会发现这样的情形：存在两个战略is和iS（is，isiS），与is相比，虽然选择is的所得并不一定总是大于选择is的所得，但自己在任何情况下选择is的所得都不会比选择is的所得小，而且在某些情况下选择is的所得严格大于选择is的所得。显然，在这种情况下，理性的参与人i将战略is从自己的选择中剔除掉也是有道理的。与定义2-3中所定义的劣战略相仿，称战略is、为参与人i的弱劣战略。定义2-4在n人博弈中，如果对于参与人i，存在战略is，isiS对jnijjiSs1，有),(),(iiiiiissussu且jnijjiSs1，使得10),(),(iiiiiiSSuSSu则称战略is为参与人i的弱劣战略，或者说战略is相对于战略is弱占优。有时为了表述方便，也将定义2-3所定义的劣战略称为严格劣战略，而将弱劣战略和严格劣战略统称为劣战略。与重复剔除严格劣战略的思路一样，也可以采用重复剔除弱劣战略的方法来求解博弈问题。但需要注意的是，在重复剔除的过程中，如果每次可以剔除的劣战略（包括严格劣战略和弱劣战略）不只一个，那么各个劣战略剔除的顺序不同，得到的博弈结果就有可能不同。除非每次剔除的都是严格列战略。下面通过一个例子来说明这个问题。（重点！）考察图2-13中的战略式博弈。在图2-13中，2b和3b是参与人2的劣战略。11如果首先剔除劣战略3b，那么在新博弈中，战略3a成为弱劣战略，如果再剔除3a，则博弈的结果为战略组合),(11ba；如果首先剔除劣战略2b，那么在新博弈中，战略1a成为弱劣战略，如果再剔除1a，则博弈的结果为战略组合),(13ba。造成博弈结果不同的原因在于：在原博弈中，1a和3a原本互不占优，但是如果先剔除3b，则1a相对于3a弱占优，3a就可能因此被剔除掉；如果先剔除掉2b，则3a相对于1a弱占优，1a就可能因此被剔除掉。因此，当2b和3b的剔除顺序不同时，参与人1保留下来的战略就可能不同。但是，如果只允许剔除严格劣战略，那么无论是先剔除2b还是3b，得到的博弈结果都是战略组合),(11ba和),(13ba。为了进一步说明问题，考察图2-14中战略式博弈，图2-14中博弈与图2-13中博弈的不同之处仅在于战略组合),(11ba下参与人1的支付不同。2a3a参与人11b2b3b3，33，11，21，12，02，01a图2-13战略式博弈参与人23，41，33，212在图2-14中，1a和3a也是互不占优。但是，在剔除劣战略2b和3b的过程中，无论是先剔除2b还是3b，只会出现1a相对于3a占优的情形，而不会出现3a相对于1a占优或弱占优的情形。因此，无论剔除劣战略的顺序如何，博弈的结果都是战略组合),(11ba。前面一再提到博弈分析是在假设博弈问题的结构和参与人完全理性为共同知识的前提下进行的，现在分析如果没有这样的假设，所得到的博弈问题的解——占优战略均衡和重复剔除的占优均衡是否存在。当参与人理性时，如果参与人的占优战略，那么无论其他参与人参与人13a1b2b3b4，33，11，21，12，02，0图2-14战略式博弈参与人23，41，33，22a1a13是否理性或者是否知道他是理性的，他都会选择占优战略。因此，如果博弈中存在占优战略均衡且所有的参与人都理性，那么博弈的结果就是占优战略均衡。也就是说，不需要完全理性为共同知识就可确保占优战略均衡为博弈的结果。但是，必须清楚：存在占优战略均衡的博弈绝对只是博弈问题中的极少数，在大多数情况下占优战略均衡是不存在的。更重要的是，如果仅仅假设参与人是理性的，就会发现及时博弈问题是“重复剔除劣战略可解的”，也无法保证博弈的结果就是重复剔除的占优均衡，这是因为：在重复剔除过程的每一步中，如果只假设参与人理性，那么只能确保参与人将其劣战略剔除掉；而如果其他参与人不知道他是理性的，就不能确保其他参与人知道他已将劣战略剔除掉。在这种情况下，就不能讲原博弈问题转换为新的博弈问题，也就是说，虽然剔除劣战略行为是理性参与人选择行为的基本特征，但如果仅仅假设参与人理性是不能确保重复剔除的。在例2-3中，如果参与人1不知道参与人2的理性的，他就不知道自己面临的博弈问题已由图2-4中的战略式博弈转换为图2-5中的博弈。同样，如果参与人2不知道参与人1知道自己是理性的，图2-4中的战略式博弈也不能转换为图2-5中的博弈。在例2-4中，要确保图2-6的中博弈转换为图2-8中的博弈，就14必须要求每个参与人都知道博弈问题转换的每一步（即每一次剔除劣战略），而且还要知道其他参与人知道博弈问题转换的每一步。具体讲就是：（1）参与人2是理性；（2）参与人1知道到参与人2理性，参与人2知道参与人1知道到参与人2理性；（3）参与人1是理性，参与人2知道到参与人1理性，参与人1知道参与人2知道到参与人1理性。而在例2-5中，对参与人理性假设的要求就更为复杂，除了例2-4中所要求的以上3点外，对理性还有进一步的要求。所以，随着博弈中参与人人数的增加及参与人战略空间的增大，重复剔除的过程就会越来越复杂，对理性假设的要求也就越来越高。因此，为了确保博弈分析的顺利进行，一般都假设参与人完全理性为共同知识。基于同样的理由，也假设博弈问题的结构（包括参与人的支付）为共同知识。

《博弈论原理模型与教程》第02章Nash均衡第02节重复剔除劣战略行为

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

ERP讲稿PPT(1)

基于实例驱动的真实感个性化虚拟试衣机制研究

心情转折-智慧的决择

服装色彩知识DOC5(1)

天津农业科

数字化工厂_工程建模

1、实战型企业快速上市路径和并购重组方略

第14章成本报表

文明礼仪知识竞赛题

东莞热电扩建项目审查意见一稿

相关文档

相关搜索