您好,欢迎访问三七文档
3.完全信息动态博弈完全完美信息博弈完全非完美信息博弈自然不首先行动•扩展式表示,策略•序贯理性,逆向归纳,子博弈完美纳什均衡•应用举例•多阶段可观测行动博弈•重复博弈3.1扩展式表示策略•纯策略•混合策略•行为策略•等价策略,两个纯策略si和si’是等价的,如果他们在竞争对手所有的纯策略之下能产生相同的结果概率分布。•Kuhn1953,在完美回忆博弈中,混合策略与行为策略是等价的。•每个混合策略会生成唯一的行为策略。•每个行为策略可由多个不同的混合策略生成。3.2序贯理性、逆向归纳、子博弈精炼•动态博弈中,纳什均衡可能不会给出合理的预测。•序贯理性:参与人的策略应该规定在博弈树每一点的最优行动。也就是说,给定参与人发现自己处于博弈树的某一点,那么给定竞争对手的策略,他的策略应该规定从该点起的最优行动。完美信息博弈逆向归纳求解有限完美信息博弈中的逆向归纳法•定理(Zermelo,1913)有限完美信息博弈存在由逆向归纳法导出的纯策略纳什均衡。如果参与人在任意两个终点的支付都不相同,则纳什均衡唯一。子博弈完美纳什均衡•定义:扩展式博弈的一个子博弈,具有如下性质:–从一个结点的信息集开始,含有这个决策结的所有后续决策结;–如果x在子博弈中,那么也在子博弈中。•定义:SPNE'()xHx•任意一个SPNE都是一个纳什均衡,反之不对•如果博弈的唯一子博弈是他本身,那么每一个纳什均衡都是子博弈精炼的•一个SPNE在每个子博弈中都导出一个子博弈完美纳什均衡。•有限完美信息博弈有子博弈完美纳什均衡一般化逆向归纳方法•从博弈终点开始,判别每个最终子博弈的纳什均衡•每个最终子博弈中,选择一个纳什均衡,向上迭代,其中最终子博弈由参与人的均衡策略带来的支付取代。•重复上述步骤,直到确定均衡路径。在不同信息集的行动组合构成一个SPNE策略组合。应用举例•Stackelberg模型•策略投资模型•企业和工会谈判模型•宏观经济政策的动态一致性3.3多阶段可观测行动博弈•所有参与人在阶段k选择其行动时,都知道所有参与人在以前所有阶段0,1,2…..k-1所选择的行动;•所有参与人在阶段k行动时都是“同时”行动的(参与人可以不行动)多阶段博弈的子博弈完美纳什均衡•子博弈,从阶段k开始有着历史kh验证子博弈完美的单阶段偏离原则•某一策略组合是否子博弈完美的,只需检验是否存在某一历史ht,使得某个参与人i可以在到达ht时通过偏离策略si给出的行动而在阶段t之后又遵循si的行动而获得好处。单阶段偏离原则•有限期博弈的单阶段偏离原则在多阶段可观测行动博弈中,策略组合s是子博弈完美的当且仅当它满足单阶段偏离原则,即没有一个参与人i可以通过在某阶段偏离s而在其他阶段采取策略s的行动而获得好处。3.4重复博弈•给定阶段博弈G,G(T)表示G重复进行T次的重复博弈。•特点–各阶段博弈是独立的–每次阶段博弈结束时,所有以前的博弈都可以被观测到–总支付是各阶段博弈的加权和•如果阶段博弈G有唯一的纳什均衡,则对任意有限T,重复博弈G(T)有唯一的子博弈完美纳什均衡:G的纳什均衡在每一阶段重复进行。无名氏定理•重复博弈的“无名氏定理”–如果参与人有足够的耐心,那么任何可行的个人理性收益都能在均衡中得以实施。–无论贴现率多大,参与人i在任何静态均衡和任何重复博弈的纳什均衡中至少得到最小最大收益纳什无名氏定理•对每个满足严格个人理性的支付向量
本文标题:3完全信息动态博弈
链接地址:https://www.777doc.com/doc-3303773 .html