您好,欢迎访问三七文档
第四章序贯决策博弈序贯决策博弈:局中人做出策略选择时知道对手的策略选择。实验:枪手博弈1三个快枪手相互之间的仇恨到了不可调和的地步。这天他们三在街上不期而遇,每个人的手都握住了枪把,一场生死决斗马上就要开始……已知这三个人中甲枪法精准,十发八中;乙的枪法也不错,十发六中,丙的枪法拙劣,十发四中。假如三个人同时开枪,决一死战,一枪后谁最后活下来的机会大一些?实验:枪手博弈2假设现在三个枪手决定轮流开枪,谁活下来的机会大一些?实验:海盗分宝五个海盗抢到100颗宝石,他们决定按如下方法来分配:先抽签决定顺序(1,2,3,4,5);然后先由1号提出分配方案,其余的人进行表决,当且仅当半数和超过半数的人同意时,则按1号所提方案分配,否则将1号扔进大海喂鲨鱼,当1号方案被否决,则由2号提出分配方案,其余的人进行表决,以此类推,假定这些海盗都是理性人,问第一个海盗应提出怎样的分配方案才能获得通过并使自己的收益最大?本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。主要内容1、序贯博弈的定义和表示方法2、寻找序贯博弈纳什均衡的“箭头排除确定法”(旧版教材上称为虚线排除确定法)3、寻找序贯博弈纳什均衡的“倒推法”4、先动优势和后动优势5、“倒推法”的缺陷一、序贯博弈的定义和表示方法假如某个垄断企业一年可以赚10亿元的利润,假定别的企业为了进入该行业需要投资4亿元。当新的企业准备进入时,原有垄断企业有两种决策(1)“容忍”,但利润要变为5亿元。这时新的企业可以得5亿,减去4亿投资,仍有1亿。(2)“抵抗”,例如降低价格,企业的利润变为2亿元,且新的企业也只得2亿,但减去投资,亏损2亿。谁先动?潜在进入者,简称“进入者”如何表示该博弈?分析“进入者”和“垄断者”的纯策略。博弈树用博弈树来表示序贯博弈。它描述了博弈参与人的一个序贯决策过程,从博弈数的根开始,到末端点结束。拥有初始决策节点的局中人先做出决策,他的决策引出博弈树的棱,而棱的末端将是下一个局中人做出决策,依此类推。进入障碍博弈进入者●进入不进●垄断者容忍抵抗●容忍抵抗◆(1,5)(-2,2)◆◆◆(0,10)(0,4)垄断者abc“进入者”和“垄断者”的纯策略“进入者”的有两个纯策略:进入和不进入“垄断者”的有四个纯策略:不管你怎样,我总是容忍——{容忍,容忍}不管你怎样,我总是对抗——{对抗,对抗}你进我对抗,你不进我忍——{对抗,容忍}你进我忍,你不进我对抗——{容忍,对抗}注:花括号第一项表示垄断者在上决策节点b,即进入者选择进入时他要选择的行动,第二项表示垄断者在下决策节点c,即进入者选择不进入时他要选择的行动。假设垄断企业的老板交给你这样的策略:{对抗,容忍},你明白应该如何行动吗?策略就是一个完整的行动计划,使得你可以把它交给另外一个人,让他知道如何代表你去执行这个策略。什么是计划:“如果对手选A,我将采取行动X,如果…,我将采取行动…。”行动与策略在同时决策博弈中,行动就是策略。但在序贯决策博弈中,行动是指每一个决策点上局中人的决策变量或行动的具体抉择。策略就是一个完整的行动计划。策略组合该博弈有八种可能的策略组合:({进入},{(上)容忍,(下)容忍})({进入},{(上)对抗,(下)对抗})({进入},{(上)对抗,(下)容忍})({进入},{(上)容忍,(下)对抗})({不进},{(上)容忍,(下)容忍})({不进},{(上)对抗,(下)对抗})({不进},{(上)对抗,(下)容忍})({不进},{(上)容忍,(下)对抗})支付进入者纯策略与垄断者的“计划型”策略形成策略组合,构成一条路径。支付对应每条路径,而不是对应每步选择、行为。支付向量中,数字的排列按局中人的出场顺序出现。(进入者,垄断者)八种策略组合对应的支付({进入},{(上)容忍,(下)容忍})——(1,5)({进入},{(上)对抗,(下)对抗})——(-2,2)({进入},{(上)对抗,(下)容忍})——(-2,2)({进入},{(上)容忍,(下)对抗})——(1,5)({不进},{(上)容忍,(下)容忍})——(0,10)({不进},{(上)对抗,(下)对抗})——(0,4)({不进},{(上)对抗,(下)容忍})——(0,10)({不进},{(上)容忍,(下)对抗})——(0,4)二、寻找序贯博弈的纳什均衡例如:如图所示的情侣博弈,分析该博弈的纳什均衡?男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)男方和女方的纯策略男方有两个纯策略:足球和芭蕾女方有四个纯策略:不管你怎样,我总是芭蕾——{芭蕾,芭蕾}不管你怎样,我总是足球——{足球,足球}你选择什么,我就选择什么——{足球,芭蕾}你选择什么,我就不选择什么——{芭蕾,足球}八种策略组合,纳什均衡在哪该博弈有八种可能的策略组合:({足球},{(上)足球,(下)足球})({足球},{(上)足球,(下)芭蕾})({足球},{(上)芭蕾,(下)足球})({足球},{(上)芭蕾,(下)芭蕾})({芭蕾},{(上)足球,(下)足球})({芭蕾},{(上)足球,(下)芭蕾})({芭蕾},{(上)芭蕾,(下)足球})({芭蕾},{(上)芭蕾,(下)芭蕾})用箭头排除确定法寻找纳什均衡将以上策略在博弈书中用粗线表示。将存在单独改变激励的策略用箭头标示。方法如下:(1)找到第二阶段两根粗线所对应的支付。(2)比较这两个支付前面的数字,如果大的数字所对应的那条“树枝”是细的,则男方存在单独偏离的动机,则男方的策略选择用箭头标示。(3)比较这两个支付后面的数字,其中对应第一阶段“树枝”是细的那个数字可以不再考虑,因为男方没选这个方向。它是“虚”的。(4)因此只在男方选的那个“树丫”上进行比较女方的支付,如果大的数字对应的“树枝”是细的,则女方的策略选择“树枝”用箭头标示。(P142)虚线排除确定法的缺陷该方法可以找到纳什均衡,但找不到博弈的最终结果。均衡是策略的组合,而结果则是行动的组合。(P143)因此,我们一般用倒推法(BackwardsInduction)来寻找序贯博弈的结果。三、寻找序贯博弈的结果——倒推法从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“倒推法”或者“逆推归纳法”。倒推法是动态博弈分析最重要、基本的方法。步骤:从博弈的最后一个阶段开始分析,通过比较最后一个参与决策的局中人的支付,推断他或她的选择,从而将他不会选的策略——“枝桠”砍掉,从而回到上一个阶段,比较该阶段参与决策的局中人的支付,将他或她不会选的策略砍掉,依此类推…男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)×××倒推法:(1)在上面一个枝桠上,由于最后一阶段是女方做决策,因此比较女方的支付1和0,将0所对应的芭蕾策略砍掉,没砍掉的打上箭头。(2)在下面一个枝桠上,由于最后一阶段是女方做决策,因此比较女方的支付-1和2,将-1所对应的足球策略砍掉,没砍掉的打上箭头。(3)回到第一个阶段,比较带箭头的两个策略男方的支付(因为此时男方做决策),将支付将较小的策略砍掉。女博弈树例如:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒练习:法律保障不足的开金矿博弈乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)3.2.3逆推归纳法乙借甲不分分(0,4)(2,2)不借(1,0)3.2.3逆推归纳法乙借不借(1,0)(0,4)练习2:有法律保障的开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)练习2:有法律保障的开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)×××倒推法的评价倒推法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能。逆推归纳法也不能分析比较复杂的动态博弈。在遇到两条路径利益相同的情况时倒推法也会发生选择困难。对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有理性的“共同知识”。四、先动优势与后动优势在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。这种局中人先动得益大于后行得益的情况,叫做先动优势。请比较:男●足球芭蕾●女足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)×××女先动优势当男方先动时,男方得2,女方得1,但当女方先动时,男方得1,女方得2。“先下手为强”女●足球芭蕾●男足球芭蕾●足球芭蕾◆(1,2)(-1,-1)◆◆◆(0,0)(2,1)×××男序贯博弈中的性别战举例:情侣博弈中往往是先动一方具有优势,因此男女双方往往要抢先一步,获得主动权,比如女方已经买好了电影票,再比如男方曾经多次告诉女方,世界杯就算不上班也要看!后动优势后动优势:后行动的得益比先行动的得益大的情况。1.石头、剪刀、布的游戏。2.如何分蛋糕?一块蛋糕两人分,怎么分才公平?你愿意是切还是挑?3.两家价格竞争的企业,在定价方面是不是也有后动优势?用矩阵来演示先动优势和后动优势乙进入不进入左中右4,123,102,123,122,101,11甲甲有后动优势!乙进入不进入左中右4,123,102,123,122,101,11甲甲、乙各有什么优势?乙上下左右10,05,410,1005,0甲甲有先动优势,乙有后动优势。可以预料,利益驱动,原来同时决策的这个博弈,容易演化成甲先决策乙后做决策的序贯博弈。乙上下左右10,05,410,1005,0甲
本文标题:第四章__序贯决策
链接地址:https://www.777doc.com/doc-621510 .html