您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 第十一讲 广延型博弈与反向归纳策略
第十一讲广延型博弈与反向归纳策略广延型博弈适合于分析动态博弈过程,其强调的重点在行动的时序性,以及参与人决定策略时所拥有的信息集。•第一节广延型博弈的定义与形式•一、广延型博弈的定义•信息完美(perfectinformation),是指每一个参与人在其作决策时,对于以前所发生的事件具有完全的信息。•广延型博弈构成要素(1)决策点与决策分枝的结构,在初始决策点与最终结局点之间不存在任何闭环(closedloops);(2)清楚地指明什么决策点属于哪一个参与人;(3)在自然决策点上选择的概率是公共知识;(4)参与人作决策时所依据的信息集;信息集把参与人在某一时刻的所有决策点分成若干类;(5)在博弈的终极点上每一个参与人的收益二、广延型博弈的形式•广延型博弈是以“决策树”或“博弈树”的形式来表达的。122(2,0)(2,-1)(1,0)(3,1)LRMNMN三、广延型博弈的规则•第一,初始点没有一条箭头指向它;对其他所有箭头,都只有一条箭头指向它。•第二,如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回这一点,我们只能按反向逐次返回原点。•第二节完美信息广延(动态)博弈•一、特征。•(一)决策有先后顺序•(二)关于博弈进程的信息是不对称的•后决策者拥有更多信息。•(三)具有完美信息:•即参与人决策时完全了解之前的博•弈过程的信息。•(四)动态博弈至少有两个阶段;阶段:•参与者在某一时点进行的一次决策。二、可信性:•先决策者对后决策者行为的信任性。•即先决策者是否相信后决策者是否采取•有利的(许诺)或不利的(威胁)行为。例1:父女博弈。•女儿交了一个父亲不喜欢的男友,•父亲威胁说:“你如果不断绝与他的关系,我与你断绝关系。”•女儿是否相信父亲的威胁?这一博弈可如下表示:女儿父亲•作为女儿,知道父亲断绝与女儿的关系•损失是非常大的,•因此,对父亲来讲,即使女儿不听话,“断•绝”是下策,应被剔除掉:女儿父亲聪明的女儿在看到父亲的威胁不可信时,一定不会选择“不交往”女儿父亲父亲的威胁是不可信的。•因此,所谓不可信的威胁,•就是指一旦采取该策略,•给他本人带来的收益•并非最大的策略例2:开金矿(二阶段):•参与人2欲开采一价值4万元的金矿,•但缺乏1万资金,参与人1恰拥有•一万元资金。参与人2对参与人1说:•“如果你把钱借给我,•我与你平分开金矿所得。”•参与人1是否应相信2把钱借给他?12在参与人借的资金开发金矿后,平分所得是其下策,故应被剔除:12这时,“借”成为参与人1的下策,故应被剔除:1参与人2的许诺是不可信的。•所谓不可信的许诺,•就是指一旦采取该策略,•给他本人带来的收益•并非最大的策略例3:开金矿(三阶段)•在有完善的法律制度的条件下,•参与人1可以在参与人而不信•守承诺的情况下选择与其打官司,•这样就变成了一个三阶段博弈。•这时参与人1是否应相信2的承诺?121121在参与人2不信守承诺的情况下,不打官司是参与人1的下策故应被剔除由于参与人1必定会选择打官司,故不分是参与人2的下策因此被剔除12在这种情况下,参与人1知道参与人2必定会其起平分收益,不借则变成了他的下策,剔除之。12•在法律制度建立后,•参与人2的许诺变为可信•在法律健全时,•既可保障社会公平,•又可提高社会经济活动效率。•所谓可信的许诺(威胁),•就是指一旦采取该策略,•给他本人带来的收益一定•最大的策略三、子博弈和逆推归纳法•(一)子博弈:•从一个博弈的某个阶段开始的•能够自成一个博弈的后续阶段。•它必须有一个初始信息集,•具备进行博弈的需要的各种信息。(二)逆推归纳法:•从动态博弈的最后一个阶段•或最后一个子博弈开始,•逐步倒推以求解动态博弈的方法。四、子博弈精炼纳什均衡•如果动态博弈中各参与人•的策略在动态博弈本身和•所有子博弈中都构成一个•纳什均衡,则称该策略组合为•一个子博弈精炼纳什均衡。例4.讨价还价博弈(三阶段)•设两人就如何分割1万元进行谈判,•规则如下:首先由1提出•一个分割比例S1,2可以接•受也可以拒绝,如果2拒绝,•则提一个分割比例S2,•这时1可以接受,•也可以拒绝,如果拒绝,•则出价S则2必须接受假设每经过一轮要有一定的折扣,折扣因子为。的大小与谈判者的耐心,通货膨胀以及资金的时间价值等有关。121解:展开表示为应用逆推归纳法。第三阶段:1出S,2必须接受,因此S=1121第二阶段:2知道在第三阶段1必出S=1,因此,为了避免这一情况的出现,自己出的S2(即1的所得)应满足:2222SSS必有为了使自己的利益最大即这时博弈树变为121•第一阶段,如果1的出价S1满足•1-S1≥δ(1-δ)•即S1≤1-δ+δ2•则2不会拒绝•因此,1的最优出价•S1=1-δ+δ2•这时•S1=1-δ+δ2δ2•避免进入下一段谈判,•双方获得的收益均达到最大。•¥12最终的博弈路径(子博弈精炼纳什均衡)为例5.求下列四阶段动态博弈的子博弈精炼纳什均衡。1211第三节有同时选择的动态博弈•一、特征:•在博弈的某些阶段,•有多个参与者同时进行决策11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1D•当博弈进行到第三阶段时,1,2必须同时作了决策,•(或者说,每个参与人在决策时,并不知道对方作出了什么选择)。•这样在第三阶段构成了一个策略(静态)博弈(二人零和博弈)。这一策略(静态)博弈的收益矩阵为:参与人1参与人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2•这个策略(静态)博弈有唯一的•一个混合策略纳什均衡:•((1/2,1/2),(1/2,1/2)),•其带给双方的期望收益(0,0)•这样这个博弈可以简化为12VRL(2,2)(3,1)D(0,0)继续运用逆推归纳法,易求得子博弈精炼纳什均衡为12L(3,1)D二、求解方法•(一)按逆推归纳法的思路进行求解。•(二)对同时选择构成策略(静态)博弈的阶段,分别应用策略(静态)博弈求解法求解•(三)将求解结果分别代入原博弈简化,•再按逆推归纳法求解。例2,银行挤兑•两客户在银行各存100元,银行•将这200元投资于一个长期项目,•如果在项目到期前抽回资金,•则只能收回140元(记为日期1),•如果到期后(日期2)再收回投资,•则可回收本利280元。客户抽回存款的日期也是这两种,这一博弈可扩展表示如下:11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)解:应用逆向归纳法的思想求解。在日期2(即第二阶段),两客户决策构成了一个策略(静态)博弈,其正规型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2•显然,这一策略(静态)博弈有唯一的•纳什均衡为(抽,抽),其收益分别为140,140。•将这一结果代入原博弈,•可简化为:12不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)它又构成了一个策略(静态)博弈其正规型表示如下21抽不抽概率抽70,70100,140P不抽40,100140,1401-P概率r1-r日期1•这一博弈有两个纯策略纳什均衡•(抽,抽)和(不抽,不抽),•还有一个混合策略纳什衡,•即各以4/7的概率在第1日•期抽回资金。结果分析:•1.当信用环境非常好的情况下,•客户的选择是在第1日期•“不抽”,在第二日期“抽回”,•双方获利最大(140,140)2.当信用环境非常不好的情况下,客户的选择是在第1日期“抽”,在双方获利最小(70,70)3.当信用环境一般的情况下,客户数量很大时,将有4/7的客户在第1日期抽回资金。或者说,客户将抽回4/7的资金例3,关税与不完全国际竞争设有两个国家1,2,分别有两上企业(分别记为企业1,企业2),企业1,2生产既内销又出口的相互竞争商品,确定国家1,2的关税策略和企业1,2的产量策略。例3,关税与不完全国际竞争设有两个国家1,2,分别有两上企业(分别记为企业1,企业2),企业1,2生产既内销又出口的相互竞争商品,确定国家1,2的关税策略和企业1,2的产量策略。设Qi为国家i的市场商品总量,反需求函数Pi=a-Qi,企业i生产hi个单位供内销,ei单位供出口,因此Qi=hi+ej(i≠j)单位成本为常数C,国家i的关税率为ti•设设首先由两国政府同时制定关税率ti,•企业1、2根据t1,t2同时决定各自内销和•出口的产量(h1,e1)和(h2,e2)。解:企业以利润最大化为目标,利润函数为jietehceheahehaetehcephpeehhttijiiijiijiijiiijiiii212121,,,,,•国家以社会福利最大化•为目标,包括消费者剩•余,本国企业的利润和•国家关税三部分,社会•福利函数为:jieteheehhttwwjiijiii2212121)(21,,,,,应用逆时归纳法来分析此博弈先从第二阶段开始,可设t1,t2已定,求maxлi的解00,iieh000022221111eheh由323323102202201101tcaetcahtcaetcah得再回到第一阶段两国之间的博弈。将上述结果分别代入wi得329291822221jijiitcattcatcatcaw0iitw令30201catt得即两国的最佳关税选择为)3,3(caca将这一结果代入得994caecahii
本文标题:第十一讲 广延型博弈与反向归纳策略
链接地址:https://www.777doc.com/doc-831691 .html