您好,欢迎访问三七文档
上次内容回顾动态博弈的概念完美信息和完全信息(信息集)扩展式表示(博弈树)动态博弈的策略式表示逆向归纳法(BackInduction)承诺的置信(反国家分裂法)子博弈完美均衡斯塔克博格(Stackelberg)模型1子博弈完美均衡与BI2先动优势?后动优势NIMSteporthrow34讨价还价实例假设两人就冰激凌的分配讨价还价。冰激凌会随时间而融化。假设冰激凌重量为100克,每一回合融化10克(即10个回合全部融化)。假设甲先提议,然后是乙。5讨价还价实例两回合谈判的均衡结果推导过程:第二回合乙提议之后博弈结束,因此相当于他面临独裁博弈。此时,他会将全部冰激凌分给自己(比例为1)。由于已经化掉1/10,因此,尽管乙得到了全部,但实际上是90克;甲什么也没得到。再回溯到第一回合,为了不使乙反对,甲必须使得乙所获得的冰激凌实际额不低于其第二回合的数量。因此,均衡结果是甲10克,乙90克6讨价还价实例三回合谈判的均衡结果推导过程:第三回合甲提议之后博弈结束,因此相当于他面临独裁博弈。此时,他会将全部冰激凌分给自己(比例为1)。由于已经化掉2/10,因此,尽管甲得到了全部,但实际上是80克;第二回合中,为了不使甲反对,乙必须使得甲所获得的冰激凌实际额不低于其第三回合的数量,即甲80克,乙10克;再回溯到第一回合,为了不使乙反对,甲必须使得乙所获得的冰激凌实际额不低于其第二回合的数量,即乙10克,甲90克。因此,均衡结果是甲90克,乙10克7讨价还价实例同学们可以自己推导一下,第9回合和第十回合的均衡结果是多少?8讨价还价实例第9回合,甲60克,乙40克;第10回合,甲乙各50克。推导过程9和10回合.doc9讨价还价实例结论:1,低于10回合外,谁最后提议,谁有优势。2,谈判的回合越多,两人的利益分享额越接近平均分配。3,回合足够多得话,平均分配合作利益。10经典案例(2):讨价还价博弈讨价还价(bargaining)是市场中最常见、普通的事情。也是博弈论中典型的动态博弈问题。讨价还价模型还可以推广到谈判问题。这里介绍的是讨价还价最为经典的模型。11经典案例(2):讨价还价博弈假设有两个人分割一块蛋糕,参与人1先出价(offer),参与人2可以选择接受(accept)或拒绝(reject);如果参与人2接受,博弈结束,蛋糕按参与人1的方案分配。如果参与人2拒绝,参与人2出价,参与人1决定接受或拒绝;如果参与人1接受,博弈结束,蛋糕按参与人2的方案分配。如果参与人1拒绝,参与人1再出价…12经典案例(2):讨价还价博弈上述过程反复进行,直到一个参与人的出价被另一个参与人接受为止。这是一个无限期完美信息博弈,参与人1在1,3,5,…出价,参与人2在时期2,4,6,…出价。13经典案例(2):讨价还价博弈若用x表示参与人1的份额,(1-x)表示参与人2的份额,x1和(1-x1)分别是参与人1出价时参与人1和参与人2的份额,x2和1-x2分别是参与人2出价时参与人1和参与人2的份额。假定参与人1和参与人2的贴现因子分别为δ1和δ2,如果博弈在时期t结束,t是参与人i的出价阶段,则参与人1支付的贴现值是π1=δ1t-1xi,参与人2支付的贴现值是π2=δ2t-1(1-xi)14经典案例(2):讨价还价博弈结合切蛋糕问题,贴现值既可以理解为资金的时间价值由于蛋糕由于未被分割出去所造成的自然缩减。双方的耐心程度。15经典案例(2):讨价还价博弈问题分析由于该博弈是无限期博弈,因此,不能直接采用逆推归纳法。为分析上述问题,先考虑阶段数有限的情形。16经典案例(2):讨价还价博弈有限阶段讨价还价问题假定博弈只进行两个时期,在T=2,参与人2出价,如果他提出x2=0,参与人1会接受(假定参与人在接受和拒绝之间无差异时,我们假定他选择接受)。因为博弈在T=2时,参与人1再没有讨价还价的机会。17经典案例(2):讨价还价博弈参与人2在T=2时得到的1单位等价于在t=1时的δ2单位,因此,如果参与人1在t=1时出价1-x1≥δ2,参与人2会接受;因为参与人1没有必要给参与人2多于他会接受的最低份额,博弈均衡结果是参与人1得到x=x1=1-δ2,参与人2得到1-x=δ21812(a)T=1时参与人1出价情况(b)T=2时参与人2出价情况图2-18两阶段讨价还价示意12δ21-δ2经典案例(2):讨价还价博弈19经典案例(2):讨价还价博弈再假定T=3在最后阶段,参与人1出价,他可以得到的最大份额是x1=1;因为参与人1在T=3时1单位等价于T=2时的δ1单位,因此,如果参与人2在T=2时出价x2=δ1,参与人1将会接受;因为参与人2在T=2的(1-δ1)单位等价于T=1时的δ2(1-δ1),因此,如果参与人1在T=1时出价1-x1=δ2(1-δ1),参与人2将会接受。因此,子博弈精炼均衡结果是x=1-δ2(1-δ1)20当T=4,5,…等有限整数值时,仿照前述方法,可以推导出任何给定的T的子博弈精炼纳什均衡。如果δ1=δ2=0,不论T为多少,子博弈精炼均衡的结果是x=1;就是说,如果两个参与人都是绝对无耐心的,第一个出价的人得到整个蛋糕;如果δ2=0,不论δ1为多少,子博弈精炼均衡结果仍然是x=1;如果δ1=0,δ20,子博弈精炼均衡结果是x=1-δ2经典案例(2):讨价还价博弈21经典案例(2):讨价还价博弈如果δ1=δ2=1,即双方都有无限耐心,那么,如果T=1,3,5,…,均衡结果是x=1;如果T=2,4,6,…,均衡结果是x=0。这里的结果可以称之为“后动优势”(last-moveradvantage)22经典案例(2):讨价还价博弈一般说来,如果0δi1,i=1,2,均衡结果不仅依赖于贴现因子的相对比率,而且还依赖于博弈时期T和谁在最后阶段出价。然而,这种依存关系随着T的变大而变小当T趋于无穷时,我们得到“先动优势”:如果δ1=δ2=δ,唯一的纳什均衡结果为x=1/(1+δ)23无限阶段讨价还价问题罗宾斯坦恩(Rubinstein,1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是212*11x经典案例(2):讨价还价博弈24无限阶段讨价还价问题罗宾斯坦恩(Rubinstein,1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是如果δ1=δ2=δ,则212*11x11*x经典案例(2):讨价还价博弈25经典案例(2):讨价还价博弈上述定理的证明由于T=∞,博弈没有最后阶段,不可能使用逆推归纳法。但根据Shaked,Sutton(1984),因为从参与人1出价的任何一个阶段开始的子博弈等价于从T=1开始的整个博弈,因此可转换为有限阶段讨价还价问题。见图2-19。26从任一阶段开始的子博弈(t为奇数)…图2-19无限阶段讨价还价问题t=1t=2t=k…t=3从t=1阶段开始的整个博弈经典案例(2):讨价还价博弈27假定在时期t≥3时参与人1出价,参与人1能得到的最大份额是M;对参与人1而言,t期的M等价于t-1期的δ1M,参与人2知道在t-1时期的任何x2≥δ1M的出价将被参与人1接受,因此参与人出价x2=δ1M,自己获得1-δ1M;对于参与人2而言,t-1期的1-δ1M等价于t-2期的δ2(1-δ1M),参与人知道在t-2期的任何x1=1-δ2(1-δ1M)出价将被参与人2接受,因此参与人1出价x1=1-δ2(1-δ1M)t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)经典案例(2):讨价还价博弈28因此有x=1-δ2(1-δ1M)=M进而求得t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)经典案例(2):讨价还价博弈21211M29与此类似,可求出参与人1能够获得的最小份额m,为21211M21211m21211x经典案例(2):讨价还价博弈由于参与人1能得到的最大份额和最小份额相同,均衡结果是唯一的,为30多阶段静态博弈该类模型中至少在某个阶段参与人同时选择其决策。31多阶段静态博弈模型一例博弈中有四个参与人,分别用参与人1~4表示。第一阶段是参与人1与2的决策选择阶段,他们同时在各自的策略集A1和A2中分别选择a1和a2。第二阶段是参与人3与4决策选择阶段,他们看到参与人1和2的决策a1和a2后,同时在各自的策略集A3,A4中分别选择a3和a4。各参与人的支付函数是参与人的策略a1,a2,a3,a4的函数,记为ui=ui(a1,a2,a3,a4)32多阶段静态博弈有同时选择的动态博弈问题如国际竞争中最优关税博弈问题,两个制定关税的国家可看成标准模型中的参与人1与2;两国各自的一个相互进行产量竞争的企业就是模型中的参与人3于4。上述标准模型的变形,如某个阶段只有一个参与人;第二阶段的参与人3于4与第一阶段的参与人1与2相同等,也属于同时选择的动态博弈问题。33多阶段静态博弈这类模型实质上就是完美信息动态博弈,因此仍然可以采用逆推归纳法进行分析。因为存在同时选择,因此每个阶段不再是单人优化问题,而是一个静态博弈。34多阶段静态博弈简例:挤兑博弈问题描述:银行信贷对社会经济发展的作用无可估量,但它在带来巨大利益的同时也蕴含着一定的风险。设一家银行为了给一个企业贷放一笔20000元的贷款,以20%的年利率吸引客户存款。若两个客户各有10000元资金,如果他们把资金作为1年期定期存款存入该银行,那么银行就可以向企业贷款。如果两客户都不愿存款或只有一个客户存款,那么银行就无法给上述企业贷款,这时候客户的本金可以保全。35多阶段静态博弈简例:挤兑博弈在两个客户都存款,从而银行给上述企业提供贷款的情况下,如果银行满1年收回贷款,企业就能完成一笔生意,银行可收回贷款本息,并可支付存款客户的存款本息。如果在不到1年的时候,其中任何一个客户单独或同时要求提前取出存款,银行就不得不提前收回贷款。假设银行只能收回80%的本钱。若只有一个客户要求提前取款,则银行会偿还其全部本金,余款则属于另一客户;若两客户同时要求提前取款,则平分回收的资金。36多阶段静态博弈简例:挤兑博弈根据上述假设,可以用图2-20的两个矩阵表示该问题。不存存款不存1,11,1存款1,1下一阶段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客户2客户1图2-20银行挤兑风险客户2客户1第一阶段第二阶段37多阶段静态博弈简例:挤兑博弈用逆推归纳法来分析该博弈。在第二个阶段的博弈。这是一个二人完全信息静态博弈,可以得出该博弈有两个纯策略纳什均衡(提前,提前)和(到期,到期)。对应的支付情况分别为(0.8,0.8)和(1.2,1.2)。分别为风险占优均衡和帕雷托占优均衡。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客户2客户1第二阶段38多阶段静态博弈简例:挤兑博弈其中,风险占优均衡就是“挤兑”现象,而帕雷托占优则是金融健康的经济现象。若采用风险占优策略的客户比例较大,超出了银行承受能力,就可能会造成金融危机。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客户2客户1第二阶段39如果第二个阶段博弈结果是比较理想的(到期,到期)纳什均衡,那么这时候第一阶段的博弈相当于图2-21的支付矩阵(完全信息静态博弈)。不存存款不存1,11,1存款1,1下一阶段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2第一阶段40如果第二个阶段博弈结果是比较理想的(到期,到期)纳什均衡,那么这时候第一阶段的博弈相当于图2-21的支付矩阵(完全信息静态博弈)。不存存款不存1,11,1存款1,11.2,1.2多阶段静态博弈简例:挤兑博弈图2-21第一阶段等价博弈(1)41此时也有两个纯战略纳什均衡,为(不存,不存),(存款,存款),且
本文标题:博弈论第7讲
链接地址:https://www.777doc.com/doc-4901737 .html