您好,欢迎访问三七文档
知己知彼百战不殆1博弈论GameTheory中国农业大学王卫华电话:13701119756邮箱:cauweihua@163.comQQ群:361455038(王卫华2014春季课程)博弈论2014-2知己知彼百战不殆2主要内容一、博弈现象及基本概念二、完全信息静态博弈三、完全信息动态博弈四、不完全信息静态博弈五、不完全信息动态博弈六、不对称信息应用专题博弈论2014-2知己知彼百战不殆3第三讲完全信息动态博弈1.博弈的扩展型表述2.扩展型博弈的纳什均衡3.子博弈精炼纳什均衡(完美均衡)4.逆向归纳法5.承诺行动6.实例:竞争模型、讨价还价模型等7.重复博弈博弈论2014-2知己知彼百战不殆41.博弈的扩展型表述extensiveformrepresentation要素:局中人:谁参加行动顺序:什么时候行动行动空间:有什么选择信息集:知道些什么支付函数:能得到什么自然选择概率:外生事件如何博弈论2014-2知己知彼百战不殆5博弈树:n人有限博弈的扩展型表述可用博弈树表示。例:房地产开发博弈论2014-2知己知彼百战不殆6博弈树一般构造:结-决策结、终点结;枝-局中人的行动选择。信息集-决策时面临的可能信息状态;由单个或多个决策结组成的集合;用虚线连接同一信息集的结。注:应用信息集概念,可将博弈树用来表示静态博弈(囚徒困境?)博弈论2014-2知己知彼百战不殆7博弈论2014-2知己知彼百战不殆8博弈论2014-2知己知彼百战不殆9博弈论2014-2知己知彼百战不殆10信息类型完美perfect:每个信息集都是单结的。完全complete:自然(类型或支付)不首先行动或它的最初行动被所有人观察到。确定certain:自然(类型或支付)不在任何一个参与人行动之后行动。对称symmetric:没有人在行动时或终点结处拥有与其它人不同的信息。注:不完全信息不等于不对称信息博弈论2014-2知己知彼百战不殆11例:扑克牌游戏下注前行为规则。(1)所有牌洗成面朝上;(完美,确定)(2)所有牌洗成面朝下且不能看自己的牌;(不完全,对称,确定)(3)所有牌洗成面朝下且参与人只能看自己的牌;(不完全,不对称,确定)(4)所有牌洗成面朝上,但每个参与人随后都可以用手护住并悄悄丢掉一张牌;(完全,不对称,确定)博弈论2014-2知己知彼百战不殆12(5)所有牌洗成面朝上,然后参与人下注,然后每个人再得到一张面朝上的牌。(完美,不确定)(6)所有牌洗成面朝下,然后参与人抓起自己的牌但不看牌,然后把牌举过头顶让其它人看清他的牌。(不完全,不对称,确定)博弈论2014-2知己知彼百战不殆13完美信息博弈特征:没有同时行动;所有后行动者确切知道前行动者的行动;所有人观测到自然的行动。博弈的完美回忆要求perfectrecall所有人都不忘记以前知道的事情;所有人都不会忘记自己的选择。例:扑克游戏忘记前面所出牌的情形博弈论2014-2知己知彼百战不殆14练习参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%。支付函数为:如果只有一人带伞:下雨时带伞者的效用为-2,不带伞者的效用为-3;不下雨时带伞的效用为-1,不带的效用为0。如两人都不带伞:下雨时每人的效用为-5,不下雨时每人的效用为1。如果两人都带伞:下雨时每人的效用为-1,不下雨时每人的效用为-2。博弈论2014-2知己知彼百战不殆15给出下列三种情况下的扩展式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻子后决策;博弈论2014-2知己知彼百战不殆162.扩展型博弈的纳什均衡纯策略纳什均衡例:市场小情况下的房地产开发博弈论2014-2知己知彼百战不殆17分析:A的纯策略:开发、不开发;2个B的纯策略:共4个所有局中人的一个纯策略组合决定了博弈树的一个路径。(开发,{不开发,开发}):A-开发-B-不开发-(1,0)(不开发,{开发,开发}):A-不开发-B-开发-(0,1)博弈论2014-2知己知彼百战不殆18A\B开,开开,不开不开,开不开,不开开(-3,-3)(-3,-3)(1,0)(1,0)不开(0,1)(0,0)(0,1)(0,0)囚徒困境动态情况下的策略型?博弈论2014-2知己知彼百战不殆19存在三个纯策略纳什均衡:(开发,{不开发,开发})(开发,{不开发,不开发})(不开发,{开发,开发})定理:一个有限完美信息博弈必有一个纯策略纳什均衡。博弈论2014-2知己知彼百战不殆203.子博弈精炼纳什均衡(完美均衡)引例:哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,否则就把你们两个关起来。现在,哥哥又把弟弟的玩具抢去玩了,弟弟说:快把玩具还我,不然我就要去告诉爸爸。面对弟弟的警告,哥哥会怎么想呢?引例:曾国藩诱降李秀成博弈论2014-2知己知彼百战不殆21基本思想:静态中假设其它人策略是给定的动态中前行动者要考虑对后行动者的影响区分纳什均衡的合理性精炼refining不可置信的威胁不可置信的回报博弈论2014-2知己知彼百战不殆22例:(U,R)与(D,L)的区别?1\2LRU(2,2)(2,2)D(3,1)(0,0)博弈论2014-2知己知彼百战不殆23例:房地产开发,唯一合理均衡:A:开发,B:{不开发,开发}博弈论2014-2知己知彼百战不殆24莱茵哈德·泽尔腾ReinhardSelten1930年出生于德国1961年获得法兰克福大学数学博士学位1984年后任教于波恩大学子博弈精炼纳什均衡创立者1994年因在“非合作博弈理论中开创性的均衡分析”获诺贝尔经济学奖博弈论2014-2知己知彼百战不殆25子博弈:从一个单结信息集开始;信息集和支付向量都直接继承自原博弈;(不可分割原博弈的信息集)任何博弈本身称为自身的一个子博弈。博弈论2014-2知己知彼百战不殆26前例:包括原博弈,共有三个子博弈。博弈论2014-2知己知彼百战不殆27无法再分割,子博弈只有本身一个。博弈论2014-2知己知彼百战不殆28在第2局中人处不可分割(会切割原来的信息集),故此图只有两个子博弈。博弈论2014-2知己知彼百战不殆29子博弈精炼纳什均衡扩展型博弈的策略组合s*=(s1*,...,si*,...,sn*)是一个子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。博弈论2014-2知己知彼百战不殆30说明:每一个子博弈(包括原博弈)都构成一个纳什均衡;如果有唯一子博弈,则等同于纳什均衡;如果存在其它子博弈,则有些纳什均衡将不是。前例:两个子博弈;(D,L)是精炼均衡,(U,R)不是。前例:房地产投资博弈论2014-2知己知彼百战不殆31与纳什均衡的本质区别:纳什均衡只要求均衡策略在均衡路径(历史)上的决策结上是最优的;子博弈精炼纳什均衡要求在非均衡路径的决策结上也是最优的。博弈论2014-2知己知彼百战不殆324.逆向归纳法基本思想重复剔除劣策略方法的推广。在均衡路径,每一个局中人在每一个信息集上的选择都是占优选择。适用于有限完美信息博弈不适用于无限博弈和不完美信息博弈。博弈论2014-2知己知彼百战不殆33例:({U,U’},L)博弈论2014-2知己知彼百战不殆34逆向归纳法的缺陷在阶段多时失去可靠性。例如:传口令游戏对意外事件的预测。Rosenthal19811A12A21A32A41A5D1D2D3D4D5(1,0)(0,1)(3,0)(2,4)(6,3)(5,5)博弈论2014-2知己知彼百战不殆35分析:逆向归纳法Di为最优选择;如果1非理性地选择A1,则2如何选择?大家均非理性会有双赢结果,是否应该冒险?博弈论2014-2知己知彼百战不殆36颤抖的手完美均衡Trembling-handperfect策略组合s*,对于任意的ε,存在着一个位于[0,1]区间上的正数向量δ1,…,δn和一个完全混合策略向量σ1,…,σn,使得每一个策略都被策略(1-δi)si+δiσn所取代的新博弈有一个纳什均衡,且该纳什均衡中的每一个策略和s*的距离小于ε。博弈论2014-2知己知彼百战不殆37例:琼斯史密斯下上进出(1,1)(0,2)(1,4)弱纳什均衡:(出,下),(出,上),(进,上)子博弈完美均衡:(出,上),(进,上)颤抖的手完美均衡:(出,上)博弈论2014-2知己知彼百战不殆385.承诺行动commitment通过减少自己的选择机会使自己受益。完全承诺与不完全承诺。例:破釜沉舟例:房地产案例若B与某客户已签合同,如不能履约赔偿3500万,则B的{开发,开发}成为可置信的威胁。子博弈精炼纳什均衡为(不开发,{开发,开发})例:美电视节目激励减肥博弈论2014-2知己知彼百战不殆39天生的非理性(非策略性的)是一个优势前苏联的“末日机器”。前苏联制造了Perimetr,可在没有人指挥的情况下独自发动苏联的复仇圣战。美国高层说“我祈祷上帝,苏联人不会如此不理智。”尼克松的疯子理论:我要让北越相信这样的传闻:“看在上帝的份上,尼克松已经被共产党搞疯了,当他生气的时候,我们没法制止他,他的手已经按在核按纽上了。”胡志明两天之后会到巴黎求和的。博弈论2014-2知己知彼百战不殆40例:要胁诉讼:原告P,被告D(1)原告决定是否对被告提出控告,成本为c0;(2)如果决定控告,原告要求被告支付s0私了;(3)被告决定是否接受原告的要求;(4)如果被告拒绝,原告决定放弃或是向法庭起诉,原告的起诉成本为p,被告的辩护成本为d;(5)如果案子到了法庭,原告以概率赢得x单位的支付.博弈论2014-2知己知彼百战不殆41提出s博弈论2014-2知己知彼百战不殆42分析:原告私了的条件:x-p0,即xp原告选择:{不指控,要求,放弃}被告选择:{拒绝}均衡:原告不指控博弈论2014-2知己知彼百战不殆43原告承诺行动:指控前支付律师费,则x-c-p>-c-p。最后选择:起诉。私了赔偿:私了赔偿区域为s∈[x,x+d]。若讨价还价能力相同,则赔偿为s=x+d/2。博弈论2014-2知己知彼百战不殆44原告指控条件:原告总成本为c+p,指控条件为x+d/2>c+p。被告越大,d越大,被指控可能性就越大。被告承诺行动:指控前支付律师费y。被告节省成本x+d/2-y,律师费y<x+d/2“积淀成本”:局中人为承诺行动支付的成本。博弈论2014-2知己知彼百战不殆456.应用实例(1)强盗分赃问题有五个强盗抢得100枚金币,在如何分赃问题上争吵不休。于是他们决定:(1)抽签决定自己的号码;(2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就通过,否则他将被仍进大海喂鲨鱼;博弈论2014-2知己知彼百战不殆46(3)1号死后,由2号提方案,4人表决,当且仅当超过半数同意方案通过,否则2号同样被仍进大;(4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩下5号,他当然接受一个人独吞的结果)。如果你是第一个强盗,你该如何提出分配方案才能使自己的收益最大化呢?博弈论2014-2知己知彼百战不殆47启示:第五人看似安全,其实并没利益,因为威胁不可置信。收买失意者更为容易为什么革命者总是找穷苦人?为什么恐怖分子在阿富汗受欢迎?为什么组织中的一把手,经常抛开二号人物,而与会计出纳打得火热?思考:若有六个人情况会如何?博弈论2014-2知己知彼百战不殆48(2)Stackelberg产量竞争模型Stackelberg,1934,完美信息动态博弈。Leader:q1≥0,follower:观测到q1,选择q2≥0企业1企业2博弈论2014-2知己知彼百战不殆49给定q1,企业2的问题是:最优化:)(),(21221
本文标题:博弈论2014
链接地址:https://www.777doc.com/doc-2598388 .html