您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 高鸿业最新版-博弈论初步
西方经济学(微观部分)主讲人:韩松第十章博弈论初步*自嘲*一介学究,惶惶似狗。东拼西凑,闲来插柳。或存疏漏,等着挨揍。钱财无有,知识半斗。交流携手,相逢美酒。余望何求?潮起云收。*自我介绍*第十章博弈论初步目录目录第一节博弈论和策略行为第二节纯策略均衡第三节混合策略均衡第四节序贯博弈寡头博弈和支付矩阵;条件策略和策略组合;纳什均衡和下划线法;纳什均衡的特性;二人同时博弈的一般理论竞争者-垄断者博弈;博弈树的纳什均衡;逆向归纳法;优势与理性博弈的定义;基本的要素;博弈的类型混合策略与策略组合;混合策略的纳什均衡;混合博弈的一般理论第一节博弈论和策略行为一、博弈的定义第一节博弈论和策略行为厂商之间的行为是相互影响的,这种相互作用的关系就如同赌博下棋(博弈)一样。博弈论(GameTheory)研究在策略性环境中如何进行策略性决定和采取策略性行动的科学。近代的研究,开始于策墨洛(Zermelo)、波雷尔(Borel)和冯·诺伊曼(vonNeumann)。1944年,冯·诺依曼和摩根斯特恩共著《博弈论与经济行为》,将博弈论用于经济领域。一博弈的定义[资料]会下棋的机器1769年,匈牙利工程师巴朗·沃尔夫冈·凡·坎比林为奥地利皇后做了一台会“下”象棋的机器。阿伦·图灵的“纸上机器”。贝尔实验室克劳迪·申朗的“A策略”和“B策略”。1950年,约翰·冯·诺依曼(JohnvonNeumann)设计出“MANIAC一号”。[资料]会下棋的机器脑力争夺、利益平衡、人生选择……各份戏码精彩纷呈,显现价值取舍的智慧。[视频]智能的较量[视频]智能的较量第一节博弈论和策略行为二、基本的要素第一节博弈论和策略行为策略性决策和行动是指每个人要根据其他人的可能反应来决定自己的决策行动,博弈论显然是分析寡头厂商行为的一个恰当工具。参与者:进行决策的个体,至少有两个,有时和可以引入一个虚拟的参与人如“自然”;策略:是一项规则,一组可选择的行动集合;支付:各自的报酬,所得到的支付都是所有策略共同作用的结果——支付组合。二基本的要素[案例]沙滩上的饮料销售商▲▲1/21/2▲▲▲▲1×1/2▲▲1×1/2[案例]沙滩上的饮料销售商第一节博弈论和策略行为三、博弈的类型第一节博弈论和策略行为从要素可以进行一些博弈分类,如两人博弈和多人博弈、零和博弈和非零和博弈、有限博弈和无限博弈、同时博弈和序贯博弈。从20世纪80年代起,博弈论逐渐成为主流经济学的一部分,转向对人们之间关系的研究。经济学越来越重视对信息的研究,特别是信息不对称对个人选择、制度安排的影响,信息经济学与博弈论的应用相互渗透。三博弈的类型合作博弈与非合作博弈:能否达成有约束力协议;重复博弈与非重复博弈:具有连续性的特点;零和博弈与非零和博弈:你的所失正是我的所得。[资料]博弈的类型[资料]博弈的类型信息顺序静态动态完全信息纳什均衡精炼纳什均衡不完全信息贝叶斯-纳什均衡精炼贝叶斯-纳什均衡完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海萨尼转换(含自然)第二节纯策略均衡一、寡头博弈和支付矩阵第二节纯策略均衡假定在某个寡头市场上,有甲、乙两个厂商。这一个只有两方参加并且同时进行决策的简单博弈。用一个以二元数组为元素的矩阵(称博弈矩阵或支付矩阵)来描述和分析。一寡头博弈和支付矩阵51235617甲厂商合作不合作乙厂商合作不合作第二节纯策略均衡二、条件策略和策略组合第二节纯策略均衡把甲厂商在乙厂商选择合作条件下的最优策略叫做甲厂商的条件优势策略,与甲厂商的这一条件策略相联系的策略组合叫条件优势策略组合。条件策略包括参与人的条件策略及组合。二条件策略和策略组合51235617甲厂商合作不合作乙厂商合作不合作第二节纯策略均衡三、纳什均衡和下划线法第二节纯策略均衡当厂商的条件策略组合恰好相同,从而都不再有单独改变策略的倾向时,整个博弈就达到了均衡,是博弈的解,称为纳什均衡。纳什均衡指的是参与人在该策略组合上,任何单独改变策略都不会得到好处;当所有其他人都不改变策略时,没有人会改变自己的策略。假定支付不变时,由于存在成本和风险,参与人也不愿意单独地改变策略。三纳什均衡和下划线法[资料]约翰·纳什1994年与泽尔腾、海萨尼分享了诺贝尔经济学奖。他说自己只做了两件事:一是研究过讨价还价的问题;二是关注了经济问题并从数学角度加以分析。理性决策决不会无缘无故地损害自身的利益,也就是一个人肯定不会故意做出对自己不利的事。[资料]约翰·纳什孔明曰:“亮夜观乾象,操贼未合身亡。留这人情,教云长做了,亦是美事。”玄德曰:“先生神算,世所罕及!”孔明曹操小道大路小道大路擒住被擒逃脱空等擒住被擒逃脱空等[案例]“华容道”里的纳什均衡(1)[案例]“华容道”里的纳什均衡(1)孔明曹操小道大路小道大路擒住被擒逃脱空等擒住被擒逃脱空等[案例]“华容道”里的纳什均衡(1)[案例]“华容道”里的纳什均衡(2)[案例]“华容道”里的纳什均衡(2)刘备孙权联合反目放走捉拿1210-15-5-202015刘备军事集团参与赤壁之战有三个战略目标:首先,必须联合孙权打败曹操,从而为自己赢得生存的时间与空间;其次,又不能让曹操一方消失,曹操的存在使刘备的存在具有价值;最后,还要争取在混乱中尽可能地多捞私利。按键等待按键等待159-10044小猪大猪[案例]孙刘联合的“智猪博弈”[案例]孙刘联合的“智猪博弈”孔明笑曰:“亮借一帆风,直至江东,凭三寸不烂之舌,说南北两军互相吞并。若南军胜,共诛曹操以取荆州之地;若北军胜,则我乘势以取江南可也。”荆州是赤壁之战最重要的战果之一,却被出力很少的刘备摘去了。第二节纯策略均衡三、纳什均衡和下划线法第二节纯策略均衡条件均衡策略下划线法是用下划线分别来表示甲厂商和乙厂商的条件策略。在甲厂商的支付矩阵中,找出每一列的最大者;在乙厂商的支付矩阵中,找出每一行的最大者。都有划线的支付组合。三纳什均衡和下划线法51235617甲厂商合作不合作乙厂商合作不合作––––第二节纯策略均衡三、纳什均衡和下划线法第二节纯策略均衡无论其他参与者采取什么策略,某参与者的惟一的最优策略就是他的占优策略,任何一方都不想偏离各自的不合作策略。囚徒困境(Prisoners’Dilemma)反映了个人理性和团体理性的冲突,从个人理性角度出发所选择的占优策略结局,从整体来看却是最差的。根据“看不见的手”原理,理性的人在追求自己利益中,会同时增进社会的整体福利。三纳什均衡和下划线法诸葛亮对司马懿的思想轨迹是相当了解;诸葛亮的行径司马懿也能做出理性判断。诸葛司马进攻撤退守城弃城平手逃脱××大胜被擒被擒大胜曹家司马擒拿放走使用除掉2010-15-1-158-103[案例]“空城计”中的占优策略均衡[案例]“空城计”中的占优策略均衡[资料]囚徒困境坦白不坦白坦白不坦白-5-5-7-1-2-2-1-7甲方乙方双方都存在着偷换策略的诱惑,处于不稳定状态。即使两个囚徒事先订立了攻守同盟(死不坦白),他们最终也会背叛同盟。每个囚徒都希望对方选择抵赖,而自己坦白获释。当他们都这么想并这么做的时候,就形成了都坦白的左上角结局。[资料]囚徒困境第二节纯策略均衡四、纳什均衡的特性第二节纯策略均衡在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在。在纳什均衡存在的条件下,它可能是惟一的也可能不惟一。如果纳什均衡存在,它可能是最优的也可能不是最优的。四纳什均衡的特性甲厂商合作不合作乙厂商合作不合作19284637––––41235614––––全部纳什均衡,可以分为五种类型情况:四个均衡、三个均衡、两个均衡、一个均衡、零个均衡。第二节纯策略均衡五、二人同时博弈的一般理论A第二节纯策略均衡b12a12a22b22a11b11b21a21参与人A策略1策略2参与人B策略1策略2222112112221121122211211222112112221121122211211222112112221121122211211)9()8()7()6()5()4()3()2()1(aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa五二人同时博弈的一般理论第三节混合策略均衡一、混合策略与策略组合第三节混合策略均衡以有限的纯策略为基础的混合策略一定是无限的,源于概率取值的无限性。甲厂商和乙厂商的混合策略组合就是一个概率向量组合。与纯策略不同,每一个概率向量是相应参与人的一个混合策略。一混合策略与策略组合19284637甲厂商p1p2乙厂商q1q2––––[案例]猜拳游戏必胜招一位日本收藏家无法决定让谁来拍卖画作,于是要求佳士得与苏富比老板猜拳定胜负。佳士得老板向员工们讨教猜拳策略,最后在一名主管的11岁女儿建议下,决定出……[案例]猜拳游戏必胜招第三节混合策略均衡一、混合策略与策略组合在混合策略博弈中,对于每一个混合策略组合也存在一个支付组合。参与人都以一定的概率来选择其纯策略,相应形成“期望支付”。第三节混合策略均衡一混合策略与策略组合19284637甲厂商p1p2乙厂商q1q2–––5.05.05.011,007.07.07.001,0111111111pppqqqqp即使纯策略的纳什均衡不存在,相应的混合策略纳什均衡总会存在。纯策略纳什均衡作为特例被包括在混合策略纳什均衡之中。混合策略博弈的均衡与纯策略博弈的均衡恰好完全相同。第三节混合策略均衡二、混合策略的纳什均衡第三节混合策略均衡二混合策略的纳什均衡op1q11·1·乙厂商0.5·0.7···甲厂商·e第三节混合策略均衡三、混合博弈的一般理论参与人A与B的判别式为:A的条件混合策略为:))(1()(2212121111aaqaaqa第三节混合策略均衡三混合博弈的一般理论b12a12a22b22a11b11b21a21参与人A策略1策略2参与人B策略1策略2q1q2p1p2))(1()(2221112111bbpbbpb00011,001aaap[习题]博弈论初步00202-21-1警察巡逻喝茶小偷行窃游荡q1q2p1p2[习题]博弈论初步第四节序贯博弈一、竞争者-垄断者博弈第四节序贯博弈即使不同的参与人进行决策的时间各不相同,但只要每一个参与人在确定自己策略的时候并不知道其他参与人所选择的策略,则相应的博弈就可以被看成是同时博弈。在序贯博弈中,决策有先有后,后行动的参与人观察到先行动的参与人已经采取的策略。在一个既有的垄断者和一个潜在的竞争者之间的博弈,竞争者先决策,垄断者后决策。一竞争者-垄断者博弈第四节序贯博弈一、竞争者-垄断者博弈第四节序贯博弈垄断者竞争者进入不进入抵制不抵制900130013009001200900800600900130013009008006001200700威胁策略一定具有可信性,才能真正发挥作用。垄断者抵制不抵制竞争者进入不进入一竞争者-垄断者博弈[案例]核武环峙中国毛泽东说:“中国人多,不怕扔原子弹”。强权政治、单边主义和恐怖活动都增加了文明毁灭的危险——局部核战争已是不可忽视的现实威胁。“难道上个世纪的梦魇又回来了吗?”[案例]核武环峙中国第四节序贯博弈二、博弈树的纳什均衡第四节序贯博弈博弈树模型又称为扩展工博弈模型,以博弈树来描述的序贯博弈又叫做扩展型博弈。二博弈树的纳什均衡竞争者垄断者·a······bc垄断者进入不进入不抵制抵制不抵制抵制defg(1,4)(-2,2)(0,5)(0,3)起点中间点终点·d(1,4)[资料]下棋程序的算法与深度[资料]下棋程序的算法与深度第一个突破出现在1958年,匹兹堡大学的奈维尔、肖恩和西蒙发现剔除相当大的
本文标题:高鸿业最新版-博弈论初步
链接地址:https://www.777doc.com/doc-1573259 .html