您好,欢迎访问三七文档
第六章对策论(GameTheory)对策论历史与引例相关概念二人有限零和对策二人有限非零和对策又称博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。是研究具有竞争、对抗、冲突性质的现象的数学理论和方法。第一部分对策论历史与引例一、对策论的定义影响因素:其他决策者,自然。一、对策理论的历史•围棋,发明于我国殷代;•我国春秋战国时期的“孙子兵法”;•对策作为一种数学理论开始于1944年。由美国数学家冯·诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern))发表了题为“博弈论与经济行为”的著作•1950年,纳什完成博士论文“非合作博弈”,•九十年代以来博弈理论在金融、管理和经济领域中得到广泛应用•博弈论和诺贝尔经济奖1994:非合作博弈。纳什(Nash)、泽尔腾(Selten)、海萨尼(Harsanyi)1996:不对称信息激励理论。莫里斯(Mirrlees)和维克瑞(Vickrey)2001:不完全信息市场博弈。阿克罗夫(Akerlof)(商品市场)、斯潘塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场)•博弈论和诺贝尔经济奖2002:实验经济学。史密斯(Smith),心理经济学:卡尼曼(Kahneman)2005:合作与冲突理论。罗伯特·奥曼(RobertJ.Aumann)与托马斯·谢林(ThomasC.Schelling),通过博弈理论的分析增强世人对合作与冲突的理解2007:机制设计理论。赫维茨(LeonidHurwicz),马斯金(EricS.Maskin),罗杰(RogerB.Myerson),创立和发展了“机制设计理论”方面所作的贡献,其中博弈论是重要的研究工具。1994年诺贝尔经济学奖获得者,纳什在普林斯顿读博士时刚刚20岁出头,他的一篇关于非合作博弈的博士论文和其他两篇相关文章确立了他博弈论大师的地位。到上世纪50年代末,他已是闻名世界的大牌科学家了。然而,正当他的事业如日中天的时候,天妒英才,他得了严重的精神分裂症。多亏前妻艾莉西亚的爱心呵护和普林斯顿大学诸多朋友和同事无私的帮助才没有使他流落街头,并最终把他推上诺贝尔经济学奖宝座(1994年获奖)。他的故事被好莱坞拍成了电影《美丽心灵》,该影片获得了2002年奥斯卡金像奖的四项大奖纳什简介三、对策问题举例1.囚犯困境(Prisoners’dilemma)囚犯困境是图克(Tucker)1950年提出的该对策是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷三、对策问题举例1.囚犯困境(Prisoners’dilemma)两名囚犯I和II因涉嫌抢劫被捕。警方因证据不足先将二人分关二室,并宣布:若二人均不坦白,则只能因藏有枪支而被判刑1年;若有一人坦白而另一个不坦白,则坦白者无罪释放,不坦白者被判刑10年;若二人都坦白了,则同判8年。此二人确系抢劫犯,请分析他们的抉择。均衡解:二人均坦白Ⅱ坦白抵赖Ⅰ坦白-8,-80,-10抵赖-10,0-1,-1囚徒困境说明了什么在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个攻守同盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.例:军备竞赛冷战期间,美苏两国的军备竞赛,使得两国的社会福利都变得更糟。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。例:公共产品的供给博弈如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失;而如果你出钱我不出钱,我就可以占便宜。最终结果:每个人都“不出钱”。这种纳什均衡使得所有的人的福利都没法得到提高。例:寡头垄断企业定价的博弈卡特尔价格不是纳什均衡,最终结果:每个企业按照纳什均衡的价格进行定价,其利润小于卡特尔价格条件下的利润。案例分析:生活中的“囚徒困境”例子——商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。问题:明确该对策问题的各要素:局中人、策略集、赢得矩阵生活中的例子囚徒困境现象在现实生活中比比皆是。姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利益。囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。对经典经济学的冲击“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。《国富论》:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。NASH均衡条件下的行为规则合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。所谓“己所不欲勿施于人”。但前提是人所不欲勿施于我。对策分析的基本假设(1)个人理性假设当事人在决策时能够充分考虑他所面临的局势,并能做出合乎理性的选择。(2)最大化自己的收益假设当事人在决策时通常选择使自己收益最大化的策略。第二部分相关概念对策问题的基本要素(1)局中人(Players)参与对抗的各方;不一定指自然人(2)策略集(Strategies)局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集;,,,21msssS对策双方的策略集一般记为:,,,21ndddD例:囚犯困境中,每个囚犯均有2个策略:{坦白,抵赖}坦白抵赖坦白抵赖-8,-80,-10-10,0-1,-1(3)局势局中人采用某局势时的收益值。),jidsR(甲例:当局中人甲选择策略si,局中人乙选策略dj时,局中人甲的赢得值可用表示。当每个局中人从各自策略集合中选择一策略而组成的策略组成为一个局势,用来表示。),(jids(4)赢得(支付)坦白抵赖坦白抵赖-8,-80,-10-10,0-1,-12、智猪博弈猪圈里有两头猪:一头大猪、一头小猪,猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮就会有10个单位的猪食进槽,但谁按按钮谁就需要付2个单位的成本。若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃到7个单位,小猪吃3个单位;若小猪先到,大猪吃到6个单位,小猪吃4个单位;小猪按等待大猪按5,14,4等待9,-10,0Nash均衡:(按,等待)智猪博弈的应用举例例:大、小股东的职责股份公司中,股东承担着监督经理的职能。监督需要成本,大股东从监督中获得的好处要多于小股东。Nash均衡:大股东担当起搜集信息、监督经理的责任,小股东“搭便车”。0,09,-1等待4,45,1按大猪等待按小猪例:股票市场中的大户、小户例:市场中的大企业、小企业进行研究开发、为新产品做广告,对大企业是值得的,对小企业则得不偿失。所以,一种可能的情况是,小企业把精力花在模仿上,或等待大企业用广告打开市场后出售廉价产品。0,09,-1等待4,45,1按大猪等待按小猪例:公共产品的提供村里住两户人家,一户富,一户穷,有一条路年久失修。这时候,富户一般会承担起修路的责任,穷户则很少这样干,因为富户常常高朋满座,路用得更多。穷户对于修路无所谓。0,09,-1等待4,45,1按大猪等待按小猪3.中国的游戏——“剪刀、石头、布”小孩A与B猜手,若规定赢得1分,平得0分,输得-1分,则A的赢得可用下表来表示。1-1010-1-110A石头剪子石头剪子布布赢B分析:无确定最优解,可用“混合策略”求解。4.齐王赛马战国时期,齐国国王有一天提出要与大将军田忌赛马。田忌答应后,双方约定:1)每人从上中下三个等级中各出一匹马,共出三匹;2)一共比赛三次,每一次比赛各出一匹马;3)每匹被选中的马都得参加比赛,而且只能参加一次;4)每次比赛后输者要付给胜者一千金。当时在三个不同等级中,齐王的马要比田忌的强些,看来田忌要输三千金了,但由于田忌采用了谋士的意见,最终反败为胜。谋士的主意是:1)每次比赛前先让齐王说出他要出哪匹马;2)让田忌用下马对齐王上马;3)用中马对齐王下马;4)用上马对齐王中马。“齐王赛马”齐王在各局势的赢得表(单位:千金)田忌齐王β1(上中下)β2(上下中)β3(中上下)β4(中下上)β5(下上中)β6(下中上)α1(上中下)3111-11α2(上下中)13111-1α1(中上下)1-13111α1(中下上)-111311α1(下上中)111-131α1(下中上)11-1113“齐王赛马”齐王在各局势的赢得表(单位:千金)田忌齐王β1(上中下)β2(上下中)β3(中上下)β4(中下上)β5(下上中)β6(下中上)α1(上中下)3111-11α2(上下中)13111-1α1(中上下)1-13111α1(中下上)-111311α1(下上中)111-131α1(下中上)11-1113齐王的策略集:S1={1,2,3,4,5,6}田忌的策略集:S2={1,2,3,4,5,6}五、对策的分类1、按局中人数目两人对策多人对策2、按局中人赢得零和对策非零和对策3、按解的表达形式纯策略对策混合策略对策4、按对策过程静态对策动态对策•局中人为2;•对策双方的策略均有限;•对策双方的赢得值之和为零。1.二人有限零和对策(又称矩阵对策)G={S,D,A}甲的策略集甲的赢得矩阵乙的策略集•特点:•例:“齐王赛马”即是一个矩阵策略。•记矩阵对策为:本课件的分类思路:2.二人有限非零和对策(又称双矩阵对策)第三部分二人有限零和对策M1111Anmmnijijaaaaaa则支付可以用矩阵
本文标题:对策论(全)
链接地址:https://www.777doc.com/doc-2467087 .html