博弈论本科讲义

一、博弈（Game）博弈论（GameTheory）前言（Preface）参与人：两人及两人以上；行为：做出决策；行为目标：收益最大化环境条件：目标的实现不仅取决于自己的行为，同时还取决于其他人的行为，个人的最优选择是其他人选择的函数——策略性的行为分钱游戏与运输路线选择博弈（Game）：●博弈——是指代表不同利益主体的决策者，在一定的环境条件和规则下，同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施，从而取得各自相应结果的活动。●[美]RogerB.Myerson——一个博弈指的是涉及到两个或更多个参与人的某个社会局势。●[英]AdamSmith——博弈是个体参与人从各自的动机出发生相互作用的一种状态。博弈论（GameTheory，对策论）：●[美]RogerB.Myerson——博弈论可以被定义为是智能的理性决策者之间冲突与合作的数学模型的研究。●[美]RobertGibbons——isthestudyofmulti-persondecisionproblems.●张维迎——是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的，也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。●张守一——是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。教材——P5博弈论就是系统研究各种各样博弈中参与人的合理选择及其均衡的理论。关于“经济博弈论”：博弈论是研究人们在利益相互影响的格局中的策略选择问题、是研究多人决策问题的理论。而策略选择是人们经济行为的核心内容，此外，经济学和博弈论的研究模式是一样的：即强调个人理性，也就是在给定的约束条件下追求效用最大化。可见，经济学和博弈论具有内在的联系。在经济学和博弈论具有的这种天然联系的基础上产生了经济博弈论。将博弈的思想明确地应用于经济领域，始于古诺（Cournot,1838）、伯特兰德（Bertrand,1883）和艾奇沃斯（Edgeworth,1925）等人关于两寡头的产量和价格垄断、产品交易行为的研究，他们通过对不同的经济行为方式和案例建立了相应的博弈论模型，为经济博弈论的发展提供了思想雏形和有益尝试。近半个多世纪以来，博弈论引起了众多经济学家的极大兴趣，使得博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始，博弈论逐渐成为主流经济学的一部分，甚至可以说成为微观经济学的基础（张维迎，P8）。博弈论究竟是一门什么样的学科呢？有人认为是经济学的一个分支，有人认为是数学的一个分支。我们把它看作是一种方法论，即它提供了一个观察问题的新视角、分析问题的新方法和解决问题的新思路；它的应用范围不仅包括经济学，像政治学、军事、外交、国际关系、公共选择、犯罪心理分析等都涉及博弈论。只不过从应用的成果来看，博弈论在经济学领域的应用最广泛、最成功，经济学家对博弈论的贡献也特别大，使得博弈论在经济学领域的应用无处不在：微观研究领域有交易机制的模型（如讨价还价模型和拍卖模型）；在中观经济研究中，劳动力经济学和金融理论都有关于企业要素投入品市场的博弈模型，即使在一个企业内部也存在博弈问题：工人之间会为同一个升迁机会勾心斗角，不同部门之间为争取公司的资金投入相互竞争；从宏观角度看，国际经济学中有关于国家间的相互竞争或相互串谋、选择关税或其他贸易政策的模型；至于产业组织理论更是大量应用博弈论的方法（见JeanTirole的《产业组织理论》）。二、博弈论的产生和发展博弈思想的基本特征是参与人在追求自己目标的过程中，不仅仅只是考虑自己能怎么做，还必须要考虑其他参与人会怎么做；针对其他参与人的行为，自己该实施哪个可行的行动，才能使自己的目标函数最大化，也就是说，在一个博弈格局中，每个参与人所实施的行动都是策略性的行动。——知己知彼，百战不殆产生与发展教材P1-3《现代经济对策论》P6-7冯·诺依曼和摩根斯坦（Von.neumannandmorgenstern）冯·诺依曼是20世纪伟大的数学家之一，后者是德国人（1902年生），美国当代杰出经济学家。《ThetheoryofGamesandEconomicBehaviour》的产生：二战期间，为了有效对抗法西斯，不仅是军人，连物理学家、数学家，甚至经济学家都被动员起来，组成“运筹研究班”，共同研究作战计划，在作战中数学的合理性得到了广泛运用，产生了种种理论。博弈论便是其中之一。二战结束后，大部分理论研究都转向其他领域。博弈论则在摩根斯坦的劝说下，与冯合作成就了《ThetheoryofGamesandEconomicBehaviour》，即转到了经济领域。冷战期间得到了政府的大力支持，博弈论不仅在经济领域，而后在社会学、外交问题军事问题上都得到了应用。因对博弈论研究作出杰出贡献而获诺贝尔经济学奖的经济学家：●纳什(Nash):Nash-Equilibrium塞尔藤(Selten):Subgame-PerfectNashE---海萨尼(Harsanyi):Bayes-NashEquilibrium1994●维克利、莫里斯1996●迈克尔·斯宾斯(Spence):1948年生于美国的新泽西，1972年获哈佛大学博士头衔，现兼任美国哈佛和斯坦福两所大学经济学教授。乔治·阿克尔洛夫：1940年生于美国的纽黑文，1966年获美国麻省理工学院博士头衔，现为美国加利福尼亚大学经济学教授。约瑟夫·斯蒂格利茨，1948年生于美国的印第安纳州，1967年获美国麻省理工学院博士头衔，曾任世界银行的首席经济学家，现任美国哥伦比亚大学经济学教授。2001年三人同获诺贝尔经济学奖，分享1000万瑞典克郎（94.3万美元）的奖金。瑞典皇家科学院之所以把这崇高的荣誉给予这三位经济学家，是因为他们在现代信息经济学研究领域作出了突出的贡献，他们“发展并研究了市场信息不对称的问题，揭示了当代信息经济的核心”。教材P192阿克尔洛夫是最早发现信息不对称的学者之一。我们上街购物，几乎处处都能碰上假货：花了上千元买的“进口名牌服装”，原来是国产的，只值几十元；“真皮”皮鞋用的是人造革的料……为什么假货愈演愈烈？为什么假货在发展中国家特别猖獗？阿克尔洛夫回答说：“一家商场，一般是售货员比顾客更了解产品的质量，如果售货员把这种信息加以垄断，最后即使他提供越来越差的产品，顾客也不会知道。顾客的利益因而受到损害”。（只有买错，没有卖错）阿克尔洛夫最大的贡献是解释了在发展中国家里，信贷市场信息的不对称导致了这些国家信贷市场的过高利息。此外，阿克尔洛夫还把信息不对称运用于解释各种社会问题，比如因为信息不对称，医疗保险市场上，老年人、个体劳动者的医疗保险利益得不到保障。三、基本概念1、参与人Players:一个博弈中的决策主体，他们各自的目的是通过选择行动（策略）以最大化自己的目标函数/效用水平/支付函数。他们可以是自然人或团体或法人，如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人，而只能当做环境参数来处理。如指手划脚的看牌人、看棋人，企业的顾问等。对参与人的决策来说，最重要的是必须有可供选择的行动集（策略集）和一个很好定义的支付函数。虚拟参与人（pseudo-player）:指“自然”（nature）、“上帝”God，也即决定外生的随机变量的概率分布的机制。“某事在人、成事在天”的“天”；如出远门去旅游，可能很开心，也可能很尴尬（生病住医院），两者概率分布90%、10%或98%与2%或其他，由上帝决定。在以后的讨论中，我们记参与人为i,参与人集合记为T，即T={1，2，……，i，……，n},即该博弈中共有n个参与人；为了讨论的方便，把某个参与人i之外的其他参与人称为的i对手记为-i；N代表自然。*注意：博弈理论家一般对参与人做两个基本的假设——参与人都是理性的和智能的理性的（rational）?1—如果一个决策者在追逐其目标时能前后一致地做决策，就称他为rational。RogerB·Myerson(P2)2—广义而言指的是一种行为方式，他同在给定条件或约束下最有效地实现预期目标相关。具体地讲，理性大致有以下三项内容：（1）存在一组可供选择的备选或替代方案；（2）每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度；（3）人们总是选择那个能够带来最大预期净收益的方案。（西蒙，1964）智能的（intelligent）?当我们像博弈论专家那样分析一个博弈时，如果参与人知道我们对此博弈所知道的一切，并能做出我们对此博弈所能做出的一切推断，我们就说此博弈的参与人是智能的。RogerB·Myerson(P3)2、策略（strategies）:博弈中有两种策略概念，一种为纯策略（purestrategy）,简称策略，指参与人在博弈中可以选择采用的行动（ac-tionsormoves）方案，是参与人在给定信息结构的情况下的行动规则，它规定参与人在什么时候的什么情况下采取什么行动。因而一个策略是参与人的一个“相机行动方案”（contingentActionplan）。如“人不犯我…”、“按第一套方案行动、实施第二套方案…”……，记参与人i的一个策略为si，参与人i在一个博弈中的全部可供选择的策略记为Si（策略集strategyset），即si∈Si，Si={s1，s2，…si，…，sn},表示参与人i在该博弈中共有n个可行的策略。如果n个参与人每人从自己的Si中选择一个策略si,则向量s=（s1，s2，﹍，si，﹍，sn）是一个策略组合(strategyprofile),参与人i之外的其他参与人的策略组合可记为s-i=（s1，s2，﹍，si-1,si+1，﹍，sn）。例如田忌的某个策略s田忌=上中下，或中下上，等等；S田忌={上中下，上下中，中上下，中下上，下上中，下中上}另一种策略概念是在纯策略基础上形成的混合策略（mixedstrategy）概念，参与人i的混合策略pi是他的纯策略空间Si上的一种概率分布，表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。Pi(si)表示Pi分配给纯策略si的的概率。如出门要否带雨伞？天气预报说有时有雨。猜拳？这是一个十分玄乎的概念，让人不容易理解，它是一种不确定，采用这种策略的目的就是让对方琢磨不透，实施时似乎由一架随机机器在操作。随机策略randomizedstrategy纯策略是混合策略的特例？*注意：1、策略与行动是两个不同的概念，策略是行动的规则而不是行动本身。回顾“犯与不犯”的问题。在静态博弈中，由于参与人同时行动，没有人能掌握他人的之前行动的信息，故没有可针对的行动，从而策略的选择就变成了行动的选择，即策略和行动是同一的。行动集Aiai2、作为一种行动规则，策略必须是完备的，就是说，策略要给出参与人在每一种可能想象到的情况下的行动选择，即使参与人并不预期这种情况会实际发生。“丑话说在前-----”3、支付（payoffs）：参与人从各种策略组合中获得的收益。收益往往采用效用（utility）概念。它或者是一个特定策略组合下某个参与人得到的确定效用水平，或者是期望效用水平。它是策略组合的函数，所以也称支付函数（payofffunction），记为ui(s)，ui(s)=ui(s1，s2…，si，…sn-1，sn).1：博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择，而且取决于所有其他参与人的策略选择；是策略组合的函数。2：支付是参与人真正关心的东西，参与人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。*注意一个博弈中，明确了以上三个概念，该博弈的基本框架就形成了，故称为博弈的三个基本要素。一个具体博弈界定，还须明确行动的顺序和有关的信息。4、行动的顺序（theorderofplay）:博弈中参与人实施决策活动的顺序。同时或有先有后。其他因素不变，但顺序不同，参与人的最优选择就不同，博弈的结果也不同。事实上，不同的顺序安排意味着不同

博弈论本科讲义

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

房屋租约内容应注意事项

愚公机械销售话术

2018年工程砌体施工质量管控重点（PPT85页)

疯狂建筑之旅__迪拜

【期刊-齿轮设计】基于UG的齿轮参数化建模系统

创新竞争与竞争优势

奢侈品的顾客感知价值研究

ORACLE数据库日常维护与管理手册

地产管理类资料--《售楼经理管理手册》(DOC 12页)

人力资源管理基本法分享

相关文档

相关搜索