您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 研究生教学讲稿博弈论与信息经济学08-09第二学期1
1博弈论主讲人:柳键博弈论21、博弈论产生与发展萌芽阶段19世纪30年代产生阶段20世纪40年代发展阶段20世纪60年代繁荣阶段20世纪80年库诺特(Cournot,1838)模型(同时决策的产量博弈)斯坦克尔伯格(1934)(Stackelberg)(不同时决策的产量博弈)冯·诺依曼和摩根斯特恩合著《博弈论与经济行为》(1944年)纳什均衡(1950,1951)精练纳什均衡(泽尔腾,1965)贝叶斯纳什均衡(海萨尼,1967)与贝叶斯精练纳什均衡,(海萨尼,1975)纳什,泽尔腾和海萨尼共同获得诺贝尔经济学奖(1994)维克里和莫里斯获诺贝尔经济学奖(1996)第一章、绪论博弈论32博弈论基本概念●合作博弈和非合作博弈。合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能达成—个具有约束力的协议。如果有,就是合作博弈;反之.则是非合作博弈。例如两个寡头企业,如果它们之间达成一个协议,联合最大化垄断利润.并按这个协议生产,就是合作博弈。协议没有约束力,两个寡头企业各自优化其最优产量(或价格),则成为非合作博弈。纳什、泽尔腾和海萨尼的贡献主要是非合作博弈,而现在经济学家谈到博弈论,一般指的是非合作博弈、很少指合作博弈。博弈论4●博弈基本概念●博弈一些个人、团队或其他组织,面对一定的环境条件.在一定的规则约束下,依据所掌握的信息,同时或先后,一次或多次从各自允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。参与人(player),又称局中人,是指博弈中选择行动以自身利益最大化的决策主体(可以是个人,也可以是团体,如厂商、政府、国家)。博弈论5行动(action)是指参与人的决策变量。如消费者效用最大化决策中的各种商品的购买量;厂商利润最大化决策中的产量、价格等。信息(information)是指参与人在博弈过程中的知识,特别是有关其他参与人(对手)的特征和行动的知识。。•战略(strategies)又称策略,是指参与人选择其行为的规制,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。博弈论6结果(outcome)是指博弈分析者感兴趣的要素集合。均衡(equilibrium)是指所有参与人的最优策略或行动的组合。这里的“均衡”是特指博弈中的均衡,一般称之谓“纳什均衡(Nashequilibrium)”。•收益(payoff)又称支付,是指参与人从博弈中获得的利益水平,它是所有参与人策略或行为的函数,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终所获得的利润。●博弈论研究决策主体的行为及其相互决策和均衡问题的学科。博弈论73博弈分类按行动的先后顺序静态博弈:参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动动态博弈:参与人的行动有先后顺序,且后行动者能够观察先行动者所选择的行动按参与人是否知晓对方信息完全信息博弈:每一个参与人对其他参与人的战略空间及支付函数有准确的知识不完全信息博弈:每一个参与人对其他参与人战略空间及支付函数不知晓或部分知晓博弈论8将上述两个角度的划分结合起来,得到四种不同类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。见下表:行动顺序信息静态动态完全信息不完全信息完全信息博弈,纳什均衡纳什(1950,1951)完全信息动态博弈,子博弈精练纳什均衡泽尔腾(1965)不完全信息静态博弈,贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈;精练贝叶斯纳什均衡海萨尼(1975)博弈论94博弈成为经济学主要课程的成因1.博弈论在经济学中的应用越来越广泛,博弈论许多成果也是借助于经济学的例子来发展的。特别是在应用领域。2.经济学和博弈沦的研究模式是一样的,这就是强调个人理性.也就是在给定的约束条件追求效用最大化。在这一点上,博弈论与经济学是完全一样的。3.传统经济学研究个人行为时,总是假设其外部环境是给定的。现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,人们之间的利益冲突与一致,竞争与合作的研究,这与博弈论研究内容相一致。博弈论104..经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。而博弈论是这一领域的基础,如信息经济学是博弈论应用非对称信息经济领域的结果,所以信息经济学也被称为非对称信息博弈论。博弈论11第二章完全信息静态博弈一、囚徒困境囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不同房间审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(因证据不足);如果其中一人坦白另—人抵赖,坦白者放出去,不坦白的判刑10年(这有点“坦白从宽、抗拒从严”的味道)。博弈支付见表:博弈论12囚徒A囚徒B-1,-1-10,00,-10-8,-8坦白抵赖坦白抵赖每个囚徒都有两种:坦白或抵赖。表中每格的第一个数字是囚徒A的支付,第二个数字为囚徒B的支付。在这个例子里,战略组合有四个:(坦白,坦白),(坦白,抵赖),(抵赖,坦白),(抵赖,抵赖)。给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白。各方最优战略的组合是(坦白、坦白),这就是我们要谈的纳什均衡。博弈论131参与人(博弈人):在博弈中选择最优的战略或行动以最大化自身的效用的决策主体。参与人可能是自然人也可能是利益团体。博弈人记为i(i=1,2,…N)。如例中的囚徒A和囚徒B。2行动:参与人在某一个决策时点对决策变量的选择,是决策变量了的取值结果。记为如例中的坦白和抵赖。囚徒A囚徒B囚徒B坦白抵赖坦白抵赖抵赖坦白(-8,-8)(0,-10)(-10,0)(-1,-1)3战略:在一定的博弈规则条件下,参与人应对其他参与人选择行为的行动规则(即对策),记为。如例2(有行动先后顺序的囚徒博弈):博弈论14考察囚徒B的战略。其应对囚徒A的行动(坦白,抵赖)的行动规则有:{坦白坦白,抵赖坦白};{坦白抵赖,抵赖抵赖};{坦白抵赖,抵赖坦白};{坦白坦白,抵赖抵赖}。也就是说球体B有四中战略。而囚徒B的行动只有两个:坦白和抵赖。这说明战略与行动有本质上的区别。一般来说,在静态博弈中,战略与行动相一致,而在动态博弈中,战略与行动有可能不一致(对于初始行动者来说仍然一致)。4均衡:由最优战略构成的战略组合,记为如占优战略均衡:如纳什均衡战略:博弈论15如囚徒博弈中囚徒A囚徒B-1,-1-10,00,-10-8,-8坦白抵赖坦白抵赖坦白是囚徒A,B的占优战略,也是纳什均衡战略。(坦白,坦白)是占优战略均衡和纳什均衡5均衡结果:在均衡战略下参与人博弈后行动的组合。记为博弈论16囚徒A囚徒B囚徒B坦白抵赖坦白抵赖抵赖坦白(-8,-8)(0,-10)(-10,0)(-1,-1)如例2:囚徒B的最优战略是:{坦白坦白,抵赖坦白}囚徒A的最优战略是:坦白均衡战略是:(坦白,{坦白坦白,抵赖坦白})均衡结果是:(坦白坦白)博弈论17二、占优均衡与纳什均衡1完全信息静态博弈与理性假设●完全信息:参与人的战略空间和支付函数是共同知识,即为大家所共知。●静态博弈:参与人同时行动,无先后顺序,即相互不能观察到对方的行动。●理性假设:参与人选择最大化自身支付的战略。并且知道其他参与人是理性的。博弈论182占优均衡●占优战略:无论其他参与人选择什么战略,参与人的某一战略均是最优的,该战略称占优战略。数学表达如下:为战优战略,相应的称为劣战略。●占优战略均衡:由占优战略构成的战略组合。3重复剔除的占优均衡博弈论19●例3博弈支付如下:上述博弈中K是参与人2的占优战略,但参与人1不存在占战略。所以不存在占优均衡。然而,经过分析可以得到另外一中合理的均衡。由于K是参与人2的占优战略,所以参与人肯定选择K。但参与人选择K时,参与人1选择R。(R,K)是是该博弈的一个合理的均衡。该均衡实际上可以通过重复剔除劣战略得到。首先,对于参与人1,M是劣战略,将其剔除。在剔除后的战略中,L是参与1的劣战略,又将其剔除,最后剩下的战略组合(R,K)是重复剔除劣战略的占优均衡,R和K分别是参与人1和参与人2的重复剔除劣战略的占优战略。参与人2(1,1)(8,0)(3,5)(4,2)参与人1MLRK博弈论20●重复剔除劣战略的占优均衡:如果重复剔除劣战略后剩下的战略组合是存在的,且唯一,称该战略组合为重复剔除劣战略的占优战略。例4支付如下(5,5)(6,7)(2,4)(1,2)(1,5)(4,1)(4,2)(5,3)(1,2)参与人1参与人2LKRHNU经过重复剔除劣战略后得到(R,N)。博弈论214纳什均衡由于占优均衡和重复剔除的占优均衡要求高,许多博弈不存在上述类型的均衡。如下例:例5参与人2(4,1)(2,0)(3,5)(4,8)参与人1MLRK上述博弈不存在占优均衡和重复剔除的占优均衡。下面考察战略组合(L,K)。给定参与人2选择K,L是参与人1的最优战略。反个来,给定参与人1选择L,K是参与人选择的最优战略。(L,K)是博弈双方不愿意偏离的战略,即达到相对稳定。该战略组合就是纳什均衡。博弈论22●纳什均衡:任何参与人都不愿意偏离的战略组合,即对于一个战略组合,若,称战略组合为纳什均衡。●纳什均衡求解方法:划线法划线法的基本思路是:(1)针对对方(参与人B)所给的战略,找出一个参与人A的最优战略,并在对应的支付上划一横线,(2)针对参与人A所给的战略,找出一个参与人B的最优战略,并在对应的支付上划一横线,(3)支付均划有横线所对应的战略组合即为纳什均衡。纳什均衡是各博弈方都不愿意单独改变的战略的组合。博弈论23例6市场进入博弈有一个垄断者巳在市场上(称为在位者);另—个企业虎视眈眈想进入(称为进入者)。进入者有两个战略可以选择:进入和不进入;在位者也有两个可选择的战略:默许(共享寡头利润)和斗争(假设采取成本价销售,即低价战略)。假定进入之前的垄断利润为300,进入之后寡头利润为100(各得50),进入成本为10。各种战略组合的支付矩阵如下:进入者在位者进入不进入默许斗争0,3000,300-10,040,50博弈论24由划线法可得两个纳什均衡:(进入,默许)和(不进入,斗争)。博弈论25纳什均衡与占优均衡、重复剔除劣战略的占优均衡的关系●占优均衡必是重复剔除的占优均衡,重复剔除劣战略的占优均衡必是纳什均衡。见图。纳什均衡占优均衡重复剔除的占优均衡纳什均衡博弈论265纳什均衡的应用例1库诺特寡头竞争模型(Cournot,1838)有两个参与人,分别称为企业1和企业2,每个企业的战略是选择产量;支付是利润,是两个企业产量的函数。博弈论27找出纳什均衡的—个办法是对每个企业的利润函数求一阶导数并令其等于零:博弈论28上述两个方程分别定义了两个反应函数:q2NE博弈论29为了得到更具体的结果,我们来考虑上述模型的简单情况。假设成本函数为需求函数为两个一阶条件方程为反应函数为:博弈论30联立解两个反应函数得纳什均衡为:每个企业的纳什均衡利润为为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润。垄断企业的问题是:博弈论31由一阶条件得企业的最优产量为企业的垄断利润为博弈论32寡头竞争的总产量大于垄断产量的原因是在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。这是典型的囚徒困境。例2豪泰林(Hotelling)价格竞争模型在库诺特模型中,产品是同质的。在这个假设下,如果企业的竞争战略是价格而不是产量,伯川德证明,即使只有两个企业,在均衡情况下,价格等于边际成本,企业的利润为零,与完全竞争市场均衡一样。这便是所谓的“伯川德悖论。如果不同企业的产品有差异,替代弹性就不会是无限的,此时价格不是消费者唯一的偏好,均衡价格不会等于边际成本。豪泰林模型考虑产品空间位置的差异性,在不同的位置支付不同的运输成本。博弈论33假定有一个长度为1的线性城市,消费者均匀地分布在[0,1]区间里,分布密度为1。假定有两个商店分别位于城市的两
本文标题:研究生教学讲稿博弈论与信息经济学08-09第二学期1
链接地址:https://www.777doc.com/doc-6279147 .html