您好,欢迎访问三七文档
经济博弈论主讲人:吕廷杰使用教材与参考书•《博弈论》施锡铨著,上海财经大学出版社•《经济博弈论》谢织予主编,复旦大学出版社•《博弈论与信息经济学》张维迎著,上海三联书店、上海人民出版社•《博弈论——矛盾冲突分析》罗杰.B.迈尔森著,于寅费剑平译,中国经济出版社Game游戏;一定规则下有胜负的竞赛活动,如:OlympicGameGameTheory=对策论,博弈论第一章经济博弈论概述1.1基本背景简介•博弈论又称对策论(GameTheory),主要研究决策主体的行为发生直接相互作用的时候,其决策以及这种决策的均衡问题。奠基石著作《博弈论与经济行为》(1944),诺意曼、摩根斯坦《n人博弈的均衡点》(1950),纳什(JohnNash)点评:社会科学研究范式中的一种核心工具——研究社会科学的数学工具区别:传统经济学理论市场是一个无形的手新凯恩斯学派则强调政府有形的手的作用Max生产函数(决策变量、活劳动、物化劳动资本等),而与其他企业无关?研究理性的行动者(agents)相互作用的理论所有的科学,只有当数学应用于其中时,才可称得上是完美的!——卡尔.马克思•博弈论在经济中的应用——经济博弈论:重点在于研究寡头市场:研究存在相互外部经济条件下的个人选择问题!•博弈论的两大分支:合作博弈(cooperativegame)与非合作博弈(non-cooperativegame)•合作博弈:当事人能否达成一种有约束力的协议(bindingagreement)——团体理性——强调效率、公正、公平•非合作博弈:每个企业都选择自己的最优产量(或价格),其结果可能是有效率的,也可能是无效率的。94年获奖者的研究重点!•总之,博弈论在经济学中的应用侧重于对竞争与冲突分析、市场作用机制等方面问题的研究,对这一领域作出杰出贡献的学者包括:1994年诺贝尔经济学奖获奖的三位博弈论专家:纳什(Nash)、泽尔藤(Selten)和海萨尼(Harsanyi)。乔治。阿克罗夫麦克尔。斯彭斯约翰·纳什约瑟夫。施蒂格里茨大师们的风采几则短信的经济学解释鱼说:我时时刻刻睁开眼睛,就是为了能让你永远在我眼中!水说:我时时刻刻流淌不息,就是为了能永远把你拥抱!!锅说:都快熟了,还这么贫!!!一、约束条件变了,原来的收益,一下子都变为成本。生命如果架在锅上,成本自然也就很高了。一农户在杀鸡前的晚上喂鸡,不经意地说:快吃吧,这是你最后一顿!第二日,见鸡已躺倒并留遗书:爷已吃老鼠药,你们别想吃爷了,爷也不是好惹的。二当你知道了别人的决定之后,就能做出对自己最有利的决定。——纳什均衡理论找点空闲找点时间背着炸弹到银行看看警察为你准备了一副手铐狱长为你张罗一床毛毯生活的烦恼向记者说说抢劫的细节跟警察谈谈三你要得到一些东西,就得放弃另一些东西。在经济学里,这叫机会成本。今夜星光灿烂,你在哪里浪漫,没事可别乱跑,也别到处放电,我知你已成年,爱慕之心难免,但以你的条件,不能那么随便,你是纯种狼犬,别和笨狗相恋。四杀头的事有人干,赔本的买卖没人做。交易的本质是不等价交换,是双赢。而双赢的前提是约束下的需要。飞机上,乌鸦对乘务员说:给爷来杯水!猪听后也学道:给爷也来杯水!乘务员把猪和乌鸦扔出机舱,乌鸦笑着对猪说:傻了吧?爷会飞!五外界因素是一种约束条件,自身能力也是一种约束条件。所以,别人能成功的事,未必自己就能成功。黑猩猩不小心踩了长臂猿拉的大便,长臂猿温柔细心地帮她擦洗干净后他们相爱了,别人问起他们是怎么走到一起的,黑猩猩感慨地说:猿粪!都是猿粪那!六路径依赖在经济学里说的是,你当下的选择是被你的前一个选择决定的,如果你要改变路径,成本将会高到你不愿意改变。1.2经济博弈论与经济学学派之争•新古典经济学派(自由市场经济学派):经济学研究稀缺资源的有效配置——无形的手!•前提:①足够多的市场参与者——竞争性条件;②参与者之间不存在信息不对称——公平条件•新凯恩斯学派:经济学是研究人的行为——不利选择!•理性的人:具有偏好,在给定的约束条件下最大限度的实现自己的偏好。理性人可能利己也可能利他,因此与自私的人不同。•需要研究:激励相容(incentivecompatible)或自选择条件(self-selection)•双赢——利己与利他的博弈——相互影响——结盟策略•理性人发明各种制度来规范行为——新制度经济学(路径依赖理论等)——如:价格制度•价格制度的缺陷:如何研究学校、政府等非价格制度体系中人与人之间的相互作用——经济博弈论——奠基石•关于中国的电信的拆分•广电与电信的交叉进入•全业务经营问题案例1:长滩模型与公平、有效(1,1)(1,1)(1,1)互联互通中的认识误区大网、小网成本不同,所以应该不对等结算!经济学的两个基本命题:(1)市场力与机会损失原则(2)边际收益递减原则结论性命题:平等接入的公平性原则是互联互通双方的利益均衡点满足互联不会对运营商之间在互联前的平均每用户收益相对关系产生扭曲影响。案例2:对于利益主体矛盾的调解泽尔腾公平奖励组合原则:nnwrwrwr2211)(21总收益Rrrrn式中:问题1:如果令成本=w;则上式也成立!当大网用户数为N,小网用户数为n时,取话务吸引系数:11nNNw12nNnwnNnNLnNrr21则:于是有结算比例问题2:“信产部9号令”是不公平的!A网交换机B网交换机DDFDDFODFODF互联点?222111/wcrwcr/nNcc12因此有互联点应在大网一侧即:2.1博弈论研究的几个要素(1)•参与人(局中人):选择行动以使自己效用最大化的决策主体(理性人),表示为:i=1,2,3,…,n,n为参与人总数;•策略:通常:–纯策略空间:可以是连续或间断的–混合策略空间:满足),,,(21iikiiisssS),(2,1iikiiipppP11ikjijp第二章博弈论基础•行动:参与人的决策变量:•支付函数(盈利函数):参与人从博弈中获得的效用水平,是行动的函数•战略:参与人行动的规则•信息:参与人在博弈中的知识,特别是有关对手特征和行动的知识•对局:博弈行动的集合•结局:博弈的解(均衡对局)•均衡:所有参与人的相对最优战略或行动集合•其中参与人、行动、结果统称为博弈规则、博弈分析就是使用博弈规则来预测均衡点。)(iiijikjSsd,2,1),,(21nidddu关于理性人与智能(1)•理性人(rational):若一个决策者在追求其目标时能前后一致地做决策,我们就称其为理性的。理性人的行为符合伯努里(1738)和冯·诺依曼/摩根斯坦(1974)的期望效用最大化定理。效用收益效用收益效用收益风险厌恶风险中性风险爱好冯.诺依曼—摩根斯坦效用函数E[U(x)]UxUxUx决策者从x美元中获得的效用支付为u(x)=1-e-cx,其中c表示他的风险厌恶指数(Pratt,1964)智能的(intelligent):若局中人知道我们对此博弈所知道的一切(完全信息),并能做出我们对此局势所能做出的一切判断,则称此博弈的局中人是智能的。关于理性人与智能(2)2.2博弈的分类•(1)按参与人行动的先后顺序分类:–静态博弈:参与人同时选择行动或非同时,但后者并不知前者采取了什么行动;–动态博弈:参与人的行动有先后顺序,且后者能够观察到前者所选择的行动。•(2)按照参与人对对手的特征、战略空间及支付函数的知识划分:–完全信息博弈:–不完全信息博弈博弈的分类及其所对应的均衡行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950-51)完全信息动态博弈子博弈精炼纳什均衡泽尔藤(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-68)不完全信息动态博弈精炼贝叶斯纳什均衡Kreps,Wilson(1982)Fudenberg,Tirole(1991)•n=2,S1=S2=(A,B),•对局(甲,乙)=(A,A),(A,B),(B,A),(B,B)•u1(A,A)=2,u1(A,B)=-1,u1(B,A)=-2,u1(B,B)=1,•u2(A,A)=-2,u2(A,B)=1,u2(B,A)=2,u2(B,B)=-1CDA2,-2-1,1B-2,21,-1局中人甲盈利矩阵局中人乙2.3两人O和博弈的纯策略解ABA2-1B-21局中人乙局中人甲mM-1-2Mm21盈利矩阵1求纯策略解的最大最小法则与最小最大法则结局:(甲,乙)*=(B,B)u1*(B,B)=1u2*(B,B)=-1ABA-21B2-1局中人乙局中人甲Mm12mM-2-1盈利矩阵2结局:(甲,乙)*=(B,B)u1*(B,B)=1u2*(B,B)=-12.4二人0和博弈的混合策略解局中人1盈利矩阵1局中人2设局中人1,2采取行动A,B的概率分别为•局中人1的混合策略(p1,p2)=(p,1-p)•局中人2的混合策略(q1,q2)=(q,1-q)居中人1:采取行动A的期望收益为:2q-(1-q)0=3q-10采取行动B的期望收益为:-2q+(1-q)0=-3q+10居中人2:采取行动A的期望收益为:2p-2(1-p)0=4p-20采取行动B的期望收益为:-p+(1-p)0=-2p+10ABA2-1B-21•居中人1的混合策略(p1,p2)=(1/2,1/2)•居中人2的混合策略(q1,q2)=(1/3,2/3)混合策略的数学表述•局中人i=1,2,3,…,n,的一个混合策略是其纯策略空间上的概率分布,记为:i。•n个局中人的混合策略向量为:=(1,2,…,n)称为混合策略组合或混合策略剖面,其中1,2,…,n是统计独立的;•局中人i在混合策略剖面上的期望赢利:),,,(21iikiiisssSnnnniliiiliiiklnlijllinlnklklliiklliilkjijiissssusssssu1211111111111),,,,,()()()()()()(21111111111在上例中:212112221111),()()()(lljljjssussu01322312113223121212121121222),()()()(ljlljjssussu01211213222122131ABA2,-2-1,1B-2,21,-1注解:纯策略空间上的概率分布称为退化分布2.5非O和博弈的累次严优法局中人2局中人1LMRU4,35,16,2M2,18,43,6D3,09,62,8局中人2局中人1LMRU456M283D392局中人2局中人1LMRU312M146D068局中人2的策略M称为其相对于策略R的“严劣策略”——可以删除!局中人2局中人1LRU4,36,2M2,13,6D3,02,8局中人2局中人1LRU4,36,2解:(U,L),(4,3)注解:并非所有的博弈问题都有累次严优解!局中人2局中人1LRU46M23D32(1)完全信息静态博弈的纳什均衡:–假设有n个人参加博弈,在给定其他人策略的条件下,每个人选择自己的相对最优策略(可能依赖于他人的策略或不依赖),所有参与人选择的策略一起构成一个战略组合,即为纳什均衡。(僵局)•注解:Nash均衡策略是指这样一个策略组合(或剖面),为了极大化自己的盈利(或效用),每一个局中人所采取的策略一定应该是关于其他局中人所采取策略的最佳反应。因此没有一个局中人会轻率地偏离这个策略组合(或剖面)而使自己蒙受损失。2.6囚徒困境与纳什均衡坦白不坦白坦白-8,-80,-15不坦白-15,0-1,-1囚徒2囚徒1解:(坦白,坦白),(-8,-8)•当累次严优解不存在时,即局中人采用某策略时A优于B,而采用另一策略时B优于A时。(2)囚徒困境关于帕累托最优与有效结局•数理经济学的Pareto最优在博弈论中可以表述为
本文标题:吕廷杰-经济博弈论
链接地址:https://www.777doc.com/doc-1139997 .html