您好,欢迎访问三七文档
什么是博弈论?在人世间,人与人之间的对抗和较量是一个不容回避的话题,只有直面这个话题,个人才更有可能获得成功的机会;人们试图获得成功,就有必要研究对抗局势中如何策略性地选择自己的行动;专门研究互动局势下人们的策略行为的学问叫“博弈论(gametheory)”理性人在最大化自己的偏好时,需要相互合作,而合作中又有冲突——人类为达到合作和解决冲突所发明的重要制度之一价格制度市场参与者的数量足够多,从而市场是竞争性的参与者之间不存在信息不对称问题传统的新古典经济学就是以价格为研究对象的,故又称为价格理论。其基本假设:-传统经济学的假设及其局限性一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无涉,所有其他人的行为都被总结在“价格”参数之中基本假设:完全竞争,完美信息然而在以下情况,上述结论不成立:非完全竞争:垄断越来越普遍外部性:市场不可能把所有的成本收益都计算在内公共产品:市场无法解决“搭便车”问题逆向选择问题:柠檬市场,二手车市场道德风险问题:为什么市场的交易费用比较高?传统经济学假设的局限性:交易主体的数量其实很有限;信息是不对称的;百年来,经济学的主要发展围绕以上五方面展开研究,建立起垄断竞争理论产业组织理论企业理论信息经济学新制度经济学不确定下的决策(投资理论)博弈论逐渐成为经济学的基石-博弈论对经济学的影响博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开国外经济学教科书改写,加入大量博弈论内容博弈论进入主流经济学,反映了:经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学越来越重视对信息的研究传统微观经济学的工具是数学(微积分、线性代数、统计学),而博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异不可以公里计。二、博弈论的发展概述博弈是决策主体在互相对抗中,对抗双方(或多方)互相依存的一系列策略和行动的过程集合。博弈论:专门研究博弈如何出现均衡的规律的学问。博弈论的基本内容非合作博弈合作博弈-博弈论的分类及相应的均衡博弈三要素:参与人(player)行动(action)或策略(strategy)支付(payoff)其的起点是参与人的战略集合和对有关结局的偏好其起点是一组潜在的约束性协议和参与人对它们的偏好信息、战略、结果博弈行动顺序信息静态动态完全信息纳什均衡(纳什)子博弈精练纳什均衡(泽尔腾)不完全信息贝叶斯纳什均衡(海萨尼)精练叶贝斯纳什均衡(泽尔腾等)动态博弈静态博弈参与人的行动顺序参与人对其他参与人的了解不完全信息博弈完全信息博弈博弈的分类合作博弈非合作博弈根据参与人是否合作零和博弈常和博弈变和博弈根据博弈结果根据行动的先后次序静态博弈动态博弈完全信息博弈根据参与人对其他参与人的各种特征信息的获得差异不完全信息博弈两人博弈多人博弈根据参与人的多少博弈论的产生与发展1838年,奥古斯特.古诺提出古诺模型;在20世纪初,泽美劳(Zermelo)、鲍莱尔(Borel)和约翰.冯.诺伊曼等数学家就已经开始研究博弈的数理基础。约翰.冯.诺伊曼和奥斯卡.摩根斯坦的题为《博弈论与经济行为》(1944年)的经典巨著奠定了在经济学中应用博弈论的基础。一、完全信息静态博弈定义:博弈各方同时决策且彼此对各种策略组合情况下所有参与人相应的得益都完全了解。表达:在博弈论中,一个博弈可以用两种不同的方式来表达:策略式表述:适合于静态博弈(矩阵式)扩展式表述:适合于讨论动态博弈(树状结构)博弈论模型一个博弈需要有五方面内容组成:参与人策略支付信息均衡博弈要素均衡博弈的参与人集合:i∈Γ,Γ=(1,2,…,n);每个参与人的战略空间:Si(i=1,2,3,…,n);每个参与人的得益函数:ui(s1,…,sn),(i=1,2,3,…,n)用G={S1,…,Sn;u1,…,un}代表博弈的战略式表述.博弈的策略式表述囚徒困境囚徒B囚徒A坦白抵赖坦白抵赖-8,-80,-10-10,0-1,-1每个参与人的得益函数:博弈的参与人集合:Γ=(A,B);每个参与人的战略空间:SA=(坦白,抵赖)SB=(坦白,抵赖)uA(坦白,坦白)=uB(坦白,坦白)=-8uA(抵赖,抵赖)=uB(抵赖,抵赖)=-1uA(坦白,抵赖)=uB(坦白,抵赖)=0uA(抵赖,坦白)=uB(抵赖,坦白)=-10占优策略:一些特殊的博弈中,一个参与人的最优策略可以不依赖于其他参与人的策略选择,就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。劣策略:如果一个博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称为“劣策略”。二、占优策略均衡在这个例子里,无论对方如何选择,每个人的最优选择:坦白;可以预测,结果将是(坦白,坦白)占优均衡:由所有参与人的占优策略构成的战略组合。占优战略均衡的出现只要求由所有参与人都是理性的,但不要求每个参与人知道其他参与人是否理性。“囚徒困境”博弈有占优均衡,所以其结果很容易预测。占优策略均衡“囚徒困境”的一般表示参与人B参与人A合作不合作合作不合作T,TS,RR,SP,P满足:R>T>P>S;S+R<T+T三、用法律解决“囚徒困境”满足:X>R-T参与人B参与人A合作不合作合作不合作T,TS,R-XR-X,SP,P四、重复剔除的占优均衡找出某个参与人的严格劣策略(假定其存在),把这个劣策略剔除掉;重新构造一个不包含已剔除策略的新的博弈;重复这个过程,一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。注意,上述表述中强调了“唯一”这个词。也就是说,如果重复剔除后剩下的策略组合不唯一,那么该博弈就不是可通过重复剔除劣策略求解的。思路:理性共识0-阶理性共识:每个人都是理性的,但不知道其他人是否是理性的;1-阶理性共识:每个人都是理性的,并且知道其他人也是理性的,但不知道其他人是否知道自己是理性的;2-阶理性共识:每个人都是理性的,并且知道其他人也是理性的,同时知道其他人也知道自己是理性的;但不知道其他人是否知道自己知道他们是理性的……重复剔除与理性共识重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人是理性的;每个人知道每个人知道每个人是理性的,如此等等……理性是“共同知识”(共识)。C1C2C3R110,41,598,4R29,90,399,8R31,980,100100,98最优选择C1C2C3R110,41,598,4R29,90,399,8R31,980,100100,98这个博弈只要求1-阶理性共识就可以预测到均衡结果如果R相信C是理性的,R就知道C不会选择C3,所以R的最优选择是R1;如果C相信R是理性的,C就知道R不会选择R2和R3;此时,C1又成为C的严格劣战略;重复剔除的占优均衡:(R1,C2)选择越多,对理性共识的要求越高0-阶理性:C是理性的,C不会选择C4;1-阶理性:R相信C是理性的,R会将C4从C的战略空间中剔除,所以R不会选择R4;2-阶理性:C相信R相信C是理性的,C会将R4从R的战略空间中剔除,所以C不会选择C1;3-阶理性:R相信C相信R相信C是理性的,R会将C1从C的战略空间中剔除,R不会选择R1;4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间中剔除,C不会选择C3;5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战略空间中剔除,R不会选择R3;C1C2C3C4R15,100,111,2010,10R24,01,12,020,0R33,20,44,350,1R42,930,920,91100,90不能用重复剔除求解的博弈许多博弈没有占优均衡,也没有重复剔除的占优均衡。左中右上1,01,30,1下0,40,22,3实用性较强的博弈分析方法,必然是以策略之间的相对优劣关系,而不是绝对优劣关系为基础的,根据这样的思路,很容易导出博弈分析的“划线法”。划线法因此,以上五个策略都不可能被双方接受!左中右上1,01,30,1下0,40,22,3策略组合(下,中)和(上,右)都不是两博弈方针对另一方策略的最佳对策;策略组合(上,左)(下,左)和(下,右)仅有一方的策略是针对另一方策略的最佳对策;该策略组合的双方策略都是对对方策略的最佳策略,表明给定一方采用该策略组合中的策略,则另一方也愿意采用该策略组合中的策略,该策略具有稳定性。五、纳什均衡与一致性预期纳什均衡:所有参与人的最优战略的组合,即给定战略中别人的选择,没有人有积极性改变自己的选择。构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略,当然,逆定理是不存在的。许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。纳什均衡的正式定义有n个参与人的战略式表述博弈G={S1,…,Sn;u1,…,un}战略组合s*=(s1*,…,sn*)是G的一个纳什均衡,如果对于每一个i,si*是在给定其他参与人选择s-i*=(s1*,…,si-1*,si+1*…,sn*)的情况下第i个参与人的最优战略,即:ui(si*,s-i*)≥ui(siα,s-i*)对任意siα∈Si,和任意的Γ都成立。一致性预期一致性预期:基于预期的选择是合理的,支持选择的预期是正确的。预期的自我实现:如果所有人都认为这个结果会出现,这个结果就会出现,预期是自我实现的,预期不会错。如果你预期我会选择X,我就真的会选择X。如果参与人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。应用1——古诺的双寡头垄断模型(1938)假定:只有两个厂商面对相同的线形需求曲线,P(Q)=a-Q,Q=q1+q2两厂商同时做决策;假定成本函数为C(qi)=ciqi问题:两个厂商的均衡产量和均衡价格如何确定。该博弈问题的标准式:参与人——厂商1和厂商2战略空间——每个企业可以选择的产品产量:Si=[0,∞),i=1,2,qi≥0收益——用利润额代表企业的收益Π1(q1,q2)=q1P(q1+q2)-c1q1=q1(a-q1-q2-c)Π2(q1,q2)=q2P(q1+q2)-c2q2=q2(a-q1-q2-c)均衡——MaxΠi(qi,qj*)=Maxqi(a-qi-qj*-c)0≤qi≤∞0≤qi≤∞企业利润最大化的条件为:02Π02Π21222111cqqaqcqqaq22)(22)(112221qcaqRqqcaqRq纳什均衡产量为:321caqqNENE9)(ΠΠ221caNENE纳什均衡利润为:反应函数q1q222)(221qcaqRqa-c(a-c)/2a-c(a-c)/222)(112qcaqRq(q1*,q2*)(a-c)/3(a-c)/3垄断产量和垄断利润垄断企业的目标函数:)()(ΠcQaQQcQQPM4)(Π2caM垄断利润为:2caQM垄断产量:在古诺均衡解中,这种情况就不会发生,两个企业的总产量要更高一些,相应地使价格有所降低。卡特尔与囚犯困境卡特尔是一种垄断组织,各个厂商互相通过某种协定达成某种默契以求获得共同的最大收益。价格卡特尔:制定一个共同的价格,销售同样的产品。产量卡特尔:统一控制产量,减少产量,抬高价格,使组织的共同收益最大,比如欧佩克就是典型的产量卡特尔。卡特尔组织的各成员可能也会作出类似的个体最优的决策,最终损害卡特尔组织的集体利益,这样就需要强加一些惩罚性的制度安排,改变支付矩阵,迫
本文标题:博弈论ppt完整版
链接地址:https://www.777doc.com/doc-1497007 .html