您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第二章---完全信息静态博弈
第二章完全信息静态博弈(Staticgamesofcompleteinformation)静态(Static):参与人同时选择行动且只选择一次(若不同时,则后行动者并不知道前行动者具体采取什么行动)完全(Complete):参与人对对手的战略空间,支付函数完全了解,即没有事前不确定性且自然(Nature,虚拟参与人)的初始行动被每一个参与人所观察到。本章重点讨论一、博弈论的若干基本概念占优战略均衡(Dominantstrategyequilibrium,DSE)重复剔除占优均衡(Iterateddominanceequilibrium,IEDE)纳什均衡(PureNashequilibrium,PNE)混合战略纳什均衡(MixedstrategyNashequilibrium,MNE)二、纳什均衡应用模型举例古诺(Cournot)寡头竞争模型(1838)伯川德悖论(BertandParadox,1883)豪泰林(Hotelling)价格竞争模型(1929)公共品供给(Hardin,1968)、需求模型基础设施建设:中央政府和地方政府之间的博弈三、纳什均衡的存在性和多重性的讨论博弈:参与人选择行动战略寻找最优目标(Max)支付静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的信息被披露出来。一、博弈论的若干基本概念例2.1、两房地产商进行房地产开发博弈,其已知条件如表2.1所示:收入市场需求开发资金高低市场供给2栋1.4亿元7千万元1亿元1栋1.8亿元1.1亿元表2.1单位:栋依据表2.1数据,用标准式(战略式)来描述该博弈如下:0,00,80008000,04000,4000开发不开发A开发不开发B高需求0,00,10001000,0-3000,-3000开发A不开发开发不开发B低需求战略式包括三要素:参与人(player),战略(strategy),支付(payoff)一、博弈论的若干基本概念1、若干定义2、均衡(equilibrium)(1)占优战略均衡(DSE)(2)重复剔除占优均衡(IEDE)(3)纳什均衡(NEorPNE)1、若干定义(1)参与人集合i∈Γ,Γ=(1,2,…,n),上例为n=2;虚拟参与人“自然”(外生变量),如自然以一定的概率决定需求是高(大)还是低(小)。(2)行动(actionsormoves):i在某时点的决策变量,用ai表示,i的行动集合Ai={ai},如上例:A1=A2={开发,不开发},又如古诺模型,行动是选择产量qi,则Ai={qi|qi≥0}(3)信息(information):i有关博弈的知识(特别是“自然”选择,对手的特征和行动知识)(4)战略(strategy):战略是i在给定信息集h下的行动规则,它规定i在什么时候选择什么行动。即战略是i的“相机行动方案”(contingentactionplan)。(5)支付(payoff):特定战略组合下参与人得到的确定效用水平,或期望效用水平。(6)结果(outcome):均衡战略组合,均衡行动组合,均衡支付组合。如例2.1战略组合(高,{开发,开发},开发),行动组合(高,开发,开发),支付组合(uA,uB)=(4000,4000)。(7)均衡(equilbrium)(2)行动(actionsormoves)①行动组合(actionprofile):N个参与人的行动组成的有序集:a=(a1,a2,…,ai…,an),ai为第i个参与人的行动。如上例共有四个行动组合:(开发,开发),(开发,不开发),(不开发,开发)和(不开发,不开发)②行动的顺序(theorderofmoves):谁在什么时候行动。如例2.1自然先行动选择(高需求或低需求),然后参与人行动,A、B同时行动或A先行动B后行动或B先行动A后行动。③行动空间(actionset):在每次行动时,参与人有些什么选择。共同知识(CommomKnowledge):如果某一信息是所有参与人都知道的,如果每个参与人都知道所有参与人知道这一信息,如果每个参与人都知道所有参与人知道所有参与人知道这一信息,且如此这般直至无穷,那么这一信息便称为共同知识。在博弈论中,一般假定参与人的行动空间、行动顺序是任一参与人的共同知识。(3)信息(information)扩展式和博弈树:描述一个博弈的另外两种办法是扩展式与博弈树(见图2.1)A开发不开发开发开发开发开发不开发不开发不开发不开发NNBBBB大大小小(1/2)(1/2)(1/2)(1/2)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)图2.1房地产开发博弈I(3)信息(information)结(node):i或N采取行动的时点(决策结),或者博弈结束的时点。结x的后续结(successor):已经到达x之后才有可能在随后的博弈中到达的结,并定义T(x)为x之后的所有结的集合,t(x)为x的直接后续结。结x的前列结(predecessor):可能到达x之前必须到达的结,并定义P(x)为x之前的所有结的集合,p(x)为x的直接前列结。起始结(startingnode):不存在前列结的结,即P(x)=φ终点结(endnode)或终点(endpoint):不存在后续结,即T(x)=φ枝(branch):一个特定结上某一参与人的行动集中的一个行动,即从一个决策结到它的直接后续结的连线。路径(path):起始结到终点结中由结和枝所组成的系列。扩展式(extensiveform)扩展式(extensiveform)是对博弈的一种描述,它由下述几点组成:①由结和枝所组成的整体结构,即由单个起始结开始直至终点结,中间无闭合的圈(见教材P139.图2.2)。②有对哪个结点属于哪个参与人的说明。③在自然作选择的结上,有自然选择不同枝的概率。④有划分每个参与人的结的信息集。⑤在每一个终点结上都有对每一个参与人的支付。博弈树(gametree)博弈树(gametree)除⑤以外与扩展式都一样。在博弈树中,扩展式中的⑤点变为:5’在每一个终点结上都有结果。“博弈树”是一个比“扩展式”更为灵活的术语,如果结果被定义为支付组合,则两者并无差别。①信息集(informationset):描述i信息特征(博弈树上的所有决策结分割成不同的信息集。每个信息集是决策结集合的一个子集),该子集包括所有满足下列条件的决策结:a、每一个决策结都是同一参与人i的决策结;b、i知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结(见教材,P141)。如房地产开发博弈I(见图2.1):A信息集为{大,小},B的信息集为{大}或{小}。②完美信息(perfectinformation):i对任一对手及N的行动有准确了解,每个信息集都是单结的。(完美信息博弈:博弈中没有任何两个参与人同时行动并且所有后行动者确切地知道前行动者选择了什么行动,所有参与人观察到自然的行动)。信息种类信息种类含义完美(perfect)每个信息集都是单结的确定(certain)自然不在任一参与人行动之后行动对称(symetric)没有参与人在行动时或在终点结处有与其他参与人不同的信息完全(complete)自然不首先行动或它的最初行动被每个参与人所观察到完美与不完美信息划分确定性与不确定性划分对称信息与不对称信息划分完全信息与不完全信息划分完美与不完美信息划分完美与不完美信息划分:在完美信息博弈中,每个信息集都是单结的,否则该博弈就是不完美信息博弈。按张维迎的教科书如图2.1博弈等价于图2.2博弈:Na1a2b1b2b3b4大小(1/2)(1/2)开发开发开发开发开发开发不开发不开发不开发不开发不开发不开发(4,4)(8,0)(0,8)(0,0)(-3,3)(1,0)(0,1)(0,0)图2.2房地产开发博弈II信息集A:{a1,a2}B:{b1},{b2},{b3},{b4}因A信息集不是单点集,故上述博弈是不完美博弈。确定性与不确定性划分确定性与不确定性划分:在任一参与人行动之后,就再没有自然的行动了。否则这一博弈为不确定性博弈。(按艾里克·拉斯缪森的理解:图2.2为确定性博弈,而图2.1为不确定性博弈)对称信息与不对称信息划分对称信息与不对称信息划分:在对称信息博弈中,任一参与人在任何他应选择行动的结点或者终点结处的信息集,都至少包含与其他每个参与人的信息集相同的元素。否则,该博弈就是不对称信息博弈。(如图2.1、2.2博弈均为不对称信息,B知道N及A的行动,而A不知道B及N的行动)。不对称信息的实质在于某一参与人拥有的私人信息(Privateinformation),即一种不同于且不劣于其他任何参与人的信息分割。对称信息博弈中既可以有自然的行动,也可以有同时行动,但是没有一个参与人有哪怕一点点信息优势。不对称信息一定是不完美信息。完全信息与不完全信息划分完全信息与不完全信息划分:在不完全信息博弈中,自然首先行动且它的行动至少对某一参与人来说是不可观测的,否则,该博弈就是一个完全信息博弈。一个具有不完全信息的博弈一定是不完美信息博弈,因为某个参与人的信息集必然包含有多于一个的结点。有两种博弈是具有完全但不完美信息的——同时行动的博弈,自然在博弈的后期才行动且这一行动并非所有参与人知晓的博弈。许多不完全信息博弈都是不对称信息博弈,但这两个概念并不等价。不对称但完全信息的博弈:在房地产开发博弈中,若不存在自然的首先行动,但房地产商A采取了不为B所知的行动且房地产商A在随后的博弈又行动了,则这一博弈具有不对称但完全的信息。不完全但对称信息的博弈:让自然首先行动,且这一行动是任一囚徒都观察不到的,自然让囚徒困境中(坦白,坦白)的支付选择为(-8,-8)或者(-100,-100)。信息种类例2.2、信息分类的扑克牌;在下面的扑克牌博弈中,参与人赌最后谁能摸到最好的牌,摸牌的顺序是事先定好的。如何分类在下注之前的下述行为规则:①所有的牌都被洗成面朝上。②所有的牌都被洗成面朝下且参与人在下注前甚至不能看自己的牌。③所有的牌都被洗成面朝下且参与人只能看他自己的牌。④所有的牌都被洗成面朝上,但每个参与人随后都可以用手护住并悄悄丢掉一张牌。⑤所有的牌都被洗成面朝上,接着参与人下注,然后每个参与人再得到一张面朝上的牌。⑥所有的牌都被洗成面朝下,但随后每个参与人都抓起他的牌但并不看牌,接着把牌举过头顶以使所有其他参与人都能看清他的牌(印第安扑克)。(4)战略(strategy)战略集(strategyset)或战略空间(strategyspace):Si={si},si为i的一个特定战略。战略组合(strategyprofile):s=(s1,s2,…,si,…,sn)在例2.1中:若B在不知市场需求的情况下先行动,A在得知B行动后再选择自己行动,则B有两个战略SB={si|i=1,2;s1为开发,s2为不开发},但A有四个战略:SA={{开发,开发},{开发,不开发},{不开发,开发},{不开发,不开发}},D:开发ND:不开发{{D|D,D|ND},{D|D,ND|ND},{ND|D,D|ND},{ND|D,ND|ND}}S=({ND|D,D|ND},D)=({不开发,开发},开发)是一个战略组合,表为房地产商A选战略{不开发,开发},而房地产商B选开发战略。注1:战略与行动是两个不同概念:战略是行动规则而不是行动本身。因战略依赖于信息,但在静态中没有信息存在或信息不起作用,战略选择就简单变为行动选择。注2:战略是一种行动规则(规定什么时候才进行行动选择)。战略必须是完备的(即战略要给出参与人在每一种可想象到的情况下的行动选择,既使参与人并不预期这种情况会实际发生)。毛泽东:“人不犯我,我不犯人(行动),人若犯我,我必犯人(行动)”战略。(5)支付(payoff)ui=ui(s1,s2,…sn)它依赖于每一个i的战略选择。如例2.1:uA(高,开发,开发)=uB(高,开发,开发)=4000(千万元);uA(低,开发,不开发)=1000(千万元);若A认为
本文标题:第二章---完全信息静态博弈
链接地址:https://www.777doc.com/doc-1651487 .html