您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 信息与策略经济学(北京大学CCER,巫和懋)Part2-2
2-1信信息息与与策策略略经经济济学学第第22章章扩扩展展式式与与完完全全信信息息动动态态博博弈弈2.1扩展式动态博弈的范例与表示................................................................................2-12.1.1动态博弈的范例...............................................................................................2-12.1.2动态博弈扩展式的表示法...............................................................................2-32.2完美信息扩展式博弈................................................................................................2-62.3不完美信息扩展式博弈............................................................................................2-92.4完全信息重复博弈...............................................................................................2-102.5产业竞争之应用……………………………………………………………….2-121.5.1可信承诺………………………..……………………………………………2-121.5.2策略性贸易政策……………………………………………………………..2-142.6定理证明...................................................................................................................2-1622..11扩扩展展式式动动态态博博弈弈的的范范例例与与表表示示2.1.1动态博弈的范例考虑以下原为静态博弈的范例,但在允许参赛者可以先后出招后就成为动态的博弈:例1吓阻进入(EntryDeterrence)旧公司原价低价进10,50*-10,30新公司不进0,1000,100*如果新、旧公司同时出招,均衡为何?如果新公司决定进入此产业之后,旧公司是否会采低价之价格战策略?旧公司是否能吓阻新公司进入?如果旧公司是连锁店(chainstores),是否在每个城市或区域都采价格战,以吓阻新集团进入?吓阻进入博弈中有二个NE:(进,原价),(不进,低价)。但很重要信息是新公司常先采行动,新旧公司之间有行动之先后⇒以扩展式博弈表示如下。©Prof.Ho-MouWu巫和懋教授02/26/20082-2再以逆推法来求均衡,只得一个SPNE(下一节讨论),就是E进而I采原价。换言之,旧公司(I)价格战的恐吓是不可信的(notcredible)。⇒逆推法求得的相应策略才是可信的威胁(crediblethreat)。但对连锁店集团来说,若有K=50,从第50个市场开始,I不作价格战,到第49家亦然,…反推下去,连锁店的SPNE是对所有50个市场均不作价格战以吓阻新公司。由理论推导出的SPNE与实际观察到的价格战现象不符,是为Selten所称的连锁店悖论(Chain-StoreParadox)。关于这方面的发展,以后到不完全信息博弈再谈。例2隐性勾结(TacitCollusion)乙高价低价高价10,105,12甲低价12,58,8两家厂商面临同样的单位成本每单位2元,无固定成本。两家均采高价(4元)则每家可销售5万个,若均采低价(3元)则每家可售8万个,若一家采高价,一家采低价,则采高价者售出2.5万个而采低价者售出12万个。如果这二家厂商每月均需面对对方,长久以往,是否能达到每月(10,10)的报酬?例3协调博弈(GamesofCoordination)乙L规格S规格L规格2,2-1,-1甲S规格-1,-11,1同时出招时有两个纳什均衡,究竟何者会成立?在考虑动态调整后,允许一家先行,是否可以达成某一特定均衡?换言之,纳什均衡原本众多,但在动态博弈中是否得以精炼(refinement),使均衡数目减少?E进不进原价底价(-10,30)(0,100)(10,50)吓阻进入的扩展式博弈(与原博弈已不同了!)不完美訊息I2-3例4出价策略(BiddingStrategy)T公司进行中的投资计划可能成功或失败,外界认为每股T公司股票可能在0至20元之间,每点概率都相同,只有T公司自知其真实价值(信息不对称)。A公司考虑并购T公司,A公司经营绩效优异,有信心在入主T公司以后使其价值增为原来的1.5倍。A公司为购并T公司,应向T公司出价每股多少元?2.1.2动态博弈扩展式的表示法扩展形式以博弈树表示。博弈树(gametree)是多个环节(nodes)与枝干(branches)的集合,从单一的起始环节,不经回转,不经交错,直到终结环节(以Z表其集合)。博弈树就代表博弈历史(到某一环节终止亦可)。动态博弈以扩展式(ExtensiveForm)来表示。扩展式博弈Γ=(N,A,H,T,π,I,U)有七个要素:(1)参赛者N,i∈N={1,2,…,n}。(2)可选行动A,a∈A。(3)历史H,h=(a1,…,ak)∈H。(i)H包含一起始点()0hH∈,任何历史h(或环节h)表示之前所选的行动,而且若(a1,…,ak)∈H,则(a1,…,ak-1)∈H。(ii)给定h,定义()(){}|,AhaAhaH=∈∈为面对历史h后可选的行动,定义(){}|,,ZhHhaHaA=∈∉∀∈为终结环节。(4)对每个环节的分配法则T:将每个环节(除0h与Z外)分配给不同的参赛者:{}()(){}0\|iHhHhZThi=∈∪=,则()Th可选()(){}|,AhahaH=∈。(5)起始点的随机法则π,赋予()0AhA⊆一个概率分布π,来描叙自然(Nature)的影响。(6)参赛者行动时的信息集合(InformationSet)I,是{}()0\HhZ∪的分割(partition):当h与h’属于分割中同一集合时()()'ThTh=而且()()'AhAh=。给定h,()Ih是包含了h的信息集合,是对参与者()Th提供的信息。(集合X2-4的分割={}|,,iiijiiBBXBBBX⊂∩=∅∪=)(7)对应参赛者可能选取策略,各参赛者在终结环节所得的报酬U。决策点有限就是有限博弈。历史允许无限数列()1,2,kka=就是无限博弈:若()1,kkLaH=∈对任何整数L均成立,则()1,2,kkaH=∈。例5:二手车买卖中卖方(S)可以修车或不修车,要求高价或低价,而买方(B)可以决定买或不买。在这博弈中虽没有自然的影响,但信息不透明:S修或不修车不能为B所观察到。可用扩展式表示为N={S,B},A={修车,不修车,高价,低价,买,不买},对h=(修车,高价)∈H的历史(环节),I(h)={(修车,高价),(不修车,高价)}表示T(h)=B买方不知卖方是否修好车才要求高价,可选集合为A(h)=A(h’)={买,不买}。例5中二手车买卖的扩展式:例2该如何表示?例4该如何表示?对信息集合跨时的要求:完美回忆(perfectrecall),过去知道的不能遗忘(MWG,p225)。报酬买SSS修不修BBBB高价高价低价低价买买买不买不买不买不买可否列举H的元素?H包含了15个历史(环节)。给定h=(修车,高价),包含I(h)的分割是{{(修车,高价),(不修车,高价)},{(修车,低价),(不修车,低价)}}。2-5再以例3(协调博弈)来看:策略式2LSL2,2*-1,-11S-1,-11,1*等价如此信息集合表示2不能区分1是否采用了L或S。一旦改了信息集合(如下),就代表完全不同的博弈:2(L,L)(L,S)(S,L)(S,S)L2,2*2,2*-1,-1-1,-11S-1,-11,1-1,-11,1*等价1LS2LLSS(2,2)(-1,-1)(1,1)(-1,-1)静态(扩展型式)不完美信息信息集合21LS2LLSS(2,2)(-1,-1)(1,1)(-1,-1)完美信息动态博弈22-6例如(L,L)代表1采L后2采L,而且1采S后2采L。藉以表示出2的策略因1策略而意义不同。“策略”的涵义:表示出在各个信息集合观察到(1的行动)之下的相应行动,(L,L)代表是在二个信息集合下2所分别采取的策略。如此扩展式表示2能区分1采用了L还是S。当2能观察到1的行动,因为2的信息集合中只有单一个元素(singleton),故称2有完美信息(perfectinformation)。2.2完美信息扩展式博弈(ExtensiveGameswithPerfectInformation)定义:完美信息(PerfectInformation):参赛者完全得知以前各参赛者所采行动。换言之,参赛者面对的信息集合都只有单一元素(singleton);若不满足此条件则为不完美信息(ImperfectInformation)博弈。完美信息扩展式博弈中,参赛者完全了解决策之前所有发生的历史:假设不同时出招,而且没有自然(Nature)的选择。完美信息表示出来就是每个信息集合都只有一个元素(I(h)={h})。以扩展式表示法来看,没有自然与相应的随机法则π,也没有必要刻画信息集合。完美信息扩展式博弈Γ=(N,A,H,T,U)有五个要素。定义:在完美信息扩展式博弈中,纯策略iisS∈是对任何历史\hHZ∈及参赛者()Thi=到其相应行动()()ishaAh=∈的函数。(策略依(N,A,H,T)四要素而定。)策略是对任何可能发生状况(contingency)都找到相应行动的完整方案,策略组合()iiNss∈=对应终结环节()Os的报酬是()()iiNUOs∈。以上扩展式动态博弈Γ=(N,A,H,T,U)也可表为策略式Γ’=(N,(Si),(Ui)),其中Si是Γ博弈中参赛者i的策略空间,()()'iiUsUs≥当且仅当()()()()'iiUOsUOs≥对,'ssS∈成立。定义:完美信息扩展式博弈Γ=(N,A,H,T,U)的纳什均衡是一组策略组合*s使得对所有iN∈,()()()()*,*,*iiiiiiUOssUOss−−≥对所有iisS∈都成立。2-7例6:依纳什均衡定义知道(A,C)与(B,D)是NE。(B,D)意义:给定2在A之后选择D,1最好一开始选择B;给定1会选择B,2到决策环节最好还是选择D(一个策略是完备的相机(contingent)方案)。在扩展式博弈中1可先行,报酬2较高,(A,C)较有可能发生,以下考虑SPNE。定义:子博弈(Subgame)是原博弈的一部份(小树subtree),从单一元素的信息集合开始到终结环节,并且不会改变任何的信息集合。定义:子博弈完美均衡(SubgamePerfectNashEquilibrium,SPNE)是一策略组合,在原博弈中是纳什均衡,而且它相关的策略在每个子博弈中也都是该子博弈的纳什均衡。逆推法(BackwardInduction)基于连续理性原则(PrincipleofSequentialRationality:参赛者在每一步骤上均追求效用极大)定理2.1(Kuhn,1953):每个完美信息扩展式的有限博弈都有一个逆推法找出的纯策略纳什均衡(也是纯策略子博弈完美均衡(SPNE))。完美信息博弈的推广,成为不完美信息博弈:(1)引入自然(Nature)与起始点的随机法则π。定理2.1仍然成立。(2)引入同时行动(SimultaneousMove)T(h)=多个参赛者的集合,行动集合()()()iiThAhAh∈=Π但,钱
本文标题:信息与策略经济学(北京大学CCER,巫和懋)Part2-2
链接地址:https://www.777doc.com/doc-813583 .html