您好,欢迎访问三七文档
LOGOKMRW声誉模型主讲:万远鹏周英英谢雅琴模型的证明声誉模型的应用:政府货币政策1234声誉模型的理论基础KMRW声誉模型主要讨论的是不完全信息重复博弈中的合作行为,由Kreps,Milgrom,RobertsandWilsom建立,其试图证明:参与人对其他参与人支付函数或战略空间的不完全信息对均衡结果有重要影响,合作行为在有限次博弈中会出现,只要博弈重复的次数足够长。模型的证明假设条件⑴囚徒1理性的(1-P)非理性的P⑵囚徒2理性的⑶理性囚徒可以选择任何战略,非理性囚徒选择“针锋相对”战略:开始选择“抵赖”,然后在t阶段选择囚徒2在t-1阶段的选择“理性”&“非理性”理性囚徒——机会主义者、非合作型参与人非理性囚徒——讲义气重信誉的人、合作型参与人的证明博弈的顺序1.自然首先选择囚徒1的类型;囚徒1知道自己的类型,囚徒2只知道囚徒属于理性的概率是(1-P),非理性囚徒的概率是P2.两个囚徒进行第一阶段博弈3.观测到第一阶段博弈后,进行第二阶段博弈;观测到第二阶段博弈后,进行第三阶段博弈;如此等等4.理性囚徒1和囚徒2的支付是阶段博弈的支付的贴现值之和模型的证明我们的目的是证明,即使在完全信息下肯定会选择“坦白”的理性囚徒,也会在不完全信息下选择“抵赖”C代表“坦白”,D代表“抵赖”博弈重复两次(T=2)博弈重复三次(T=3)模型的证明分析结果⑴如果P≥2/9,对于所有T3,下列战略组合构成一个精炼贝叶斯均衡:理性囚徒1在t=1至t=T-2阶段一直选择D,然后再t=T-1和t=T阶段选择C;囚徒2在t=1至t=T-1阶段选择D,然后在t=T阶段选择C。如果我们将任何一个囚徒选择C的阶段称为非合作阶段,两个囚徒都选择D的阶段称为合作阶段,那么,容易看出,只要T3,非合作阶段的总数量等于2,与T无关。⑵如果P2/9,合作均衡不可能作为精炼贝叶斯均衡出现。原因是,如果囚徒2在t=T-1阶段不选择D,在t=T,即使非理性囚徒1也不会选择,从t=T-2开始的博弈类似一个重复两次的博弈,囚徒2在t=T-2阶段也不会选择D;依此类推,没有任何一个阶段囚徒2选择D,理性囚徒自然不会选择D,唯一的精炼贝叶斯均衡是静态博弈纳什均衡的重复,如同在完全信息情况下一样。双方非对称信息如果我们假定两个囚徒的类型都是私人信息,就是说,每个囚徒都有P0的概率是非理性的,那么不论P多么小,只要博弈重复的次数足够多,合作均衡就会出现。为了说明这一点,假定非理性囚徒选择“冷酷战略”,开始选择D直到对方在t阶段选择C,然后从t+1阶段开始选择C直到T针锋相对表示的是重信用讲义气,冷酷战略代表的是绝不原谅对方的任何背信弃义的行为双方非对称信息考虑囚徒1.如果他在t=1(第一阶段)首选选择C,暴露自己是理性的(因为非理性的囚徒绝不首先选择C),从t=2阶段开始,两个囚徒都将选择C,直到T(最后阶段),这是一个均衡非理性囚徒2选择C,是为了报复囚徒1的背信弃义行为;给定囚徒1选择C,理性囚徒2也将选择C类似的,理性囚徒1的最优选择也是C事实上,给定囚徒1在t=1时偏离合作,这是从t=2开始的唯一的均衡。因此,理性囚徒1的最大期望支付是:0+(-8)+`。。。+(-8)=(-8)(T-1)双方非对称信息•现在考虑理性囚徒1的另一种战略:开始选择D直到T,除非囚徒2在阶段选择了C,在后一种情况下,从t+1开始选择C直到T•这个战略并不是理性囚徒1的最优战略,但这个非最优战略也优于从一开始就选择C的战略,如果T足够大的话•如果囚徒2是非理性的,理性囚徒1从这个战略得到的支付(-1)T;如果囚徒2是理性的,理性囚徒1的最小支付是(-10)+(-8)(T-1)=-8T-2也就是说如果囚徒2在t=1阶段选择C囚徒1在t=1阶段的支付是-10,之后每阶段是-8理性囚徒1从这个战略得到的期望支付是:P(-T)+(1-P)(-8T-2)当P(-T)+(1-P)(-8T-2)〉-8(-T)时,也就是只要T〉T*=(10-2P)/7P,从一开始选择C不是理性囚徒1的最优战略。特别满足这个条件的T随P递减这个结果意味着即使小小的不确定性也会导致合作行为,如果博弈重复的次数足够大从上容易验证不论p多小总存在一个T*使得对所有的T〉T*在T=1时对理性囚徒1不是最优的,类似结论对理性囚徒2也成立定理在T阶段重复囚徒博弈中,如果每个囚徒都有P〉0的概率是非理性的(只选择针锋相对或冷酷战略),如果T足够大。那么存在一个T*<T,使得下列战略组合构成一个精炼贝叶斯均衡所有理性囚徒在t≤T*阶段选择合作(抵赖)在tT*阶段选择不合作(坦白)并且非合作阶段的数量(T-T*)只与P有关与T无关声誉模型的应用:政府货币政策运用声誉模型证明:如果公众有关政府偏好的信息不完全,出于声誉考虑,政府在有限的任期内可能不选择制造通货膨胀假设公众认为政府有两种类型:强政府(从不制造通货膨胀);弱政府(有可能制造通货膨胀)公众推断强弱政府的方法:一旦制造通货膨胀就认定为政府为弱政府政府的效用函数政府在有限期内选择何时不制造通货膨胀?假定政府的单阶段效用函数:b=0代表强政府;b=1代表弱政府。单阶段弱政府的最优通货膨胀是,效用水平是)(212ebW1b21w在重复T次博弈中,为t阶段弱政府选择通货膨胀的概率,为公众认为弱政府选择通货膨胀的概率。在均衡情况下,如果在T阶段没有观测到通货膨胀,根据贝叶斯法则,在T+1阶段政府是强政府的概率表示t阶段公众认为政府是强政府的概率;则弱政府的概率为。强政府不制造通货膨概率为1如果政府制造了通货膨胀观测到通货膨胀,公众就知道政府是弱政府让我们考虑两个阶段(T-1和T)模型的解.在T阶段(最后阶段)建立不制造通货膨胀的声誉已没有意义,弱政府的最优选择是公众的通货膨胀预期为政府的效用水平是:弱政府的效用是P的增函数,这就是弱政府为什么有积极性建立强声誉的原因令为政府的贴现因子。如果弱政府在T-1选择不制造通货膨胀,弱政府的总效用为:如果弱政府在T-1选择制造通货膨胀,弱政府的总效用为:当时就是说,如果公众在T-1阶段是认为政府是强政府的概率不小于,弱政府就会假装强政府.换言之,政府的声誉越好,维持声誉的积极性就越高.21Tp101-T1优于T将代入贝叶斯法则并重新安排得到:即公众越是认为政府是强政府,弱政府选择不制造通货膨胀的概率就越高如果政府在T-1阶段选择零通货膨胀率政策是最优的,那么,在所有的tT-1阶段选择零通货膨胀率都是最优的.因此,如果,我们有如下精炼贝叶斯均衡(混同均衡):强政府选择:弱政府选择:(1)强政府的效用水平(2)弱政府的效用水平当时,精炼贝叶斯均衡为:强政府的选择:弱政府的选择:强政府的效用水平是0(与混同均衡情况下相同);弱政府的效用水平(贴现值)是:显然,对弱政府来说,情况下的效用水平远远小于情况下的效用水平
本文标题:声誉模型
链接地址:https://www.777doc.com/doc-1871142 .html