您好,欢迎访问三七文档
博弈论任课教师:戴韡动态博弈本节将进一步探讨动态博弈逆向归纳法的数学表述完全且完美信息动态博弈逆向归纳法二人二阶段情形的数学表达:参与者1从可行集A1中选择一个行动a1,参与者2观测到a1后从可行集A2(a1)中选择一个行动a2,两个人的收益分别是u1(a1,a2),u2(a1,a2)。逆向归纳法221(212)max(,)aaAuaa在第二阶段,由参与者2行动时,他可以观测到参与者1已经选择的行动a1,他面临的决策问题可以写成如下的形式:把参与者2的最优反应记为R(a1),那么参与者1的最优选择,事实上是如下的优化问题的解:我们把以上问题的最优解(a1*,R(a1*))称为博弈的逆向归纳解。逆向归纳法11111max(,())aAuaRa逆向归纳法逆向归纳解不含有不可置信的威胁。参与者1首先预测了参与者2对自己行动的最优反应,而这一预测恰好排除了参与者2的不可置信的威胁。理性共识理性是共同的知识参与者1不可能选R如果参与者1选了R参与者1不是理性的参与者1认为参与者2不是理性的完全信息vs完美信息完全信息指的是参与者对博弈的结构有完全的了解,包括所有参与者的策略集(strategies)和收益(payoffs)。完美信息指的是参与者对其他参与者的行动(actions)都了解,这些是博弈内的信息。完全信息vs完美信息囚徒困境是完全信息,但不是完美信息。乒乓运动是完全信息也是完美信息,但如果有赌球,就变成了不完全信息。在微观经济学中,完美信息(perfectinformation)是完全竞争(perfectcompetetion)的基础。虽然此时商家无法掌握其他商家的完全知识,但市场价格反映了所有相关的信息。完全且完美信息完全且完美信息的动态博弈行动是顺序发生的下一步行动选择前,以前所有的行动都可以被观察到所有可能的行动组合下参与者的收益都是共同知识。斯塔科尔伯格模型双头垄断的动态模型一个支配企业(行业的领导者)先行动,然后从属企业(追随者)行动。苹果在平板电脑的定位通用在汽车领域的定位斯塔科尔伯格模型])([),(21cQpqqqii产品价格p(Q)=a-Q,成本均为c;企业1选择产量q1,企业2观测到q1后选择产量q2;Q=q1+q2。企业i的收入为斯塔科尔伯格模型企业2的最优反映R2(q1)应满足可得R2(q1)=(a-q1-c)/2][max),(max2120212022cqqaqqqqq斯塔科尔伯格模型企业1的问题可以表示为解得q1=(a-c)/2,从而q2=(a-c)/4])([max))(,(max110111011cqRqaqqRqiqq工会和企业工会对工资说一不二。企业自主决定就业人数。工会的效用为U(w,L).其中w为工会开出的工资,L为就业人数。企业的利润为R(L)-wL.U是w和L的增函数,R是L的增函数,且是凹函数。工会和企业对于工会在第一阶段的任意一个工资水平w,第二阶段中企业的最优反映满足如下的式子wLLRL)(max0工会和企业工会和企业工会和企业工会的问题可以表示为))(,(max*0wLwUw工会和企业事实上这个解是低效率的(不是帕累托有效率的)总结逆向归纳法完全信息vs完美信息斯塔科尔伯格均衡解工会的低效率
本文标题:博弈论06
链接地址:https://www.777doc.com/doc-3263508 .html