博弈论06

博弈论任课教师：戴韡动态博弈本节将进一步探讨动态博弈逆向归纳法的数学表述完全且完美信息动态博弈逆向归纳法二人二阶段情形的数学表达：参与者1从可行集A1中选择一个行动a1，参与者2观测到a1后从可行集A2(a1)中选择一个行动a2，两个人的收益分别是u1(a1,a2),u2(a1,a2)。逆向归纳法221(212)max(,)aaAuaa在第二阶段，由参与者2行动时，他可以观测到参与者1已经选择的行动a1，他面临的决策问题可以写成如下的形式：把参与者2的最优反应记为R(a1)，那么参与者1的最优选择，事实上是如下的优化问题的解：我们把以上问题的最优解(a1*，R(a1*))称为博弈的逆向归纳解。逆向归纳法11111max(,())aAuaRa逆向归纳法逆向归纳解不含有不可置信的威胁。参与者1首先预测了参与者2对自己行动的最优反应，而这一预测恰好排除了参与者2的不可置信的威胁。理性共识理性是共同的知识参与者1不可能选R如果参与者1选了R参与者1不是理性的参与者1认为参与者2不是理性的完全信息vs完美信息完全信息指的是参与者对博弈的结构有完全的了解，包括所有参与者的策略集（strategies）和收益（payoffs）。完美信息指的是参与者对其他参与者的行动（actions）都了解，这些是博弈内的信息。完全信息vs完美信息囚徒困境是完全信息，但不是完美信息。乒乓运动是完全信息也是完美信息，但如果有赌球，就变成了不完全信息。在微观经济学中，完美信息（perfectinformation）是完全竞争（perfectcompetetion）的基础。虽然此时商家无法掌握其他商家的完全知识，但市场价格反映了所有相关的信息。完全且完美信息完全且完美信息的动态博弈行动是顺序发生的下一步行动选择前，以前所有的行动都可以被观察到所有可能的行动组合下参与者的收益都是共同知识。斯塔科尔伯格模型双头垄断的动态模型一个支配企业（行业的领导者）先行动，然后从属企业（追随者）行动。苹果在平板电脑的定位通用在汽车领域的定位斯塔科尔伯格模型])([),(21cQpqqqii产品价格p(Q)=a-Q，成本均为c；企业1选择产量q1，企业2观测到q1后选择产量q2；Q=q1+q2。企业i的收入为斯塔科尔伯格模型企业2的最优反映R2(q1)应满足可得R2(q1)=(a-q1-c)/2][max),(max2120212022cqqaqqqqq斯塔科尔伯格模型企业1的问题可以表示为解得q1=(a-c)/2,从而q2=(a-c)/4])([max))(,(max110111011cqRqaqqRqiqq工会和企业工会对工资说一不二。企业自主决定就业人数。工会的效用为U(w,L).其中w为工会开出的工资，L为就业人数。企业的利润为R(L)-wL.U是w和L的增函数，R是L的增函数，且是凹函数。工会和企业对于工会在第一阶段的任意一个工资水平w，第二阶段中企业的最优反映满足如下的式子wLLRL)(max0工会和企业工会和企业工会和企业工会的问题可以表示为))(,(max*0wLwUw工会和企业事实上这个解是低效率的（不是帕累托有效率的）总结逆向归纳法完全信息vs完美信息斯塔科尔伯格均衡解工会的低效率

博弈论06

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

修改过的机器人作业

中国房地产开发模式

888888商业物业招商管理实务

给水排水之其他固定灭火设施

西北工业大学878机械设计及理论

政策性银行

酒店行业基本礼仪（PPT31页)

从抗菌药物的合理与优化应用到经验性抗菌治疗-XXXX

人民警察考试法律基础知识

070704关于上市公司做好非公开发行股票的董事会、股东大会决议有

相关文档

相关搜索