您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 北大精品课件:《博弈论与公共政策》之完全信息静态博弈
博弈论与公共政策北大精品课件完全信息静态博弈主要内容•一、博弈的标准式表述•二、占优策略均衡•三、重复剔除的占优均衡•四、纳什均衡•五、多重纳什均衡的比较•六、混合策略•七、应用举例•何谓静态博弈?•开始时由参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果。•何谓完全信息静态博弈?•每一参与者的收益函数在所有参与者之间是共同知识。一、博弈的标准式表述•博弈的标准式表述包括三个方面的内容:•(1)博弈的参与者•(2)每个参与者可供选择的策略集•(3)针对所有参与者可能选择的策略组合,每个参与者获得的收益•对于一个n人博弈,设各参与者的策略空间依次为S1,S2,…,Sn,收益函数分别为u1,u2,…,un,其中ui(s1,s2,…,sn)为参与者选择策略组合(s1,s2,…,sn)时参与者i的收益,则可用标准式将该博弈表示如下:G={S1,S2,…,Sn;u1,u2,…,un}•在双人有限策略的情况下,可以用双变量矩阵更直观地表述博弈。例1:囚徒困境囚徒2抵赖招认囚徒1抵赖-1,-1-9,0招认0,-9-6,-6•但是,如果参与者超过2人,则用双变量矩阵形式来表示博弈就不那么方便了,甚至根本无法采用这种形式。例2:三人有限策略博弈丙:策略A丙:策略B乙乙左右左右甲上0,0,10-5,-5,0甲上-2,-2,0-5,-5,0下-5,-5,01,1,-5下-5,-5,0-1,-1,5二、占优策略均衡•1、占优策略•在博弈中,如果不管其他参与者选择什么策略,某个参与者的特定策略都优于或至少不劣于其他所有策略,那么,我们就说这个特定策略是该参与者的占优策略。•在前面的囚徒困境博弈中,“招认”就是每个囚徒的占优策略。•2、占优策略均衡•如果每个参与者都存在占优策略,那么由这些占优策略构成的组合就称为占优策略均衡。•在前面的囚徒困境中,(招认,招认)就构成一个占优策略均衡。•注意:•占优策略均衡只要求每个参与者是理性的,而并不要求每个参与者知道其他参与者是理性的,也就是说,不要求“理性”是共同知识。例3:公共产品的供应问题•A、B两人同住一室,现在,他们考虑是否购买一台电视机。电视机的价格为4000元,每个人从看电视中获得的效用各为3000元。•假定他们根据下列程序决定是否购买电视机:•每人把是否购买电视机的想法写在一张纸条上,如果两人都认为应该购买,则平均分担购买电视机的费用。如果两人都认为不应该购买,则不购买电视机。如果只有一人提出购买而另一人不想购买,则由提出购买的人独自购买电视机。•每个人会如何决策?三、重复剔除的占优均衡•1、重复剔除的占优均衡•首先从某一参与者的策略集里剔除掉一个劣策略,再重新考察各个参与者剩下的策略中哪些是劣策略并剔除其中之一,不断继续这一过程直到每个参与者都仅剩一个策略为止,最后得到的策略组合就称为重复剔除的占优均衡。例4:俾斯麦海之战木村北线南线肯尼北线2,-22,-2南线1,-13,-3•在单人决策中,当所有情况下的收益都增加(至少不减少)时,当事者的境况不会变得更坏,但在博弈中则未必。比较下面的两个博弈:例5乙乙左右左右甲上-1,32,1甲上1,34,1下0,23,4下0,23,4•2、理性共识•重复剔除的占优均衡不仅要求每个参与者是理性的,而且要求“理性”是参与者的共同知识,即参与者具有“理性共识”(CommonKnowledgeofRationality,简记为CKR)。•理性共识可划分为不同的层次:•零阶理性共识:每个人都是理性的,但不知道其他人是否理性。•一阶理性共识:每个人是理性的,并且知道其他人也都是理性的,但并不知道其他人是否知道自己是理性的。•二阶理性共识:每个人是理性的,也知道其他人都是理性的,而且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道他们知道自己是理性的。•依此类推。例6乙左中右甲上1,01,20,1下0,30,12,0•选择越多(行动空间越大),对理性共识的要求越高。•请看下例:例7乙C1C2C3C4甲R15,100,111,2010,10R24,01,12,020,0R33,20,44,350,1R42,930,920,91100,90四、纳什均衡•许多博弈既不存在占优策略均衡,也不存在重复剔除的占优均衡。例8乙左中右甲上0,44,05,3中4,00,45,3下3,53,56,6•1、纳什均衡的定义•如果存在这样一个策略组合——给定该策略组合中其他参与者的选择,没有人有积极性改变自己的选择,我们就说该策略组合是一个纳什均衡。•交通规则问题就是一个很好的例子:乙靠左行靠右行甲靠左行1,1-1,-1靠右行-1,-11,1例9:交通规则问题•纳什均衡是一种一致预期:基于信念的选择是合理的;支持选择的信念是正确的。•这种一致预期能够自我实现,不会出错:如何所有人认为这个结果会出现,这个结果就会出现。•以交通规则问题为例,如果甲认为乙预期甲将靠右走,甲就确实会选择靠右走。•2、纳什均衡的意义•如果某个策略组合为纳什均衡,那么任何一个参与者都没有激励独自背离他所选定的策略。这就是说,该策略组合是“策略稳定”或“自动实施”的。•换一种说法,如果参与者事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳什均衡。•3、严格纳什均衡与弱纳什均衡•4、用划线法求纳什均衡例10乙左中右甲上100,1000,050,101中50,01,160,0下0,3000,0200,200•5、纳什均衡与重复剔除的占优均衡之间的关系•命题一:•纳什均衡不会被重复剔除严格劣策略过程所剔除。•命题二:•如果重复剔除严格劣策略过程最终只剩下唯一的策略组合,那么这一策略组合为该博弈唯一的纳什均衡。•命题三:•不能被重复剔除严格劣策略过程所剔除的策略组合,不一定是纳什均衡。例11:约会博弈男生歌剧拳击女生歌剧2,10,0拳击0,01,2•命题四:•重复剔除弱劣策略过程有可能剔除弱纳什均衡,但不会剔除严格纳什均衡。例12乙左右甲上2,10,0下1,31,3五、多重纳什均衡的比较•1.聚点均衡•2.帕累托效率标准•3.强均衡•4.抗联盟(抗共谋)纳什均衡博弈实验1•分钱财博弈例2:三人有限策略博弈丙:策略A丙:策略B乙乙左右左右甲上0,0,10-5,-5,0甲上-2,-2,0-5,-5,0下-5,-5,01,1,-5下-5,-5,0-1,-1,5六、混合策略•1、混合策略•所谓混合策略,就是参与者以一定的概率从几种纯策略中随机选择。•有些博弈不存在纯策略纳什均衡,但存在混合策略纳什均衡。例13:监督博弈监督不监督偷懒不偷懒1,-1-1,2-2,32,2例14:单相思男生图书馆游泳池女生图书馆-1,12,-1游泳池1,-2-2,2例15:划拳博弈•2、说明•(1)一个给定的纯策略可能会严格劣于一个混合策略,即使这个纯策略并不严格劣于其他任何一个纯策略。例16乙LR甲T3,-0,-M0,-3,-B1,-1,-•(2)一个给定的纯策略可以是针对对手的一个混合策略的最优反应,即使这一纯策略并不是针对对手的任何一个纯策略的最优反应。例17乙LR甲T3,-0,-M0,-3,-B2,-2,-•(3)给定其他参与者的策略,参与者的一个混合策略要成为其最优反应,混合策略中每一个概率大于0的纯策略本身也必须是其最优反应。•3、混合策略纳什均衡的充要条件•对任一参与者,凡是以正的概率被选择的纯策略应带来相等的期望收益,且不低于以零概率被选择的纯策略带来的期望收益。•4、混合策略纳什均衡的求法•(1)对于每个参与者,选择其纯策略空间的一个子集。构造一个一般化的混合策略组合。•(2)检查是否存在参数(概率)使得该混合策略组合满足混合策略纳什均衡的充要条件。若存在,则为混合策略纳什均衡。•(3)不断重复前两步,直到完成对各参与者所有子集组合的分析为止。例18:求混合策略均衡乙BSX甲B4,20,00,1S0,02,41,3•5、对混合策略的理解•参与者i的混合策略可以解释为其对手对于i将会选择哪一个纯策略的不确定性,实际上,在i的心中,可能依据自己掌握的一点儿私人信息已经选择了某一纯策略。不过,由于其他参与者不能观察到i的私人信息,他们无法确定i的选择,我们就用i的混合策略表示其他参与者的这种不确定性。博弈实验2•公共汽车让座博弈•6、纳什定理(纳什均衡的存在性)•在博弈中,如果n是有限的,并且对每个i,Si是有限的,则博弈至少存在一个纳什均衡,均衡可能包含混合策略。1212,,,;,,,nnGSSSuuu七、应用举例•例19:古诺的双头垄断模型•例20:伯川德的双头垄断模型•例21:最后要价仲裁•例22:公共地的悲剧•三个选民(1、2、3)要就三个备选方案(A、B、C)进行投票。采用多数票制,但为了避免出现僵局,现在选民1担任主席,主席的权力体现在:如果三个人的投票结果没有哪个方案胜出,那么作为主席的1就拥有最终决定权。各人的偏好顺序如下表所示。以上信息为共同知识。•你认为每个人会如何投票,最终哪个方案被选中呢?博弈实验3第一偏好第二偏好第三偏好主席1ABC选民2CAB选民3BCA
本文标题:北大精品课件:《博弈论与公共政策》之完全信息静态博弈
链接地址:https://www.777doc.com/doc-3862951 .html