您好,欢迎访问三七文档
第二章完全信息静态博弈内容提要:•1.博弈的概念和表示方法。•2.纳什均衡及其求法。•3.混合策略纳什均衡及其求法。1博弈的标准式表述与均衡•1.1博弈的要素包括博弈方、策略空间、博弈的次序、博弈方的得益、博弈方的信息掌握程度和理性基础。其中博弈的次序、信息和理性基础是构成博弈前提,而要表示一个博弈,只要表出各博弈方及其策略空间和得益就可以了。即:•(1)博弈参与者集合:A={1,2,…,n}•(2)策略空间:Si,i=1,2,…,n.•(3)收益函数:ui(s1,s2,…,sn)•1.2定义1:如果一个博弈有n个博弈方,其策略空间分别为S1,S2,…,Sn,收益函数(也称为支付函数)分别为:u1,u2,…,un,则此博弈的标准式表示为:•G={N,{Si},{ui}},i=1,2,…,n,其中N是博弈方的集合,{Si}是策略空间,{ui}是收益函数。也可记为:•G={S1,S2,…,Sn;u1,u2,…,un}•标准式主要用来表示静态博弈。这种博弈中,参与者是同时选择策略(也称战略)的,但只要每一参与者在行动时不知道其他参与者的选择就可以了。•1.3迭代剔除严格劣策略(下策消去法)•定义4设si’,si”是参与者i的两个可选策略,若ui(s1,…,si-1,si”,si+1,…,sn)>•ui(s1,…,si-1,si’,si+1,…,sn)•对其他参与者在其策略空间S1,…Si-1,Si+1…,Sn,中的每一策略组合(s1,…si-1,si+1…,sn)都成立,则称si’是相对于si”的严格劣策略。•注意:严格占优策略是绝对的、唯一的,严格劣策略是相对的。•显然,理性的参与者是不会选择严格劣策略的。因此,逐一剔除劣策略是寻求博弈的解的一个方法。•例1博弈的双变量矩阵为•参与者2•左中右•上•参与者1•下•对参与者1来说,没有严格优策略和劣策略,但对参与者2来说,右严格劣于中,那么首先可以剔除右策略。这时,博弈就简化为0,31,20,11,00,12,0•参与者2•左中•上•参与者1•下•这时,参与者2没有严格劣策略,但对参与者1来说,下严格劣于上,于是,再次剔除参与者1的下策略,博弈再次简化为1,01,20,30,1•参与者2•左中•参与者1上•这时,又可看出,参与者1只有唯一的选择,但参与者2的两个策略中,中严格劣于左,因此,剔除参与者2的中策略,他也剩下唯一的选择:左。所以,策略组合(上,中)就是博弈的解。也称为严格剔除劣策略均衡。•如果某一步严格劣策略不止一个,则任意剔除一个即可,不影响最后结果。1,01,2选举问题•假设候选人的立场从左翼到右翼大致分为10个,分别编号为1,2,3,······,9,10.每一个立场大约有10%的选民支持,选民投票支持和自己立场最接近的候选人。•候选人如何确定自己的立场?•这个博弈的博弈方、策略、收益各是什么?假设有A、B两个候选人,策略就是其立场,收益假定为自己的选票比例,他们都希望自己得到的选票最多。•这里有劣势策略吗?策略1和策略2相比谁是劣势策略?•对手选1时,U1(1,1)=50U1(2,1)=90,•对手选2时,U1(1,2)=10U1(2,2)=50,•对手选3时,U1(1,3)=15U1(2,3)=20,…•可见,1是一个劣势策略。•2是否也是一个相对劣势策略?•对手选1时,U1(2,1)=90U1(3,1)=80,说明此时2比3好,因此2不是劣势策略。•注意到,1是对手的劣势策略,应当被剔除。当去掉策略1后,策略2就也是劣势策略了!•对手选2时,U1(2,2)=50U1(3,2)=80,•对手选3时,U1(2,3)=20U1(3,3)=50,•对手选4时,U1(2,4)=25U1(3,4)=30,…•以此类推,可知当去掉劣势策略1后,策略2也是劣势策略了!•注意不是说立场1或者10就没有了,只是它们不会被候选人所采取,所以从他们的策略集中可以去掉,以简化博弈。立场1和10的选票仍然是存在的•问题1.选民的立场不是均匀分布的;2.并非人人都投票;3.政治不是单一维度的,选民可能有综合考虑;4.选民的立场可能有变化;5.候选人不止两个,等等。•这些问题是实际中的情况,但它们不影响我们的分析。•1.4上策均衡•博弈分析的目的是预测博弈的均衡结果,也可称为求解博弈问题。也就是参与者选择策略的过程。选择方法无非两种:选优和去劣。•一般说来,每个参与者的收益都是所有参与者所选战略的函数,因此,每个参与者选择最优策略时必须考虑其他参与者的选择。但有些特殊的博弈中,某些参与者可能不需要考虑其他参与者的选择,因为无论其他参与者如何选择,他有唯一的最优策略,称为严格上策。•定义如下:•定义2:如果对于任一si’∈Si,si≠si’都有•ui(s1,…,si-1,si*,si+1,…,sn)>•ui(s1,…,si-1,si’,si+1,…,sn)•对其他参与者在其策略空间S1,…Si-1,Si+1…,Sn,中的每一策略组合(s1,…si-1,si+1…,sn)都成立,则si*就称为参与者i的严格上策。•如囚徒问题中坦白是两个囚徒的严格上策;智猪问题中不拱是小猪的严格上策,而大猪没有严格上策。•显然,如果每一参与者都有严格上策,在所有参与者的严格上策组合就构成博弈问题的解—严格上策均衡。•定义3在博弈的标准表示式中,若对任一参与者i∈A,si*是i的严格上策,则策略组合(s1*,s2*,…,sn*)称为严格上策均衡。•严格上策只要求每个参与者是理性的,而不要求每个参与者知道其他参与者是理性的(即不要求“理性”是共同知识)•注意:严格上策均衡和逐步剔除劣战略均衡对参与者的理性要求是不同的。前者只要每个参与者自己是理性的就可以了,而后者要求理性是参与者的共同知识,即,参与者不仅自己是理性的,还需要其他参与者也是理性的,并且还假定所有参与者都知道其他参与者是理性的。•逐步剔除劣策略是建立在理性参与者不会选择严格劣策略这一合情推理之上的,但这一方法和严格占优策略均衡一样,有时候找不到严格劣策略。所以,这两种解法虽然简单,但有时不奏效。•比如下面的博弈问题求解就比较困难:•乙•左中右•上•甲中•下0,44,05,34,00,45,33,53,56,6•2.纳什均衡•纳什均衡是一种博弈的解的概念,可以对非常广泛的博弈作出严格的预测。许多不存在严格占优策略均衡或逐步剔除劣策略均衡的博弈,却存在纳什均衡。并且,严格占优策略均衡必然是纳什均衡,纳什均衡也不会被逐步剔除劣策略所剔除。下面给出纳什均衡的定义:•2.1纳什均衡•定义5[纳什均衡]在n个参与者的标准式博弈G={S1,…,Sn,;u1,…,un}中,若策略组合(s1*,…,sn*)满足对每一参与者I,si*是他针对其他n-1个参与者所选策略(s1*,…,si-1*,si+1*,…,sn*)的最优战略反应,则称(s1*,…,sn*)是该博弈的一个纳什均衡。即:•ui(s1*,…,si-1*,si*,si+1*,…,sn*)>•ui(s1*,…,si-1*,si,si+1*,…,sn*)(NE)•对所有Si中的si都成立。就是说,si*是最优问题:•Maxui(s1*,…,si-1*,si,si+1*,…,sn*),si∈Si的解。•可以换一个角度理解纳什均衡。考察一个策略组合s’=(s1’,…,sn’),若s’不是纳什均衡,就意味着存在若干参与者i,其策略si’不是针对(s1’,…,si-1’,si+1’,…,sn’)的最优反应策略,即存在si”使得•ui(s1’,…,si-1’,si’,si+1’,…,sn’)<•ui(s1*’,…,si-1’,si”,si+1’,…,sn*)•这说明,s’不是纳什均衡,则至少有一个参与者要偏离s’.或者说,纳什均衡是各参与者共同遵守的协议。•寻找纳什均衡的方法最直接的就是查看每一个可能的策略组合是否符合(NE)条件。具体方法是,对参与者的每一个可选策略确定另一参与者相应的最优策略。策略有限时常用划线法。•如囚徒2•坦白沉默•坦白•囚徒1•沉默-6,-60,-9-9,0-1,-1•比如前面的博弈问题的纳什均衡的求法:•乙•左中右•上•甲中•下0,44,05,34,00,45,33,53,56,6•2.2几种均衡的关系:(1)每一个上策均衡都是纳什均衡,反之,不一定。因为在严格上策均衡中,每一参与者所选策略是对于其他参与者的任何策略组合的最佳选择,那对于其他参与者的任何均衡组合,也是最优策略。符合(NE)条件,所以也是纳什均衡。反之,有些博弈中根本就没有严格上策均衡,但纳什均衡却是存在的。说明纳什均衡不一定是严格上策均衡。(2)每一个逐步剔除严格劣策略均衡是纳什均衡,反之,不一定。(3)纳什均衡不会被逐步剔除严格劣策略所剔除。••严格占优反复去劣纳什均衡•例性别之战:不在同一个地方的夫妻两个试图决定一个晚上的娱乐活动。看韩剧和看球赛,两人都希望能在一起,不愿分开。但丈夫希望看球赛而妻子希望看韩剧。把收益量化后得双变量矩阵为•妻子•韩剧球赛•韩剧•丈夫•球赛•此博弈有两个纳什均衡。1,20,00,02,12.3策略空间无限时纳什均衡求法•例1古诺(Cournot)的双寡头垄断模型•设q1,q2分别表示企业1,2生产的同样产品的产量,市场中该产品的总供给Q=q1+q2,令P(Q)=a-Q表示市场出清价格(当Q>a时P(Q)=0),设企业i生产qi总成本为cqi,即不考虑固定成本,边际成本为常数c,假设c<a.并且两个企业同时进行产量决策。•首先把问题转化为标准式博弈。博弈参与者:企业1、2;博弈参与者的策略空间:设产量是连续变化的,则S1=S2=[0,+∞)。(其实不会产生qi>a的情况)•把各自的收益表示成自己和对方所选策略的函数:•U1(q1,q2)=q1[P(q1+q2)-c]=q1[a-(q1+q2)-c]•U2(q1,q2)=q2[P(q1+q2)-c]=q2[a-(q1+q2)-c]•设(q1*,q2*)是纳什均衡,则由(NE)得:•u1(q1*,q2*)≥u1(q1,q2*)•u2(q1*,q2*)≥u2(q1*,q2)•对所有qi∈Si=[0,+∞)都成立。•即对每个参与者i,qi*必须是最优化问题的解])([),(])([),(2*1202*120*2110*2110maxmaxmaxmax1211cqqaqqqucqqaqqquqqqq•分别求导数得到•如果(q1*,q2*)是纳什均衡则必须0202*12*21cqqacqqa0202*1*2*2*1cqqacqqa•解得•这一均衡在直观上很好理解。每一企业都想成为垄断者,它会选择qi使ui(qi,0)最大化。3*2*1caqq241iim)ca()0,q(u,2q利润为垄断产量为ca•也可以这样考虑:由前面求导数的两式改写一下为(称为最优反应函数)•在q1q2坐标系中作出它们的图像,其交点就是最优产量组合即纳什均衡。02021221cqqacqqaoq1q22q2=a-q1-c2q1=a-q2-c(q1*,q2*)(a-c,0)((a-c)/2,0)(0,a-c)(0,(a-c)/2)三方博弈的纳什均衡划线法求法•甲、乙、丙三个博弈方的博弈如下表:•乙•左中右••上•甲中•下•丙选A时2,1,30,1,14,2,51,2,42,1,31,3,23,3,13,4,52,4,13,3,1练习题•1.下面的博弈问题的结果是什么?•乙•abc•a•甲b•c2,01,14,23,41,25,31,30,23,0
本文标题:博弈论2
链接地址:https://www.777doc.com/doc-3313505 .html