您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第10章-贝叶斯博弈与贝叶斯Nash均衡
第三部分:不完全信息静态博弈第十章贝叶斯博弈与贝叶斯Nash均衡主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释一、贝叶斯博弈•前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。例如•在“新产品开发”博弈中,企业对市场的需求可能并不清楚;•在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。•将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。例如:“斗鸡博弈”•考察这样的情形:假设参与人可能有这样的两种性格特征(类型)——“强硬”(用s表示)或“软弱”(用w表示)。•所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;•而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。•显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。•令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。当参与人都为强硬者时•博弈存在两个纯战略Nash均衡——(U,D)和(D,U)。-4,-42,-2-2,20,0UD21UD当参与人1为强硬者参与人2为软弱者时•博弈存在唯一的Nash均衡——(U,D)。-4,-42,0-2,00,1UD21UD当参与人1为软弱者参与人2为强硬者时•博弈存在唯一的Nash均衡——(D,U)。-4,-40,-20,21,0UD21UD当参与人都为软弱者时•博弈存在唯一的Nash均衡——(D,D)。-4,-40,00,01,1UD21UD-4,-42,-2-2,20,0UD21UD-4,-42,0-2,00,1UD21UD-4,-40,-20,21,0UD21UD-4,-40,00,01,1UD21UD(1)参与人都为强硬者(2)参与人1为强硬者参与人2为软弱者(3)参与人1为软弱者参与人2为强硬者(4)参与人都为软弱者•在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。•在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。•对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。•同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。•对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。•这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U,D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。•但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。•当一个参与人并不知道在与谁博弈时,博弈的规则是没有定义的,如何处理不完全信息?•Harsanyi提出了Harsanyi转换。•为了分析,对“斗鸡博弈”进行简化。•假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道但参与人2清楚,而且这一假设为所有的参与人所知道。Harsanyi转换•对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”参与人——“自然”(nature,用N表示),构造一个参与人为:两个决斗者和“自然”的三人博弈。Harsanyi转换-4,-42,-2-2,2UD0,0-4,-42,0-2,00,1N()p强硬(1)p−软弱220x1x2xDDDDDUUUUU1“自然”首先行动决定参与人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。•Harsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。•在Harsanyi转换中规定:参与人关于“自然”选择的推断为共同知识。•也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。在应用Harsanyi转换时,需要注意以下问题:•1)“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。•用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,typespace),即,t=(t1,…,tn)表示一个所有参与人的类型组合,t-i=(t1,…,ti-1,…,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。iitT∈•2)参与人关于“自然”选择的推断。用p(t1,…,tn)表示定义在参与人类型组合上的一个联合分布密度函数,Harsanyi转换假定:对于一个给定的不完全信息博弈问题,存在一个参与人关于“自然”选择的推断p(t1,…,tn),且p(t1,…,tn)为共同知识。也就是说,Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的,并且为共同知识。•用表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则•其中,为边缘密度函数。()iiiptt−((,)(,))()(,)iiiiiiiiiiiitTttttptttttpppp−−−−−−∈==∑()ipt•贝叶斯博弈(thestaticBayesiangame)是关于不完全信息静态博弈的一种建模方式,也是不完全信息静态博弈的标准式描述。贝叶斯博弈的定义•贝叶斯博弈包含以下五个要素:(1)参与人集合;(2)参与人的类型集T1,…,T2;(3)参与人关于其他参与人类型的推断…,;(4)参与人类型相依的行动集A(t1),…,A(tn);(5)参与人类型相依的支付函数,…,。{1,2,...,}nΓ=111(),ptt−()nnnptt−112211((),(),,();)nnatatattu1122((),(),,();)nnnnatatattu规定贝叶斯博弈的时间顺序如下:(1)“自然”选择参与人的类型组合t=(t1,…,tn),其中;(2)参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断;(3)参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);(4)参与人i得到。()iiiptt−1122((),(),,();)nniiatatattu贝叶斯博弈中的战略•在贝叶斯博弈中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti),它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。;();();(());((();))iiiiiiGTpAtuatt=Γ•用表示给定其他参与人的战略,类型为ti的参与人i选择行动ai时的期望效用,则•其中,对,为给定t-i时由s-i所确定的其他参与人的行动组合(,;)iiiivast−111((),,(),(),,())iiinsssss−−+=⋅⋅⋅⋅(,;)()(,();)iiiiiiiiiiiiiitTvastpttuaatt−−−−−−∈=∑iitT−−∀∈()iiat−−111111()((),,(),(),,())iiiiiinnststststst−−−−++=•在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i,他将选择使自己期望效用(支付)最大化的行动,其中()iiat∗()()argmax(,;)iiiiiiiiiaAtatvast∗−∈∈纯战略贝叶斯Nash均衡•贝叶斯博弈的纯战略贝叶斯Nash均衡是一个类型相依的行动组合,其中每个参与人在给定自己的类型ti和其他参与人的类型相依行动的情况下最大化自己的期望效用。•也就是,行动组合是一个纯战略贝叶斯Nash均衡,如果对,;();();(());((();))iiiiiiGTpAtuatt=Γ1122((),(),,())nnatatat∗∗∗()iiat∗−−1122((),(),,())nnatatat∗∗∗i∀∈Γ()()argmax()(,();)iiiiiiiiiiiiiiiaAttTatpttuaatt−−∗∗−−−∈∈∈∑存在性结论•定理一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。贝叶斯Nash均衡定义的另一种表示方式•在静态贝叶斯博弈中,战略组合是一个纯战略贝叶斯Nash均衡,如果对及,满足•即没有参与人愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。;();();(());((();))iiiiiiGTpAtuatt=Γ***1(,,)nsss=i∀∈Γ*,()iiiisttT∀∈*****111111()()()(()()()()();max,,,,,,)()argiiiiiinniiiiiiiiiiiiiatAttTstuststatststtptt−−−−−++∈∈∈∑三、贝叶斯Nash均衡的应用1.不完全信息古诺模型•在Cournot模型中,每一个企业对其他企业的成本和自己的成本是已知的,因而信息是完全的。•然而在实际中,企业往往很难知道其他企业的成本。当Cournot模型中至少有一个企业不知道其他企业的成本时所对应的模型即为不完全信息的Cournot模型。•参与人类型——成本函数。假设:•企业1的成本函数为共同知识:•企业2的成本函数为私人信息:其中,•企业1知道企业2是的概率为p,是的的概率是1-p,p和1-p为共同知识。1111()cqcq=⋅22222222()()lLhHcqcqcqcq=⋅=⋅22LHcc2Lc2Hc市场需求:12PaQQqq=−=+进一步假设:1222;351,,;4412LHacccp=====企业2:2222221()()qPcqacqqπ=⋅−=⋅−−−•令则2act−=2221()qtqqπ⋅−−=222110,1()()2qqqttqπ∂=∂=−由得:,企业2的反应函数•不仅与企业1的产量有关,而且与自己的成本有关。2q22212221,15()24,13()24LLHHccqqccqq==−==−时时企业1:企业1不知道企业2的真实成本,因而也不知道企业2的最优反应是企业将选择使期望利润最大化的产量。22LHqq还是111121112112112()(1)()11(1)(1)22LHLHEpqacqqpqacqqqqqqqqπ=⋅⋅−−−+−⋅⋅−−−=⋅−−+⋅−−由最优化一阶条件得:即企业1的反应函数。12222111(1)2221(1(1))2LHLHqqqpqpq=−−=−⋅−−⋅•联立求解两个反应函数,得贝叶斯Nash均衡为:*12213115,2424LHqqq===2暗标拍卖(一级密封拍卖)•假设1:只有两个参加投标的人,他们对标的的估价分别为V1和v2,因此博弈方i用价格p拍得标的的得益为vi-p,•假设2:两个博弈方的估价V1和v2时相互独立的,且V1~U[0,1],V2~U[0,1],各博弈方知道自己的估价和另一博弈方估价的概率分布。•假设3:各博弈方都是风险中性的。•暗标拍卖的静态贝叶斯表示1)博弈方i的行为就是标价bi,行动空间2)博弈
本文标题:第10章-贝叶斯博弈与贝叶斯Nash均衡
链接地址:https://www.777doc.com/doc-4785510 .html