您好,欢迎访问三七文档
第七章不完全信息静态博弈贝叶斯纳什均衡典型不完全信息博弈不完全信息与混合策略机制设计第七章不完全信息静态博弈庄子与惠子游于濠梁之上。庄子曰:“儵鱼出游从容,是鱼之乐也。”惠子曰∶“子非鱼,安知鱼之乐?”庄子曰:“子非我,安知我不知鱼之乐?”惠子曰“我非子,固不知子矣;子固非鱼也,子之不知鱼之乐,全矣!”庄子曰:“请循其本。子曰‘汝安知鱼乐’云者,既已知吾知之而问我。我知之濠上也。”第一节静态贝叶斯博弈和贝叶斯纳什均衡第一节静态贝叶斯博弈和贝叶斯纳什均衡市场进入博弈模型:有一市场已经为某企业A所占有,现在有一潜在的企业B也想进入这一市场,但企业B不知道企业A的成本函数,以及当自己决定进入市场后企业A的反击策略选择。假定企业A有高成本和低成本阻止进入两种成本函数,且对应两种成本情况的不同策略组合的得益如下所示:市场进入博弈模型:厂商A高成本(p)低成本(1-p)厂商B默许斗争默许斗争进入3040-1002070-1080不进入0200020003000300第一节静态贝叶斯博弈和贝叶斯纳什均衡市场进入博弈模型:给定厂商A是高成本,当厂商B进入时,厂商A的最佳策略是默许;厂商A是低成本,厂商B进入时,厂商A的最佳策略是斗争。假定厂商B认为厂商A是高成本的概率是p,低成本的概率是1-p。在厂商B选择进入的期望得益是p×30+(1-p)×(-10)=40p-10,选择不进入的期望得益是0。当p0.25时,厂商B的最优策略是“不进入”,当p0.25时,厂商B的最优策略是“进入”。第一节静态贝叶斯博弈和贝叶斯纳什均衡暗标拍卖:暗标拍卖有这几个特征:(1)密封递交标书;(2)统一时间公证开标;(3)标价最高者以所报标价中标。假设,拍卖和投标本身没有成本。则中标者的得益是他对拍卖标的的估计与成交价(即投标价)的差额,未中标博弈方的得益则为0。第一节静态贝叶斯博弈和贝叶斯纳什均衡暗标拍卖:由于各投标方不知道其他博弈方的策略选择(即价格选择),是一次性静态博弈。同时各博弈方不知道其他博弈方对标的物的估计。由于人们在认识、立场和判断能力上的差异,所以对同一标的物的估价也往往有差距,每个局中人的估价是自己的私人信息。所以,在暗标拍卖中,各个博弈方对其他博弈方拍得标的的得益无法确知,只能根据一般情况或以往经验作出大致的判断。因此,暗标拍卖是不完全信息静态博弈。第一节静态贝叶斯博弈和贝叶斯纳什均衡我们用G={S1,…,Sn;u1,…,un}表示完全信息静态博弈,其中Si是博弈方i的策略集(或策略空间,ui是博弈方的得益函数,ui=ui(s1,…,sn)。为了准确表达静态贝叶斯博弈,我们对G={S1,…,Sn;u1,…,un}做如下扩展:第一节静态贝叶斯博弈和贝叶斯纳什均衡用ai表示局中人i的策略,Ai表示局中人i的策略集(或策略空间)即ai∈Ai;用ti表示局中人i的类型,ti∈Ti;用pi=p{t-i|ti}表示博弈方i在自己的实际类型下对其他博弈方类型组合t-i的概率判断;用ui表示各局中人的得益函数。G={A1,…,An;T1,…,Tn;p1,…,pn;u1,…,un}第一节静态贝叶斯博弈和贝叶斯纳什均衡海萨尼(Harsanyi)转换1.引进一个虚拟的“自然”博弈方,也可以称为“博弈方0”,其作用是在博弈中进行实际博弈的博弈方选择之前,为每个实际博弈方按随机方式进行选择,或者说抽取他们各自的类型,抽取的这些类型构成类型向量t=(t1,…,tn),其中ti∈Ti;2.这个“自然”博弈方让每个实际博弈方知道自己的类型,但不让(全部或部分)博弈方知道其他博弈方的类型;3.在前述基础上,在进行原来的静态博弈,即每个实际博弈方同时从各自的策略空间中选择行动方案a1,…,an;4.除了“自然博弈方”外,每个博弈方各自取得得益ui=ui(a1,…,an,ti)。第一节静态贝叶斯博弈和贝叶斯纳什均衡海萨尼(Harsanyi)转换NB高成本(p)进入低成本(1-p)(0,200)(30,40)斗争不进入不进入BA(20,70)默许A默许斗争(-10,0)(-10,80)(0,200)进入第一节静态贝叶斯博弈和贝叶斯纳什均衡1994年度经济学诺奖得主---海萨尼约翰·海萨尼(JohnC·Harsanyi,1920-)美国人,由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,由此获得诺贝尔经济奖。贝叶斯纳什均衡在不完全信息静态博弈中G={A1,…,An;T1,…,Tn;p1,…,pn;u1,…,un}中,博弈方i的一个策略,就是自己各种可能类型ti(ti∈Ti)的一个函数Si(ti)。Si(ti)设定对于“自然”可能为博弈方i抽取的各种类型ti,博弈方i将从自己的行为空间Ai中相应选择的行动ai。第一节静态贝叶斯博弈和贝叶斯纳什均衡贝叶斯纳什均衡在不完全信息静态博弈中G={A1,…,An;T1,…,Tn;p1,…,pn;u1,…,un}中,如果对任意博弈方i和他的每一种可能的类型ti∈Ti,Si*(ti)所选择的行动ai都能满足:则称博弈的策略组合S*=(S1*,…,Sn*)为G的一个(纯策略)贝叶斯纳什均衡。****111111max[(),...,(),,(),...,(),](|)iiiiiiiiinniiiaAtuStStaStSttptt第一节静态贝叶斯博弈和贝叶斯纳什均衡第二节典型不完全信息静态博弈不完全信息的古诺模型两寡头进行同时决策的产量竞争,市场需求为P(Q)=a-Q。厂商1的成本函数为C1=C1(q1)=c1q1,两个厂商都知道。厂商2的成本函数有两种可能,一种是C2=C2(q2)=cHq2,另一种是C2=C2(q2)=cLq2,cHcL,即边际成本有高低两种情况,厂商2知道自己实际是哪一种,厂商1只知道前一种的概率为θ,后一种情况的概率是1-θ。第二节典型不完全信息静态博弈不完全信息的古诺模型设厂商1的最佳产量为q1*;厂商2在边际成本为cH时会选择最佳产量q2*(cH),在边际成本为cL时会选择最佳产量q2*(cL)。则q2*(cH)应满足:q2*(cL)应满足:q1*应满足:1**12111211max{[(()](1)[(()]}HLqaqqccqaqqccq2*122max[()]Hqaqqcq2*122max[()]Lqaqqcq第二节典型不完全信息静态博弈不完全信息的古诺模型求极值,分别求导,得:***21211[()](1)[()]2HLaqccaqccq**12()2HHaqcqc**12()2LLaqcqc第二节典型不完全信息静态博弈不完全信息的古诺模型求解以上方程组,得:*112(1)3HLacccq*122(1)()()36HHLHaccccqc*122()()36LHLLaccccqc第二节典型不完全信息静态博弈不完全信息的古诺模型设:c1=2,cH=3,cL=1则:q1=2q2(cH)=1.5q2(cL)=2.83q2q133660(2,2)第二节典型不完全信息静态博弈暗标拍卖两个风险中性博弈方,对拍品标的的估价分别是v1和v2,假设v1和v2是独立的,且在[0,1]上平均分布,各博弈方都知道自己估价和对方估价的概率分布。博弈方i的行为就是他的标价bi,行为空间Ai=[0,+∞),但考虑到bi1,则行为空间为[0,1]。博弈方i的类型就是他的估价vi,类型空间Ti=[0,1]。博弈方的实际类型只有他自己知道,另一方知道vi在[0,1]上平均分布。第二节典型不完全信息静态博弈暗标拍卖则得益函数如下:vi-bi当bibj时ui=ui(bi,b2,v1,v2)=(vi-bi)/2当bi=bj时0当bibj时式中i=1时,j=2;当i=2时,j=1第二节典型不完全信息静态博弈暗标拍卖如果策略组合(b1,b2)是一个贝叶斯纳什均衡,那么其策略必须是针对对方的最佳反应,应满足:1max[(){}(){}]2iiiijiiijbvbPbbvbPbb第二节典型不完全信息静态博弈暗标拍卖假设博弈方的策略是风险中性,标价符合线性函数:bi=civi,其中,ci≥0。有:式中P{bi=bj}=0,上式等于:])[(max}]{)[(max}]{)[(max}]{)(21}{)[(max211112121112211112111221111cbbvcbvPbvvcbPbvbbPbvvcbPbvbbbb第二节典型不完全信息静态博弈暗标拍卖第三节不完全信息与混合策略均衡在完全信息静态博弈中,混合策略解决了完全信息静态博弈中不存在纯策略纳什均衡的问题。海萨尼1973年证明,完全信息情况下的混合策略均衡,可以解释为不完全信息情况下纯策略均衡的极限。也就是说,完全信息静态博弈中的混合策略纳什均衡,几乎总是可以被解释为一个有些许不完全信息的静态贝叶斯博弈的一个纯策略贝叶斯纳什均衡。第三节不完全信息与混合策略均衡根据海萨尼的结论,我们进一步认为一个混合策略纳什均衡的根本特征不是博弈方以随机的方法选择策略,而是在于各博弈方不能确定其他博弈方将选择什么战略。这种不确定行可能是由于随机性引起的,也可能是由于信息的不完全性,即博弈方不知道其他博弈方的得益类型引起的。第三节不完全信息与混合策略均衡选修课博弈乙甲法语q德语1-q法语p3+t1211德语1-p0023+t2第三节不完全信息与混合策略均衡选修课博弈双方类型空间即t1和t2,都属于类型空间T1和T2,且都是连续空间[0,x]。双方对对方类型的判断都是[0,x]的标准概率分布。我们来求解该不完全信息条件下选修课博弈的一个纯策略贝叶斯纳什均衡。第三节不完全信息与混合策略均衡选修课博弈设甲采取如下策略:当t1超过某一临界值w时,即t1w时,选择法语,否则选择德语;同理乙采取如下策略:当t2超过某个临界值h,即t2h时,选择德语,否则选择法语。由于t1和t2都是[0,x]上的标准分布,所以甲选择法语的概率是(x-w)/x,选择德语的概率是w/x;乙选择法语的概率是h/x,选择德语的概率是(x-h)/x。第三节不完全信息与混合策略均衡选修课博弈假设乙已经采取了上述策略,则甲选择法语的期望得益是:EU甲(法语)=(3+t1)(h/x)+1·(x-h)/x=(2h+t1h+x)/xEU甲(德语)=0·(h/x)+2·(x-h)/x=2·(x-h)/x当EU甲(法语)EU甲(德语)时,即t1x/h-4,可得w=x/h-4。第三节不完全信息与混合策略均衡选修课博弈同理,假设甲采取上述策略,则乙选择得益的期望得益是:EU乙(德语)=(3+t2)(w/x)+1·(x-w)/x=(2w+t2w+x)/xEU乙(法语)=0·(w/x)+2·(x-w)/x=2·(x-w)/x当EU乙(德语)EU乙(法语)时,即t2x/w-4,可得h=x/w-4。第三节不完全信息与混合策略均衡选修课博弈w=x/h-4h=x/w-4得则甲选择法语的概率是乙选择法语的概率是当x→0时,甲选择法语的概率是1-1/4=3/4.乙选择法语的概率是1/4.xhw42xxxwxwx4211xxxh42第三节不完全信息与混合策略均衡选修课博弈表明纯策略贝叶斯纳什均衡收敛为一个完全信息博弈的混合纳什均衡,所以,海萨尼认为完全信息静态博弈的混合策略均衡是不完全信息静态博弈的极限。第三节不完全信息与混合策略均衡抓钱博弈假设ti在[-ε,+ε]区间上均匀分布。考虑如下策略选择:(1)甲:如果t1≥t1*,选择“抓”,选择抓的概率是:如果t1t1*,选择“不抓”;(2)乙:如果t2≥t2*,选择“抓”,选择抓的概率是:如果t2t2*,选择“不抓”。乙甲抓不抓抓-1-11+t10不抓01+t20021*1t21*2t第三节不完全信息与混合策略均衡抓钱博弈给定乙的策略,甲选择
本文标题:博弈论(第七章)
链接地址:https://www.777doc.com/doc-3866549 .html