您好,欢迎访问三七文档
第十一章博弈模型11.1进攻与撤退的抉择11.2让报童订购更多的报纸11.3“一口价”的战略11.4不患寡而患不均11.5效益的合理分配11.6加权投票中权力的度量单一决策主体决策变量目标函数约束条件决策主体的决策行为发生直接相互作用(相互影响)博弈模型非合作博弈合作博弈三要素博弈模型(GameTheory)多个决策主体优化模型(Optimization)决策问题(DecisionProblem)静态、动态信息完全、不完全军事、政治、经济、企业管理和社会科学中应用广泛•1944年6月初,盟军在诺曼底登陆成功.•到8月初的形势:背景11.1进攻与撤退的抉择双方应该如何决策?强化缺口盟军(预备队)撤退进攻德军盟军(加)盟军(英)盟军(美一)盟军(美三)东进原地待命背景北西南东模型假设•博弈参与者为两方(盟军和德军)•盟军有3种使用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退.•博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多.盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军完全信息静态博弈•共同知识(以上信息双方共有)•双方同时做出决策两场战斗:1.德军向西进攻盟军缺口2.盟军围攻盟军博弈模型•博弈参与者集合N={1,2}(1为盟军,2为德军)•用u1(a1,a2)表示对盟军产生的结果,即净胜场次,称为盟军的效用函数.盟军胜1场盟军败2场东进无战斗盟军胜2场原地待命无战斗盟军胜1场强化缺口向东撤退向西进攻盟军德军120201}{23ijmM•盟军行动a1A1={1,2,3}(强化缺口/原地待命/东进);德军行动a2A2={1,2}(进攻/撤退).(行动:即纯战略)支付矩阵(PayoffMatrix)完全竞争:零和博弈(常数和博弈)u2(a1,a2)对应–M博弈的解的概念:纳什均衡(NE:NashEquilibrium)JohnNash:1994年获诺贝尔经济学奖2015年5月24日,约翰·纳什夫妇遇车祸,在美国新泽西州逝世。不存在(纯)NE}.2,1{),,(),(},3,2,1{),,(),(22*12*2*121*211*2*11aaauaauaaauaau(纯战略)纳什均衡NE:单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的,称为最优反应.120201}{23ijmM(纯)NE:a*=(a1*,a2*)=(2,2)1,12,21,22,21,11,1'M非常数和博弈(双矩阵表示)得分矩阵混合战略(策略:Strategy)盟军的混合战略集期望收益•盟军•德军S1={p=(p1,p2,p3)|}311,10iiipp德军的混合战略集S2={q=(q1,q2)|}211,10iiiqqTSppMq1maxTSqpMq2min完全信息静态博弈有限博弈矩阵博弈(2人)零和博弈常数和博弈),(),(),(1231211qpUqpUqmppMqqpUijjijiT模型求解理性推理:不管自己怎么做,另一方总是希望使自己得分尽量低.(二人零和博弈,完全竞争)•盟军•德军TSppMq1maxTSqpMq2min线性规划从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!盟军可以用minpM来衡量策略p的好坏maxU1(p)=minpMminU2(q)=maxMqT德军可以用maxMqT来衡量策略q的好坏(p*,q*):混合(策略)纳什均衡(MixedNE)p2*=3/5,p3*=2/5q1*=1/5,q2*=4/5最优值均为2/5•占优(dominate):盟军的行动2占优于1(前面的非常数和博弈M’类似)•混合策略似乎不太可行!但概率可作为参考.----现实:盟军让预备队原地待命(行动2),而德军没有选择撤退(行动2),结果德军大败.模型评述•博弈规则至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等.110100M•多人(或非常数和)博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解.小结:博弈模型的基本要素•参与人理性假设•行动顺序(静态、动态)•信息结构(完全、不完全)•行动空间(及战略空间)•效用函数参与者完全理性(最大化效用)其他因素纳什均衡单向改变战略不能提高自己效用11.2让报童订购更多的报纸报童模型回顾订购价w,零售价p,处理价v(pwv0)需求量:密度函数f(x)、分布函数F(x),F(0)=0订购Q份报纸,期望销售量为QQQQQdxxFQQFQdxxFxxFdxxQfdxxxfQS0000)())(1()(|)()()()(期望存货量QdxxFQSQQI0)()()(期望利润QvwQSvpwQQvIQpSQG)()()()()()(最优订购量QrvpwpQFr)(Qr(w)问题假设报社报纸成本价为c,w≥cv)()(MaxwQcwrcwvpwpFcw1)(w*完全信息动态博弈:常称StackelbergGame(两阶段)子博弈完美均衡:(w*,Qr(w))vpcpQF)(*一般w*cQr(w*)Q*整体利润有损失能否改善(协调)?假设报社与报童联合,整体利润最大vpwpQFr)(价格折扣协议模型折扣方案wd(Q)下,报童效用(期望利润)达到协调假设报社与报童联合,整体期望利润QvQwQSvpQwUddr))(()()())((QvcQSvpQUrs)()()()()())((QUQwUrsdr10]/)()()[1()(QQSvpvcQwd关于Q的减函数(非线性)λ↑,报童利润↑,报社利润↓利润的任意分配比例都可达到模型一回收价格协议原订货量达到协调整体最优b↑,报童利润↓,报社利润↑利润的任意分配比例都可达到bpwpQFr)(vpwpQFr)(vpcpQF)(*回收价b(pwbv)bpwpvpcp)()(bpvpvcbbwwb)]()([)()]()([)()()()()()(**bUbUvpvbbUbUbUvpbpbUQvcQSvpbUbUsrssrrsr回收协议模型模型二回收数量协议报社回收达到协调报童回收α↑,报童利润↓,报社利润↑;利润任意分配都可达到按批发价回收,比例为α(1)10(1)(1)()()d()()d()dQQQQQIQQfxxQxfxxFxx(1)210()()()()dQIQIQIQFxx报童利润12(1)(1)0(,,)()()()()()d()()drQQQUwQpSQwIQvIQwQpwQFxxpvFxx0),,(rQrQQwU0))1(()1)(()](1)[(rrQFvwQFwpvpcpQF)(*))1(()1)(()]/()(1)[(*QFvwvpcpwp))1(()1)(()())(()(*QFvpvcvcvpvwwq回收协议模型模型评述•协议参数的确定:不能单方决定双方谈判(合作博弈)•还有很多其他类型的协议,也可以达到协调•一种更简单的协议批发价w=成本c收取一定加盟费•如何评价/比较协议的优缺点?-是否能达到协调-是否能任意分配利润-协议执行成本有多高11.3“一口价”的战略背景•为了节省“讨价还价”时间,考虑“一口价”模式.•双方同时报价:若买价≥卖价,则以均价成交;否则不成交.问题•双方应如何报价?•双方总能成交吗?(效率估计)•“讨价还价”很浪费买卖双方的宝贵时间.模型假设与建立•卖方知道物品对自己的价值,但买方不知道.•买方知道物品对自己的价值,但卖方不知道.•双方都知道(如猜出)对方价值的分布信息.卖方价值vs,买方价值vb,均服从[0,1]上的均匀分布卖方报价ps,买方报价pb,pb≥ps时成交价p=(pb+ps)/2成交效用:卖方U1=p-vs,买方U2=vb–p;不成交:0双方完全理性(最大化自己的期望效用).以上为双方的共同知识.卖方报价ps=ps(vs)买方报价pb=pb(vb)双方战略战略组合(ps(vs),pb(vb))何时构成均衡?定义在[0,1]区间上、取值也在[0,1]区间上的非减函数.不完全信息静态博弈(静态贝叶斯博弈)贝叶斯纳什均衡单向改变战略不能提高自己效用.信息非对称(不完全信息)模型假设与建立均衡条件具体战略(函数)形式不同,均衡就可能不同.单一价格战略卖方:买方:双方战略互为最优反应,所以构成贝叶斯纳什均衡!})(Pr{*2])(|)([maxsbbssbbbbsppvpvpvpvpEps)}(Pr{*2)](|)([maxssbssbssbbpvppvppvpEpvbxvxvxvpssss,1,)(xvxvxvpbbbb,0,)(模型假设与建立单一价格战略效率为x=0.5效率最大(3/4)对给定的(vs,vb),当vsvb时称交易是有利的;交易给双方带来的效用之和(即vb–vs)称为交易价值.给定战略组合,能够实际发生的交易的期望价值与有利的全部交易的期望价值的比值称为该战略的交易效率.vbvb=vsO11xxvs交易单一价格战略4/3)1(3)()(10010xxdvdvvvdvdvvvbvbssbxxbssb线性价格战略卖方报价ps(vs)=as+csvs;买方报价pb(vb)=ab+cbvb.双方战略互为最优反应,构成贝叶斯纳什均衡!买方:买方:(同理)ssbbsbbpcappapvb/)(22/)(max)}(Pr{*2)](|)([maxssbssbssbbpvppvppvpEpvb],[sssbcaap当sbbavp3132)(3132bbsscavp32,41,121sbsbccaa4132)(sssvvp12132)(bbbvvpvb,vs1pb(vb)ps(vs)3/43/41/4pb,psO11/4],[sssbcaap当不成立时也适用(不唯一)线性价格战略评述效率(线性价格战略)效率为可以证明,线性均衡效率最大.不存在使所有有利的交易都成交的均衡战略组合.信息的不完全(非对称信息)降低了交易效率.1/4vb=vs+1/4vbvb=vsO11vs交易包含了交易价值(即vb–vs)大于1/4的所有有效交易.4/332/27)()(100104141bbvbssbvbssbdvdvvvdvdvvv11.4不患寡而患不均最后通牒博弈(UltimatumGame)问题•甲乙两人就分配1笔钱(如100元)进行博弈.•甲首先提出分配方案(分给乙的钱:s).•现实中的情况果真如此吗?•多数s=总额的40~50%•s越小,越容易被乙拒绝•完全信息动态博弈:均衡结果是(s=0,乙接受);如果要求严格均衡,则s=1分钱.•如果乙接受,则按此分配;否则双方什么也得不到.公平:利他/互惠?自私:理性/非理性?模型假设与建立1.每个参与者都喜欢对所有参与者公平的结果;2.每个参与者自己受到不公平对待时的“愤怒”,胜过其他参与者受到不公平对待时的“愧疚”.否则,xixj=1-xi时,Ui(x)=xi-βi(xi-xj)=βi-(2βi-1)xi关于xi的系数非正(过分“愧疚”)效用函数财富总额为1接受提议:甲乙所得x1=1-s,x2=s;否则:x1=x2=0ijixxxxxxxUjiiijiii
本文标题:第十一章博弈模型
链接地址:https://www.777doc.com/doc-7750224 .html