您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 能源与动力工程 > 北京工业大学选修《博弈论及其在管理中的应用》概念与模型(21个)
1本科生《博弈论及其在管理中的应用》概念与模型-答案1.叙述由两个人且策略集合为两个元素组成博弈的纳什均衡的定义。(20分)纳什均衡定义:用2121,;,uuSSG表示一个2人博弈,其中iS表示第i博弈方的战略集合,iu表示第i博弈方的得益函数,2,1i。(5分)如果由各个博弈方的各一个战略组成的某个战略组合),(*2*1ss中,任一博弈方i的策略*is,都是对其余博弈方策略组合*js,ij,2,1,ji,的最佳对策,(10分)也即),(),(*211*2*11ssussu对任意11Ss都成立,且),(),(2*12*2*12ssussu对任意22Ss都成立。则称),(*2*1ss为博弈G的一个“纳什均衡”。(20分)2.两人博弈:甲乙两人博弈,甲有U和D两种策略,乙有L和R两种策略,(1)若甲采取U策略,乙采取L策略,则甲乙得益分别为a和b,记为:(a,b);(2)若甲采取U策略,乙采取R策略,则甲乙得益分别为c和d,记为:(c,d);(3)若甲采取D策略,乙采取L策略,则甲乙得益分别为e和f,记为:(e,f);(4)若甲采取D策略,乙采取R策略,则甲乙得益分别为g和h,记为:(g,h)。问:(i)(U,L)和(D,R)为纯策略纳什均衡的条件是什么?(ii)在(i)的条件下求该问题的混合策略纳什均衡。(20分)解:两人博弈的得益矩阵如表1所示。表1两人博弈的得益矩阵LRU(a,b)(c,d)D(e,f)(g,h)根据纯战略纳什均衡的定义可知,(i)(U,L)和(D,R)为纯策略纳什均衡的条件是ea,cg,db和fh;(1)(5分)(ii)记甲以概率选择U,以概率1选D,乙以概率选择L,以概率1选R,其中10,10。记,1和,2分别表示甲和乙的期望收益,则])1()[1(])1([,1geca])1()[1(])1([,2hdfb(10分)甲乙2记**,为纳什均衡,则根据纳什均衡定义,得0])1([)1(,1geca0])1([)1(,2hdfbdbfhfh*eacgcg*(18分)混合策略纳什均衡是:甲以概率dbfhfh选择U,以概率dbfhdb选D,乙以概率eacgcg选择L,以概率eacgea选R。(20分)3.智猪博弈(BoxedPigsGame)(20分)假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临两个策略的选择:自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择,它必须付出如下代价:第一,它需要消耗相当于2个单位的成本;第二,由于猪食槽远离按钮,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪将吃到6个单位的猪食,小猪吃到4个单位的猪食;若两头猪同时按按钮,大猪吃到7个单位的猪食,小猪吃到3个单位的猪食;若两头猪同时到(两头猪都选择等待),则两头猪都吃不到猪食。如表4-6所示,对应不同战略组合的支付水平,如两头猪同时按按钮,同时到达猪食槽,大猪吃到7个单位的猪食,小猪吃到3个单位的猪食,扣除2个单位的成本,支付水平分别为5和1。其他情形可以类推。问题:两头猪如何选择各自的最优战略?该模型的得益矩阵如下表4-6所示。无论大猪选择按按钮或等待,小猪选择按按钮都比等待差,这样的战略称为小猪的一个“严格劣战略”,我们首先加以剔除。在剔除小猪按按钮这一选择后的新博弈中,小猪只有等待一个选择,而大猪则有两个可供选择的战略。表2智猪博弈得益矩阵按按钮等待按按钮(5,1)(4,4)等待(9,-1)(0,0)解:在大猪这两个可供选择的战略中,选择等待对大猪是一个严格劣战略,我们小猪大猪3再剔除新博弈中大猪的严格劣策略(等待)。剩下的新博弈中只有小猪等待、大猪按按钮这一个可供选择的战略,即(按按钮,等待)是智猪博弈的最优均衡解,称为“重复剔除的占优战略均衡”。根据纳什均衡定义,它也是纳什均衡。(20分)表3猜硬币博弈得益矩阵4.猜硬币博弈设博弈方1出正面和反面的概率分别为x和1-x,博弈方2猜正面和反面的概率分别为y和1-y,那么博弈方1出正面和反面的概率x和1-x,一定要使博弈方2猜正面的期望得益和猜反面的期望得益相等,即解得,(18分)博弈方1的混合策略:以概率分别出正面和反面。博弈方2的混合策略:以概率分别猜正面和反面。(20分)5.两人定和博弈(Constant-SumGame)表4:两人定和博弈假设2号选择C的可能性为p,选择D的可能性为1-p,并且1号选择A的可能性为q,选择B的可能性为1-q。如果在给定2号的概率p和1-p之后,A和B两个选项所代表的抽彩对于1号选手来说并非等优,那么1号就应该确定地选择A和B中的一个选项。也就是说,当且仅当选A的预期价值与选B的预期值相等时(这些预期值由2号选定的策略决定),1号才会在A和B之间保持q和1-q的概率。对于图2所示的博弈,2号选手的方程是4p+1(1-p)=p+3(1-p),所以p=1/4。我们的1号选手也是一样---他只有在2号在选C和选D之间没有偏向时才会愿意给A和B一定的权重,所以q+4(1-q)=3q+2(1-q),即q=1/2。(20分)猜硬币方盖硬币方-1,11,-11,-1-1,1正面反面正面反面3,23,21,42,32,34,1ABCD46.存在优势策略的两人零和博弈(Zero-SumGame)表5:存在优势策略的两人零和博弈CDA(4,1)(3,2)B(2,3)(1,4)(A,D)是纳什均衡。(20分)7.存在纳什均衡(NashEquilibrium)的定和博弈表6:存在纳什均衡的定和博弈DEFA(8,1)(3,6)(1,8)B(7,2)(5,4)(6,3)C(2,7)(4,5)(9,0)解:如果乙选D,那么甲最好选A;如果乙选择E,那么甲最好选B;如果乙选择F,那么甲最好选C。如果甲选A,那么乙最好选F;如果甲选择B,那么乙最好选E;如果甲选择C,那么乙最好选D。一旦两人进入(B,E)这个状态,他们谁都不想单方面地选择其他行动。(B,E)是该博弈唯一的纳什均衡。(20分)8.鹰-鸽(Hawk-Dove)博弈(20分)(1)参与人:争食的两只动物-动物1和动物2。动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽},i=1,2支付矩阵如下:表7:存在纳什均衡(NashEquilibrium)的定和博弈鹰鸽鹰(0,0)(4,1)鸽(1,4)(3,3)(2)此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。解:两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布,即:1125首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么由4(1-q)=q+3(1-q)得q*=50%;其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么由4(1-a)=a+3(1-a)得a*=50%。(3)此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。(20分)9.狩猎博弈(20分)参与人是两个猎人,他们的行动是同时选择猎鹿或者猎兔。规则是:若两人同时猎鹿,则鹿被猎到且两人平均分配鹿的价值(10元);若两人同时猎兔,则每人各获得价值1元的兔;若一人猎兔而另一人猎鹿则兔被抓到但鹿跑掉。该博弈的得益矩阵见表8所示:表8:狩猎博弈鹿兔鹿(5,5)(0,1)兔(1,0)(1,1)解:此博弈同样是一个完全信息静态博弈,参与人是两个猎人,他们的行动是选择猎鹿或者猎兔。该博弈纯策略纳什均衡为(鹿,鹿)和(兔,兔)。(5分)下面求混合策略纳什均衡,假设猎人1以概率选择猎鹿,以概率1选择猎兔,猎人2以概率选择猎鹿,以概率1选择猎兔,则猎人1的得益为]10)[1(]15[),(1(1)猎人2的得益为]10)[1(]15[),(2(2)(12分)根据(1)和(2),可得15),(,15),(21(16分)解得最优解51**(18分)混合策略纳什均衡是:两个猎人均以51概率选择猎鹿,以54概率选择猎兔。(20分)610.库诺特寡头竞争模型(20分)○1某一市场上有n家企业,他们生产同一类产品用来满足该市场上顾客的需求;○2n家企业生产相同质量的产品;○3用iq代表企业i的生产批量,ni,,2,1,niiqQ1表示市场上总产品数,)(QVP代表逆需求函数(P是市场出清价格,即n家企业生产的产品能全部销售),两企业的生产都无固定成本,企业i的成本函数记为)(iiqC,ni,,2,1;○4n家企业同时决策各自产品的生产批量;○5n家企业对彼此的生产成本相互了解(完全信息)。假设iiiiqcqC)(,ni,,2,1,)(1niiqaQV,其中0a为常数。问题:(i)这n家企业如何决定各自产品的生产批量?(ii)假设ccccn21,证明企业i的最优生产批量*iq和最优利润*i是市场上企业数n的单调递减函数。解:(i)企业i的最优生产批量为1,1*ncncaqnijjjii,ni,,2,1(1)(ii)企业i的最优利润为22,1*)1()(ncncanijjjii,ni,,2,1(2)(ii)n家企业各自决策的最优生产批量之和111**ncnaqQniinii(3)(iv)企业i的最优利润*i是其边际成本ic的单调递减函数,是竞争对手边际成本jc)(ij的单调递增函数。(v)假设ccccn21,则企业i的最优生产批量*iq是市场上企业数n的单调递减函数,企业i的最优利润*i是市场上企业数n的单调递减函数。(20分)711.产量决策模型(20分)○1某一市场上有3家企业,他们生产同一类产品用来满足该市场上顾客的需求;○23家企业生产相同质量的产品;○3用iq代表企业i的生产批量,3,2,1i,31iiqQ表示市场上总产品数,)(QVP代表逆需求函数(P是市场出清价格,即3家企业生产的产品能全部销售)。假设3家企业的生产都无固定成本,企业i的成本函数iiiqcqC)(,3,2,1i,2)(bQaQV,0a,0b;○43家企业同时决策各自产品的生产批量;○53家企业对彼此的生产成本相互了解(完全信息)。问题:(i)这3家企业如何决定各自产品的生产批量?他们获得的利润分别是多少?(ii)如果这3家企业合并成一家企业,则合并后企业如何决定产品的生产批量?合并后企业获得的利润是多少?(iii)试对这3家企业合并前后两种情形下的生产批量和利润进行比较,比较结果给人们什么样的启示?解:(i)企业i的利润函数为:iiiqcqqqbaqqqq])([),,(2321321,3,2,1i(4)(2)两边对iq分别求一阶和二阶偏导数,3,2,1i,得3,2,1,)()(22321321iqqqbqqqbqcaqiii(5)3,2,1,0])(2[232122iqqqqbqiii(6)企业i的最优
本文标题:北京工业大学选修《博弈论及其在管理中的应用》概念与模型(21个)
链接地址:https://www.777doc.com/doc-4695229 .html