您好,欢迎访问三七文档
《博弈论与信息经济学》第一次作业1.(利维坦)假设两个博弈参与人生活在“丛林法则”之下,每一个参与人都可以选择“战争”与“和平”并且其支付矩阵如下所示:(1)请问,这个博弈类似于我们遇到过的哪类博弈?(2)什么是这个博弈的纳什均衡,它是帕累托最优的吗?出于对“战争”状况下人民福祉的忧虑,霍布斯建议采用“利维坦”来终结战争状态,即“把大家所有的权利和力量托付给某一个人或一个能通过多数人的意见把大家的意志化为一个意志的多人组成的集体”。由于“利维坦”拥有惩罚“战争”的力量,因此可以协调人们走出“战争”,迎来“和平”。我们假设,如果在上述博弈中,参与人们通过契约建立了“利维坦”,如果某人发动“战争”,“利维坦”会对其施加惩罚,且惩罚力度为𝑃(𝑃0)。因此,博弈变成了如下形式:(3)请问𝑃需要怎样取值,才能让人们走出“战争”状态?参考答案:(1)囚徒困境(2)(战争,战争)是唯一的纳什均衡,不是帕累托最优的(3)需要选择𝑃使得战争不再是严格占优策略,即3≥4−𝑃,或𝑃≥12.博弈参与人甲和乙同时选择自己的策略,并且其支付状况如以下矩阵所示:(1)对于每一个参与人而言,是否存在占优策略或被占优策略?(2)假设参与人乙认定甲总会用最优反应来应对自己的策略。那么他有可能会选择策略𝑚吗?(3)本博弈中有几个纯策略纳什均衡,有几个混合策略纳什均衡?参考答案:(1)对于参与人甲,纯策略𝑀被混合策略0.5𝑈+0.5𝐷严格占优(2)由上一问,参与人甲的𝑀策略可以被删除,此时参与人乙的策略𝑚会被混合策略0.5𝑙+0.5𝑛严格占优,因此不会选𝑚(3)在删掉𝑀和𝑚后,博弈变为乙ln甲U4,69,1D9,14,6该博弈不存在纯策略纳什均衡,混合策略纳什均衡,假设甲选择𝑈的概率为𝑝,乙选择𝑙的概率为𝑞,根据无差异条件:甲:4𝑞+9(1−𝑞)=9𝑞+4(1−𝑞)得到𝑞=0.5乙:6𝑝+(1−𝑝)=𝑝+6(1−𝑝)得到𝑝=0.5因此存在一个混合策略纳什均衡(0.5,0.5)3.(Hotelling模型)假定有一个城市,用一条长度为1的线段表示,消费者均匀地分布在这个线段上,消费者的总测度为1。厂商1和厂商2分别处于线段的𝑎和1−𝑏点,其中𝑎+𝑏≤1。厂商的边际成本为𝑐。每个消费者有一单位的产品需求,从消费者的位置移动到厂商需要耗费的成本为二次的,即距离𝑑给消费者带来的负效用为𝑡𝑑2。求解这个模型的纳什均衡。参考答案:给定厂商1和2的价格𝑝1,𝑝2,对于[0,1]上任意一点𝑥的消费者,其去厂商1和厂商2的支付分别为:𝑣−𝑝1−𝑡(𝑥−𝑎)2𝑣−𝑝2−𝑡(𝑥−1+𝑏)2若𝑥满足𝑣−𝑝1−𝑡(𝑥−𝑎)2≥𝑣−𝑝2−𝑡(𝑥−1+𝑏)2,或𝑥≤1+𝑎−𝑏2+𝑝2−𝑝12𝑡(1−𝑎−𝑏),则消费者将去厂商1购买;反之若𝑥≥𝑎+1−𝑎−𝑏2+𝑝2−𝑝12𝑡(1−𝑎−𝑏),消费者将去厂商2购买。于是厂商1的最大化问题为:max𝑝1(𝑝1−𝑐)[1+𝑎−𝑏2+𝑝2−𝑝12𝑡(1−𝑎−𝑏)]一阶条件可以得到𝑝1=𝑝2+𝑐2+𝑡(1+𝑎−𝑏)(1−𝑎−𝑏)2。厂商2的最大化问题为:max𝑝2(𝑝2−𝑐)[1−1+𝑎−𝑏2−𝑝2−𝑝12𝑡(1−𝑎−𝑏)]一阶条件可以得到𝑝2=𝑝1+𝑐2+𝑡(1−𝑎+𝑏)(1−𝑎−𝑏)2。从而得到:𝑝1=𝑐+𝑡(1−𝑎−𝑏)(1+𝑎−𝑏3)𝑝2=𝑐+𝑡(1−𝑎−𝑏)(1+𝑏−𝑎3)4.(合伙人博弈)张三和李四合伙创业,他们可以分别选择自己的努力程度𝑥和𝑦,整个公司的利润是𝑥和𝑦的函数:𝑃=4(𝑥+𝑦+𝑐𝑥𝑦),其中𝑐∈(0,0.5)为参数。两人努力的成本是其努力程度的函数,张三的努力成本为𝑥2,李四的努力成本为𝑦2。由于两人都不能确切观察到对方的努力程度,因此不能订立完全契约。他们约定,在利润实现后将对其平分。(1)请问本博弈中两人的最优反应函数是什么?纳什均衡是什么?这个均衡是帕累托最优的吗?为什么?(2)在𝑐0的情况下重新讨论(1)中的问题,你的结论和(1)有什么不同?请给出直观的解释。参考答案:(1)张三、李四的最优化问题分别为max𝑥2(𝑥+𝑦+𝑐𝑥𝑦)−𝑥2,max𝑦2(𝑥+𝑦+𝑐𝑥𝑦)−𝑦2,由一阶条件得到最优反应函数:𝑥=1+𝑐𝑦2,𝑦=1+𝑐𝑥2,解出纳什均衡:𝑥∗=𝑦∗=12−𝑐帕累托最优:假设有一个社会计划者,最优化社会福利:max𝑥,𝑦𝜆1[2(𝑥+𝑦+𝑐𝑥𝑦)−𝑥2]+𝜆2[2(𝑥+𝑦+𝑐𝑥𝑦)−𝑥2]一阶条件得到:(𝜆1+𝜆2)(1+𝑐𝑦)=𝜆1𝑥,(𝜆1+𝜆2)(1+𝑐𝑥)=𝜆2𝑦,两式相加消去𝜆1,𝜆2便得到帕累托最优的条件:𝑥+𝑦=11−𝑐。这里纳什均衡𝑥∗+𝑦∗=22−𝑐=11−𝑐/211−𝑐,即当𝑐0的时候,社会个人由于没有完全考虑双方努力的正外部性带来的好处从而使得均衡努力小于社会最优。(2)当𝑐0时,𝑥∗+𝑦∗=22−𝑐=11−𝑐/211−𝑐,此时社会个人由于没有完全考虑双方努力负外部性带来的坏处从而使得均衡努力大于社会最优。5.(旅行者困境)在一次飞行过程中,由于飞机的颠簸,有两个古董被打碎。这两个古董完全相同,但分属于两个不同的旅客。机场经理需要赔偿两位旅客,但他并不知道这两个古董的价值。为此,他设计了如下赔偿方案:两位旅客各写下一个2到100数字(整数),以表示他们认为被打碎古董的价值。记两位旅客写下的数字分别为𝑛1和𝑛2,若𝑛1=𝑛2,两位旅客均得到𝑛1元的赔偿;若𝑛1𝑛2,则认为旅客2说实话,而旅客1在说谎,因此旅客1获得𝑛2−2,而旅客2获得𝑛2+2;反之,若𝑛1𝑛2,则旅客1获得𝑛1+2,旅客2获得𝑛1−2。请找出这个同时行动博弈的纳什均衡。注:如果对“旅行者困境”问题感兴趣,可以进一步阅读K.Basu,TheTraveler’sDilemma:ParadoxesofRationalityinGameTheory,AmericanEconomicReviewPapersandProceedings,Vol.84,No.2,pp.391-395。参考答案:对于参与人𝑖,最优反应函数为𝑛𝑖∗(𝑛𝑗)={𝑛𝑗−1𝑛𝑗2𝑛𝑗𝑛𝑗=2,因此选择100决不是一个最优反应,可以剔除,于是策略空间为2-99。类似地,也可以重复依次剔除99,98,…直到只剩下一个策略2。因此该博弈唯一的纳什均衡为𝑛1=𝑛2=2。6.(38个目击者)在美国的法制史上,有个被称为“38个目击者”的著名案例。1964年3月13日夜,在美国纽约郊外某公寓前,一位叫朱诺比的女子在回家途中遇刺。其间,尽管她大声求救,并且至少有38位目击者看到了犯罪经过或听到了呼救,但竟没有一人拨打电话。本题将通过一个博弈模型来对这个案例进行分析。假设朱诺比在街道上遭遇劫匪并大声呼救,周围至少有𝑛个目击者听到了呼救。当听到呼救后,目击者可以选择报警或漠视。如果选择报警,他需要支付的成本为𝑐。只要有一个人报警,朱诺比就会得救,所有目击者会因此而获得效用𝑣。这里假设𝑣𝑐,而如果没有人报警,则所有目击者都只能获得效用0。(1)当我们考虑所有目击者的同时行动的博弈时,这个博弈有纯策略纳什均衡吗?(2)这个博弈有对称的混合策略纳什均衡吗?如果有,请解出来。(3)请计算在混合策略均衡中,至少有一个人报警的概率,并回答这个概率如何随着𝑛变动。这个结果对你有什么启示?注:如果对38个目击者这个故事感兴趣,可以进一步阅读RosenthalA.,1964,Thirty-EightWitnesses,NewYork:McGraw-Hill。参考答案:(1)有n个纯策略均衡。在所有的纳什均衡中,只有一个目击者报警。对此可以证明如下:先证明,多于一人报警不构成Nash均衡。这是因为,当每一参与人决策时,如果其他参与人中已有一人报警,则其选择报警的话,得到支付为v-c,而如果选择不报警,则得支付v,显然其最优反应是不报警。再证明,仅有一人报警确实构成Nash均衡。这只需用定义证明就可以了。前面已经证明了如果其他人里有一个人报警,则最优反应是不报警,这里只需证明给定其他人都不报警是,最优反应是报警即可。这一点是直观的,如果其他人都不报警,则选择报警得到的支付是v-c,而不报警得到的支付是0,由于v-c0,因此报警是最优反应。这就证明了仅有一人报警确实构成Nash均衡。由于这样的情况一共有n个,因此有n个纯策略Nash均衡。(2)可以根据“选择任何纯策略得到的期望支付相等”这一事实求解。由对称性,假设所有人选择报警的概率都为p,不报警的概率为1-p。这样,对于每一个目击者,在其选择是否报警时,其他任何目击者都不报警的概率为(1-p)n-1,至少有一人报警的概率为1-(1-p)n-1。此时其选择报警,可得的期望支付为:v-c,不报警得到的期望支付为:(1-(1-p)n-1)v。令两者相等可得:v-c=(1-(1-p)n-1)v,从而可以解得:11)(1nvcp从而得到了一个混合策略均衡,每个目击者都以概率11)(1nvcp选择报警。(3)可以得到,此时没有人报警的概率是,因此至少有一个人报警的概率为:。容易知道,由于,因此当n增大时,这个概率不断减小。这一习题刻画了“集体行动的逻辑”。有时候,在一个组织中难以完成某些工作,是由于所有参与人都认为别人会完成。这种效应在更大的组织中更容易体现,因此大组织办事是困难的。社会心理学中的“冷漠”问题在很大程度上可以由这一观点来解释。7.(童工问题)在很多发展中国家都存在着严重的童工问题。尽管这些国家的政府大都出台了政策鼓励加强儿童教育,但在现实中,家长却通常宁愿让孩子打工而不愿意让他们上学。关于童工问题的解释很多,其中一种是将其视为一个“协调失灵”:由于教育回报率不仅取决于自身的教育水平,也同时取决于本地区居民的平均教育水平1,因此在初始教育水平更低的地区,家长就更容易让孩子去打工而不是去上学。这样,这些地区就会陷入一个“低教育水平陷阱”而不可自拔,童工问题也会持续泛滥。下面,我们通过一个简化的二人博弈来考虑这一问题。假设整个社区只有张三和李四两家人,他们可以各自考虑让自家的孩子接受什么程度的教育。在各种教育水平的组合下,两家人的支付如下表所示。李四家小学中学大学张三家小学1,11,-31,-5中学-3,-13,33,-1大学-5,1-1,35,5(1)请问,这个博弈中有多少纯策略纳什均衡?其中哪一个是帕累托最优的?(2)根据(1)的结论解释在什么时候,“低教育水平陷阱”将会出现。(3)现在你是政府的官员,你认为应采取怎样的政策引导张三和李四两家都愿意让孩子接受更多教育,达到帕累托最优的那个均衡?注:关于童工和儿童教育问题的一个更为严格的论述,见Basu,KandPhamHoang,V1998.TheEconomicsofChildLabor,AmericanEconomicReview,88(3),412-427。参考答案:(1)本博弈有三个纯策略纳什均衡:(小学,小学)、(中学,中学)及(大学,大学)。显然,(大学,大学)是帕累托最优的。(2)“低教育水平均衡”的出现源于初始的均衡点。在一些发展中国家,由于其起始的教育水平较低,因此任何一个家庭都会发现单独让孩子接受更高的教育水平是无利可图的。由此带来的路径依赖会造成“低教育水平均衡”的长期存在。(3)为引导各位家长让孩子接受更多教育,必须提高教育的回报率。考虑到如果“低教育1试想,如果你身处一个文盲社区,那么你在这门课中辛苦学习的博弈论知识基本会毫无用武之地。而如果你周围
本文标题:第一次作业及答案
链接地址:https://www.777doc.com/doc-4572879 .html