您好,欢迎访问三七文档
-1-一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。-2-4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。三、计算题(16分)1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。F2B2F15,20,0B10,02,4答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H选择F1和N选择F2,以及H选择B1和N选择B22、A、B两者博弈:A首先行动,可以选择“左”或者“右”的行动;B后行动,有“L”和“R”的行动,其收益如下:当A选左,B选L时,A的收益为2,B的收益为3;当A选左,B选R时,A的收益为1,B的收益为4;当A选右,B选L时,A的收益为3,B的收益为1;当A选右,B选R时,A的收益为0,B的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。四、论述题(16分)1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方法可以建立可信的策略行动。答:每一种策略性行动都面临着可信性的问题,人们不一定相信策略性行动的提出者会实施其行动。因此提出者必须做一些辅助工作让人相信他会在第二阶段实施他已宣布的事。比如,工作中管理者对员工上班时间玩游戏的态度有所NH-3-不同。一些管理者对员工很宽容,并不惩罚玩游戏的员工。另一些管理者则十分严厉,会处罚玩游戏的员工。一些管理者虽然说了会处罚的承诺,但禁不住员工的好话及其它员工的求情,就原谅了员工。从博弈论角度分析,假设三种管理者手下的员工各方面都相同,哪一种管理者将得到最高的支付呢?管理者对玩游戏的态度可以是“处罚”或“原谅”,员工可以“玩游戏”或“不玩游戏”,如下表所示:员工玩游戏不玩游戏管理者处罚1,13,2原谅2,44,3管理者并不希望自己不近人情,故他们最好的结果就是(4,3),最不好的结果就是(1,1);余下的两个策略,因管理者希望员工不玩游戏,故(3,2)好于(2,4)。员工最喜欢(4,3),最不好的结果也是(1,1),余下的,员工(2,4)好于(3,2)。在此博弈中,若同时行动,或者是管理者后行动,与处罚带来的1和3的支付相比,原谅能带来2和4,是占优策略。此时,员工则会选择玩游戏。最终,均衡的结果是(2,4)。而如果管理者一开始就承诺“处罚”的话,员工会发现不玩游戏会更好,于是管理者得到了支付3。但是如果有员工曾被管理者原谅,可能他就会认为管理者心软,不相信管理者做出的“处罚”承诺,从而玩游戏。此时,就会得到一个最坏的结果,即(处罚,玩游戏),其支付仅为(1,1)。通过采取某种行动,改变博弈以得到更好的结果,这就是策略行动。策略行动分:承诺、威胁及许诺。这三种策略性行动最重要的,是必须让博弈的其他参与人相信策略性行动的提出者在第二阶段中确实会做其在第一阶段中宣布的事。而在此每一种策略行动都面临着可信性的问题,人们不一定相信策略行动的提出者会实施其行动。因此仅仅宣布是不够的。在第一阶段,提出者必须做一些辅助工作让人相信其会在第二阶段做已宣布的事。上述博弈中涉及的是管理者对玩游戏员工“处罚”态度的承诺。在这个事件中,管理者为了从策略行动中获得好处,他所做的承诺不能和同时行动-4-博弈的均衡策略一样,因此管理者选择了“处罚”的承诺,这个策略行动改变了员工的期望和行动。一旦员工相信这种承诺,则他们会不玩游戏,从而得到(3,2)的支付。如果员工们尝试玩一次游戏,管理者可能会原谅他们,理由是“只此一次”,这里就存在了使策略性行动不付诸实践的诱惑,使得承诺的可信性下降。如果最终员工不再相信“处罚”的承诺,则他们会玩游戏,从而最终管理者和员工只得到(1,1)的支付,双方利益均受损。这就是管理者铁石心肠的原因。因为他清楚破例原谅员工一次的危险性。因此,管理者需要做一些事情来确立他策略行动的可信性,即让其他参与人相信他们的行动如违背你的承诺,你将一定会付诸实践,而不会因人情等引诱而放弃。避免危险的办法通常只有一个,那就是绝不越雷池半步。并且管理者们需要找到某些方法使其的拒绝合理可信,同时提高其策略行动的可信性。第一、通过减少未来行动的自由,排除引诱行动,只能实施策略行动中所确定的行动。例如,管理者可以拿规章制度或工作纪律做挡箭牌,这些制度纪律一旦制定则个别管理者就不能在任何特殊情况下破例。这样做,就等于将“原谅”行动从他们的选择组合中剔除了,因此他只能实施“处罚”的承诺。规则的存在让员工相信管理者不可能再改变想法,所以此时管理者“处罚”的承诺就是可信的了。第二、改变未来的支付,减少引诱行动的支付使实施策略行动成为最佳行动。管理者可以通过几次毫不让步的处罚建立起严厉的声誉,虽然毫不让步的处罚可能不是一件愉快的事,也可能违背管理者的本意,但这在漫长的工作生涯中是有好处的。因为如果一个管理者被认为非常严厉,就没有员工想用借口搪塞他,而他也就减少了拒绝员工的不愉快。如果管理者在一个博弈里未能兑现他的承诺,他的声誉将受到损害,这也就导致他在其他的博弈里得到低的支付。由此观之,提高策略行动的可信性将有助于提高策略性博弈中获得的支付。因此,学会运用坚守原则、提高声誉等方法增强自己行为的可信性,能帮助我们在今后的生活中选择最佳行为,获得更高的收益。-5-2、中国的外交政策一贯坚持和平外交,因此,中国一直不断裁军,但中国同时也拥有一定数量的核武器。请用所学的博弈理论分析这一现象。答:以博弈论著名的案例“囚徒困境”为例:警察抓到两个纵火案犯罪嫌疑人,然后将它们隔离关押起来,并要求他们坦白交代。假定:如果两人都承认纵火,每人将被判刑3年;如果都不承认,每人将被判刑1年;如果一个不承认而另一个坦白并作证,那么抵赖者将被判刑5年,坦白者将被释放。这两个囚徒将做出怎样的选择呢?显然,在以上假定中,最好的结果是双方都选择抵赖,结果是大家都只被判刑1年。但是,由于两个囚徒在理论上都是从利已的目的出发进行决策的所谓“理性行为者”,在无法获取对方的完全信息并给予对方充分信任的情况下,每一个人大概都会选择似乎对自己最有利的策略,即选择坦白。出现了个体理性(都选择坦白,各被判3年)与集体理性(都不承认,各被判1年)的冲突。国与国之间的扩军、裁军也是这样一种“囚徒困境”,在双方信息沟通不畅的情况下,就会导致双方不能达成合作,一国的个体理性导致了国与国之间的集体非理性,没有实现相互之间的利益最大化。我国一贯坚持和平外交,同时拥有一定数量的核武器,并且承诺不首先使用核武器,这就避免为了达到先发制人的目的,而不得不投巨资花大钱在军备上以确保己方克敌制胜的能力。我国这样的核战略,一方面降低了我国在其他核大国眼中威胁,另一方面保证我们可以把更多的钱用在社会经济建设和综合国力提升上。有了最低限度核威慑战略(一报还一报的最优策略)的保障,再通过充分的信息沟通,就可以打破国与国之间在军备竞赛中的囚徒困境。以中美、中俄为例,我们主动释放善意,不断裁军,同时,着力提升我国综合国力,加大中美、中俄双边经济、社会、文化、军事方面的交流沟通,使得博弈双方认识到博弈的各种可能结果,从而超越“你死我活”的-6-“零和对局”,而实现“双赢”乃至于“多赢”,进而实现集体理性。3、我们经常在报纸上看到很多企业(比如家电企业)经常希望建立价格联盟,但往往是无功而返。即使价格联盟成立了,也很快就破裂了。请用囚徒困境的思想进行解释。有什么办法可以让联盟达成。答:假设两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。市场上的价格战也是一场囚徒博弈,在国内的家电大战中,虽然不是两个对手之间的博弈,但由于在众多对手当中每一方的市场份额都很大,每一个主体人的行为后果受对手行为的影响都很大,因此,其情景大概也是如此。如果清楚这种前景,双方勾结或合作起来,都制定比较高的价格,那么双方都可以因为避免价格大战而获得较高的利润。但是往往这些联盟处于利益驱动的“囚徒困境”,各个厂商为了追求自身的市场份额,都有背叛价格联盟和针对它的竞争者削价的动机,致使双赢成泡影。让联盟达成的办法就是合作策略行为,它注重团体理性,在人所不欲勿施于我的前提下,己所不欲勿施于人,实质是串谋。同时,也应采取富有竞争力的价格定位和价格策略,将自己的策略向竞争对手示明:不要轻易降价,一旦对手降-7-价就打破了原有的成文或不成文协议;再以跟进战略,迅速向对手表达这样的市场信号;希望对手并没有在实施大规模的市场份额争夺战,而只是出于试操性的降价,经过几次定价回合使双方的合作承诺在某种程度上达成,实现合作双赢局面。
本文标题:博弈论复习题及答案
链接地址:https://www.777doc.com/doc-5994811 .html