您好,欢迎访问三七文档
第七讲博弈论中国科学技术大学商学院MPA课程子博弈精炼纳什均衡将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。与纳什均衡的区别在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。市场进入阻挠博弈假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。企业A有两种可选策略,即斗争与默许。斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。企业B也有两种策略:进入或者不进入。假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。各种策略组合下的支付矩阵如下表:举例分析该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。静态分析方法,得到两个纳什均衡。分析给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。同理,给定企业A高价时,进入策略成为企业B最优选择。尽管在企业B选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。子博弈与精炼纳什均衡用动态博弈理论来讨论实际究竟发生哪个纳什均衡。给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。举例的进一步分析在市场进入博弈中,在给定企业B已经进入的情况下,在位者的“斗争”,“低价”策略已不再是最优的,这种“斗争”是不可置信的威胁,因为斗争的结果是没有利润;而合作会带来50单位利润。所以(不进入,低价)不是一个精炼纳什均衡。剔除这个均衡,可以证明,(进入,高价)是唯一的子博弈精炼纳什均衡。说明只有那些不包含不可置信威胁的纳什均衡才是精炼的纳什均衡。有些纳什均衡之所以不是精炼均衡,是因为它们包含不可置信的威胁;然而,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,使不可信的威胁变得可信,博弈的精炼均衡就会相应改变。承诺行动怎样才能使不可信的威胁变得可信呢?往往采取信息经济学中的重要概念:“承诺行动”。承诺行动是指当事人在不施行这种不可置信威胁时,就会付出更大的代价。尽管这种代价不一定发生,但承诺行动会给当事人带来很大好处,因为它会改变均衡结果。举例(一)在市场进入博弈中,若企业A通过某种承诺行动使自己的“斗争”威胁变得可置信,企业B就不敢进入了。如:企业A与第三者打赌:若企业B进入后他不斗争,就付给第三者100单位。这时,斗争就变成可信的威胁。因为若B进入后,企业A不斗争带来50寡头利润扣除100赌注,将得-50净利润,而斗争将得0利润,所有斗争比不斗争好。这样,企业B就不敢进入了,在位者实际上无需支付赌注便能得到300垄断利润。一般说来,承诺行动的成本越高,威胁的可信度就越高。举例(二)富家“千金”爱上穷小伙子,她父亲坚决不同意,威胁说,如果你嫁给穷小子,你就永远没有这个父亲(断绝父女关系)。也许女儿可能会想:父亲只有一个,而丈夫可以有很多选择机会,所以,如果她相信父亲的话,她大概会中断与恋人关系。问题是她不知道如果失去女儿,父亲损失也很巨大。一旦女儿真嫁给了穷小子,“木已成舟”,一般说来父亲不会断绝父女关系。聪明的女儿如果认识到父亲威胁不可信时,会勇敢地嫁给小伙子。这是一个精炼的纳什均衡。分析对于父亲来说,关键是要使自己的威胁变得可信。更聪明的父亲可能会在与女儿争吵时装出心脏病发作之迹象。这样,女儿知道一旦父亲生气引起心脏病突发或心肌梗塞等,她将真正没有父亲了,因此,父亲的威胁变得真正可信了,女儿也就可能中断与恋人的关系了。典故破釜沉舟。项羽与秦兵交战,领兵过河就砸锅沉船了,这就是一种承诺行动,即誓死力战。最后项羽大胜秦兵。另外,《三国演义》中仓亭之战也是一例。曹操召集将领来献破袁之策,程昱献了十面埋伏之计。他让曹操退兵河上,诱袁绍来追,到那时“我军无退路,必将死敌,可胜绍矣”。曹军采纳此计,令许褚诱袁军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”众军四头奋力反击,袁军大败。有限次重复博弈如果博弈只进行一次,参与人只会关心一次性支付;但如果博弈重复多次,参与人可能会为长期利益暂时牺牲眼前利益从而选择不同的策略。影响均衡结果的主要因素是博弈的次数及信息的完整性。连锁店之谜在位者选择斗争的唯一原因是市场斗争(低价)起到威慑作用,使企业B不敢进入。然而,在有限次重复博弈中,斗争并不是一个值得置信的。这个博弈的唯一子博弈精炼均衡是企业A在每个市场(连锁店)都选择高价,企业B在每个市场都选择进入。分析这个博弈还有其他均衡,如(斗争,不进入)等,但它不是子博弈精炼均衡。可以说,只要博弈重复的次数是有限的,则博弈的结果就将与一次性博弈(指对局一次)的结果相同。无限次重复博弈:“针锋相对”策略假设博弈进行无数次,那么你就有办法影响你的对手的行为:如果他这次拒绝合作,你就可以在下一次拒绝合作,直到他开始选择合作,然后双方永远选择合作。这就是所谓“针锋相对策略”。只要双方都充分关心各自将来的支付,那么将来不合作的威胁就足以说服他们,使他们采取合作的策略。说明“针锋相对”的策略的确非常令人满意,因为它能立即对背叛以惩罚。它也是一种宽恕的策略:对于对手的每一次背叛,只惩罚他一次。如果他的对手选合作策略,那么针锋相对的策略就会以合作作为对他的报答。显然,这是在进行无数次重复博弈中达到有效结局的令人满意的机制。冷酷策略、声誉冷酷策略指如果第一次对方背叛了我,我将永远对你进行惩罚,采取不合作的策略,丝毫不给他“赎过自新”的机会。实践证明这种策略并不是最好的对策。声誉模型:如果市场只进行一次交易或有限几次交易,显然难以达到高效率。如果是进行无数次交易,双方都尽量地选择合作,以树立自己地良好形象。完全信息博弈的概念都假定博弈中的每个参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且所有参与人知道所有参与人的支付函数,即支付函数是“共同知识”。这种博弈叫完全信息博弈。以上内容均为完全信息博弈。然而,这种假设往往与现实并不相符。不完全信息静态博弈市场进入。对潜在进入者企业B来说,不知道企业A的成本函数,也不知企业A是否采取斗争(低价)策略。在给定企业B进入时,高成本企业的最优选择是高价(合作),而低成本企业的最优策略是低价(斗争)。低成本情况下,斗争比合作好。虚拟的参与人——“自然”“自然”不同于一般参与人之处在于它在所有后果之间是无差异的。自然首先行动——选择参与人的“类型”。被选择的参与人知道自己的真实类型,而其他参与人并不清楚这个被选择的参与人的真实类型,仅知道各种可能类型的概率分布。被选择的参与人也知道其他参与人心目中的这个分布函数。贝叶斯纳什均衡在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择。给定别人的策略选择,每个参与人的最优策略依赖于自己的类型。由于每个参与人仅知道其他参与人类型的概率分布而不知道其真实类型,他不可能准确地知道其他参与人实际上会选择什么战略;但是,他能正确地预测到其他参与人的选择是如何依赖于其各自的类型的。“市场进入”再分析企业B只有一种类型,企业A有两种类型(高成本和低成本)。也就是说,进入者具有不完全信息,而企业A具有完全信息。给定企业B进入的情况下,企业A选择斗争还是合作依赖于它的类型:如果是高成本,则合作(高价);反之低价(斗争)。“市场进入”再分析进入者不知道企业A的真实类型,但假定知道它的高成本可能性为p,低成本的可能性为(1-p),那么企业B选择进入时的期望利润为40p+(-10)×(1-p),而选择不进入时的期望利润为0。因此,p0.2时,企业B进入得到的期望利润大于0,从而进入才是最优的。若p0.2,贝叶斯(纳什)均衡为:企业B选择进入,高成本企业A选择高价,低成本企业A选择低价。其他例子求爱博弈。假定有人向你求爱,你选择是接受还是拒绝取决于你对求爱者品德的判断。问题是你可能并不能准确判断求爱者品德,这时,你的决策显然取决于你多大程度上相信他是一个品德优良或品德恶劣的人。若p1/2,贝叶斯纳什均衡为:求爱者求爱,你接受;反之不接受。但p1/2,求爱者不会选择求爱策略。精炼贝叶斯均衡精炼贝叶斯均衡是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合,是最高层次均衡。要点在于:当事人要根据所观察到的他人的行为来修正自己有关后者的“信念”(主观概率),并由此选择自己行为。修正过程使用的是贝叶斯法则。这意味着,每个参与人都假定其他参与人选择的是均衡战略。修正先验概率贝叶斯规则“黔驴技穷”信号传递模型信号传递是动态博弈的基本部分。分析劳动力市场中工人的教育水平如何传递有关能力的信息。高能力的人要使自己与低能力的人一分为二,则要选择受更多教育。因此,企业看到受过高教育的人就可以推断其能力较高,支付高工资。垄断限价模型解释现象:垄断企业规定的产品价格一般低于微观经济学定义的最优垄断价格即,边际收益等于边际成本时的价格。垄断限价反映这样一个事实,其他企业不知道垄断者的生产成本,垄断者降低价格只是为向进入者提供自己低成本的信息,这样进入就会无利可图。承诺行动再分析一种行动要起到某种传递信息的功能,行动者必须为此付出代价(成本),否则,所有其他类型的参与者都会模仿或不相信。就是说,只有负担成本的承诺才可信。为传递信息支付的成本是由信息不完全性导致的。“声誉”理论证明:不完全信息可以导致合作后果,这在完全信息下不太可能。声誉模型声誉模型的核心是要使对手相信你将会做一些不合理的事,如定出会赔本的价格或采取明显会吃亏的合作态度等,这就是有成本的承诺行动。而这样成功时会导致较高的均衡报酬。第八讲战略决策中国科学技术大学商学院MPA课程王国华战略决策“战略”一词起源于军事科学,它是与“战役”、“战术”相对而言的概念。一般而言,“战略”是泛指重大的、具有全局性、长期性、规律性、关键或决定性的谋划。战略决策是主要依靠科学的方法,根据影响组织发展的内外环境及其未来趋势,对组织做出的全局性、综合性、长远性的重大方向任务的决定。战略决策的特点非常规性:战略决策不常有,一般也无先例可循;重要性:战略决策需要支配组织大量的资源,所以要求大量的投入,战略决策所产生的结果对组织的影响也很重要指导性:战略决策指导组织中层和低层的决策以及未来的行动方向战略决策的类型按明茨伯格说法,战略决策分三种类型:企业家模式、适应模式以及规划模式。企业家模式:在这种战略决策模式中,战略是由一个铁腕人物制定的。(微软)适应模式:这种战略决策的特点是对现有的问题进行响应,提出解决方案,但并不是主动寻求新的发展机会。大多数大学、很多大型医院以及政府机构都采用这种战略决策模式。也有很多企业也采用这种战略决策模式。战略决策的类型规划模式:这种战略决策涉及到系统收集用于情景分析的信息,总结出多种可行战略,以及选择最合适的战略。这种模式既主动寻求新的发展机会,也响应现有的存在问题。循序渐进模式:由规划模式、适应模式以及企业家模式综合而成。战略决策的形成西蒙认为决策的制定包括四个阶段:第一个阶段是探查分析环境,找出制定决策的理由;第二个阶段是根据前阶段对环境的分析,找到可能采取的行动方案;第三个阶段在诸多方案中进行选择,从可能利用的方
本文标题:博弈论
链接地址:https://www.777doc.com/doc-5378634 .html