您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 不完全信息动态博弈.
一、基本概念和举例二、海萨尼转换三、贝叶斯法则四、精炼贝叶斯纳什均衡五、信号传递博弈六、不完全信息动态博弈应用案例分析在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。在不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。并根据这种不断变化的判断,选择自己的策略。古玩市场黔驴技穷信号传递1967年,海萨尼提出了“海萨尼转换”来处理不完全信息的博弈。基本思路是:引入一个虚拟的参与人——“自然”,“自然”首先行动选定参与人的某种类型,各参与人知道自己的类型,但其他参与人不知道。不过,“自然”以怎样的概率来选择各参与人的类型,此概率分布却是共同知识。以对参与人类型的概率的分析代替对参与人确切行动的分析,这样的转换就是“海萨尼转换”。通过海萨尼转换,博弈开始时,所有参与人有关“自然”的行动有一致的信念,即都知道所有人类型的概率分布,此即“海萨尼公理”。海萨尼转换后的市场进入博弈N●P1-P●●进入者进入者不进进不进进●●●●(0,300)在位者打击●●打击●●在位者(40,50)(-10,0)(0,400)(30,80)(-10,100)合作合作在不完全信息开始之前,“自然”首先行动,选择各参与人的类型。各参与人除了知道自己的类型以外,对“自然”的行动都有着一致的信念,称之为先验信念。之后,参与人先后行动,后行动者能观察到先行动者的行动,但观察不到先行动者的类型。但是,因为参与人的行动是依赖于其类型的,每个参与人的行动都传递着有关自己类型的某种信息,后行动者可以通过观察先行动者的行动来修正对其各种类型判断的先验信念(概率分布),然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用,也就会设法传递对自己有利的信息,避免传递对自己不利的信息。因此,不完全信息动态博弈不仅是参与人选择行动的过程,更是参与人不断修正信念的过程。例所罗门判子所罗门王是古代以色列国的一位以智慧著称的君主。一次,两个妇人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。例黔之驴黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神。蔽林间窥之,稍出近之,憖憖然莫相知。他日,驴一鸣,虎大骇,远遁,以为且噬已也,甚恐。然往来视之,觉无异能者,益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒,驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大㘎,断其喉,尽其肉,乃去。噫!形之庞也类有德,声之友也类有能,向不出其技,虎虽猛,疑畏卒不敢取;今若是焉,悲夫!贝叶斯法则概率论中贝叶斯公式贝叶斯法则是先验概率,是类型,是一特定行动。问题是假如观测到了,则属于类型的概率,即后验概率。niBPBAPBPBAPABPnjjjiii,...2,1,1KjjjhkkhhkPaPPaPaP10kPkkhahahkaP例对人的判断把所有的人划分为好人GP和坏人BP两类,所有的事划分为好事GT和坏事BT两类。那么一个人干好事的概率是多少?如果观测到一个人干了件好事,那么这个人是好人的后验概率是多少?更具体点,假定认为这个人是好人的先验概率为1/2,那么在观测到他干了好事之后,如何修正先验概率依赖于我们认为这件好事好到什么程度。第一种情况,这是一件非常好的好事,好人一定干,坏人绝不可能干。可以看到,我们如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人干好事和坏人干好事的条件概率。不能任意地“认为”。当认为坏人干好事的概率为时,那么,在给定信息情况下,如果这个人确实是坏人,则是他的最优选择。这对于理解精炼贝叶斯纳什均衡是非常重要的。第二种情况,这是一件非常一般的好事,好人会干,坏人也会干第三种情况,好人肯定会干,坏人可能干也可能不干BPGTP/BPGTP/贝叶斯法则不是一个技术性法则,而是人们修正信念的唯一合理方法。例二手车市场认为车子是好的先验概率为,认为车子是不好的先验概率为。当卖(Sell)这个行动发生后,车子是好的后验概率是多少?GPBP精炼贝叶斯纳什均衡是:﹛L,U;p=1﹜1●●●●●●●●RLM(p)(1-P)22UDUD(2,1)(0,0)(0,2)(0,1)(1,3)因此,这个博弈的唯一的精炼贝叶斯纳什均衡是﹛L,U;p=1﹜假定参与人2认为参与人1选择L和M的概率分别为p和(1-p)。给定这个信念,参与人2选择U的期望效用是p×1+(1-p)×2=2-p,选择D的期望效用是p×0+(1-p)×1=1-p.不论p为何值,参与人2一定选择U。给定参与人1知道参与人2将选择U,参与人1的最优选择是L。给定L是参与人1的最优战略,当参与人2观察到参与人1没有选择R时,他知道参与人1一定选择了L,即p=1。第一,在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);第二,给定该信息集上的概率分布和其他参与人的后续策略,参与人在该信息集处的行动必须是最优的(后续策略指的是从给定信息集开始的后续博弈上的行动规则);第三,每个参与人根据均衡策略和贝叶斯法则做出判断和修正,得到后验概率。满足上述要求的博弈均衡就称为“精炼贝叶斯均衡”。信号传递博弈是一类比较简单但有广泛应用意义的不完全信息动态博弈,许多博弈问题都可以归结为此类型的博弈。如市场进入与遏制、委托-代理关系、拍卖机制的设计等。在信号传递博弈中有两个参与人,先后各行动一次;参与人1有多个类型,先行动;参与人2后行动,他不知道参与人1的具体类型,但可以观察到先行动一方的行动并从中获得部分信息。先行动的一方行动对后行动者来说好像是某种反映其类型信息的信号,因此该博弈被称为“信号传递博弈”。一般称先行动的参与人1为信号发送者,记为S;后行动的参与人2称为信号接收者,记为R。例垄断厂商的低价销售:信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品。譬如,发达国家的私营铁路、航空、海运码头等的价格都远低于按照其垄断定价方法定出的价格。这是什么原因呢?现在,我们用这个“信号传递博弈”的原理,来解释为何一些垄断厂商长期在低价格水平上经营。如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营。由于垄断厂商有更低的生产成本,所以,它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业。但是,这种“打斗”行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失。垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布。一种方法就是,垄断者向外发送一个信号,向外界传递它真是低成本的信息。它可以长期在一个较低价格水平上经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂商会据此判定它确是低成本的。同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些。这样,垄断者才会采取如此策略。潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位。为什么有的商品广告既无商品的价格信息又无售货地点信息,只有明星的表演?通常认为,商业广告的功能是向消费者提供必要的购货信息,如散布商品的价格,质量功能,出售地点等信息。再者,人们还认为有些广告可能是为了引导消费,特别是新产品出现时,消费者还不知道、不熟悉它,商业广告中通过一些电影明星使用新产品的图象,利用公众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外的电视广告中特别常见,通常是一位当红明星在电视上用新产品表演一番,既无价格,也无售货地点的介绍,除了显示一下商标外,完全没有对产品性能的说明。不过,对于这类广告,博弈论还有一种“信号传递”的解释呢。假设有一家企业(记为企业A)开发出一种很有市场潜力的饮料,该产品饮后对人的健康确实有好处。但同时,另一家生产假冒伪劣产品的企业(记为企业B)也准备向市场推出一种伪劣产品饮料。两个企业都会向公众宣布其产品是上乘的,如何如何的好。但公众是理性的,不会仅凭商业宣传就相信它们。但是,如果产品真的好,随着时间的推移,消费者能够识别出来。所以,生产好饮料的的企业A对自己的市场有信心,它相信随着时间的推移,企业B生产的伪劣产品终究会被消费者识破,顾客会跑到自己这里来,从而自己的市场会不断扩大,销售收入及利润会不断增长。而企业B开始可以蒙骗一部分消费者,但时间一长,产品的问题会暴露出来,市场会不断缩小,收入及未来利润都不会有企业A的大。这样一来,企业A的未来预期收入远大于企业B。因此,如果企业A请一位当红明星打广告,由于是当红明星,他们打广告有很高的市场价格,就可以使企业B不敢模仿。譬如,假定企业A的预期收入为3千万元,企业B的预期收入为1千万元。当红明星打广告的市场价格为2千万元,那么,企业A可以请明星打广告但企业B就请不起。消费者也明白这个道理,从而会在一开始就识别出不能请当红明星打广告的企业B是生产伪劣产品的。这样,企业B一开始就没有市场。当企业A请了当红明星打广告时,企业B发现这位明星的市场价格太高,自己难以模仿企业A,开始就会放弃生产伪劣产品的计划。所以,企业A通过请当红明星打广告而清除掉了潜在的市场模仿者,它向公众传递自己是生产好产品的信号,这种信号的价值在于其所请来的当红明星有着较高的出场价格,而不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了。企业A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号。例为什么许多实力雄厚的公司还要向银行借很多钱?在国外,一些资金实力雄厚的公司通常也会向银行贷款。更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱。博弈论运用“信号传递”原理可以对此现象作出解释。对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些。每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的。于是,真正好的公司通过向银行借钱来增大自己破产的可能性,令其它实际上不好的公司难以模仿。这种负债比例的增加要做到恰到好处,它既可令其它实力稍弱的公司难以模仿,又使自己能够承受。这样,公众就能识别出谁是好的公司,从而竞相购买好的公司的股票,导致公司股票价格上涨,结果这家负债公司会因其股价上涨而获资本增值,破产的可能性反而下降了。当然,公司通过增加负债来向投资者传递公司信息的代价可能太高,因而有时公司十分乐意向投资者直接披露内部信息,只要这种信息足以使投资者相信其真实性,就会为公司减少信息传递成本。例飞机、轮船等设立头等舱、经济舱的道理是什么?无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实
本文标题:不完全信息动态博弈.
链接地址:https://www.777doc.com/doc-2785838 .html