您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 第二章-战略式博弈-静态博弈与纳什均衡
第二章战略式博弈与Nash均衡主要内容:一、占优行为二、重复剔除劣战略行为;三、Nash均衡。战略式博弈主要内容:一、基本概念;二、战略式博弈。引例:新产品开发博弈两企业(不妨称为企业1和企业2)准备各自开发同一新产品,并投放市场。ab对手不开发,获利800万元需求大对手开发,获利300万元开发():投入2千万元资金对手不开发,获利200万元企业需求小对手开发,赔400万元不开发():不投入资金,利润为0一、基本概念1.参与人;2.行动;3.战略;4.支付;5.信息;1.参与人•参与人(player,亦称局中人),是指博弈中选择行动以最大化自己效用的决策主体,既可能是个人,也可能是团体,如国家、企业或组织等。•例如,“新产品开发博弈”中的企业1和2。有关参与人的标记•除特别指出外,一般都假设参与人为满足完全理性的决策主体,并且用表示n人博弈中的参与人;•表示所有参与人的集合。•在“新产品开发博弈”中,。1,2,,in{1,2,,}n{1,2}2.行动•行动(action),是参与人在博弈的某个时点的决策变量。•例如,“新产品开发博弈”中企业的选择——“开发”和“不开发”。•在博弈分析中,一般假设参与人都必须有多个(两个或两个以上)可供选择的行动。有关行动的标记•用表示参与人的行动,•表示参与人所有行动的集合。•例如,“新产品开发博弈”中,•行动不仅可以为离散型变量,也可以是连续型变量。ia(1,2,,)iin{}iiAa12{,}AAab•在n人博弈中,n个参与人行动的有序集是n个参与人的行动组合(actionprofile)。•它表示博弈中每个参与人采取一个行动的一种博弈情形,其中表示参与人i所采取的行动。12(,,,)naaaa(1,2,,)iinia在“新产品开发博弈”中:•行动组合(开发,开发)(即)表示博弈中企业1和2都采取行动“开发”;•行动组合(不开发,开发)(即)表示博弈中企业1采取行动“不开发”,而企业2采取行动“开发”。•用A表示所有行动组合的集合。在“新产品开发博弈”中,存在四个行动组合,即(,)aa(,)ba{(,),(,),(,),(,)}Aaaabbabb3.战略•战略(strategy),是参与人的行动规则,它规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。它是与博弈的行动顺序相关的行动的有序集,也是构成博弈问题的基本要素之一。•在“新产品开发博弈”中,假设博弈参与人的行动顺序(决策时序)是:企业1先行动,企业2观测到企业1的行动后再行动。•在这样的博弈行动顺序下,轮到企业2行动时,可能面临的决策情形就会有两种:企业1已采取行动“开发”和企业1已采取行动“不开发”。•企业2的战略就必须告诉(规定)企业1:当企业1采取行动“开发”时,自己应该怎样行动(“开发”还是“不开发”);当企业1采取行动“不开发”时,自己应该怎样行动(“开发”还是“不开发”)。关于战略的标记•在n人博弈中,用表示参与人的战略;•表示参与人在博弈中可能面临的所有决策情形的集合,称为观测集。is(1,2,,)iiniX(1,2,,)iin•参与人在博弈中的战略可以定义为从观测集到行动集的映射关系,即•用表示参与人所有战略的集合。(1,2,,)iiniXiA:iiisXA{}iiSs新产品开发中参与人战略的标记•在“新产品开发博弈”中,假设博弈中参与人的行动顺序(决策时序)是:企业1先采取行动,企业2观测到企业1的行动后再采取行动。那么企业2行动时面临的决策情形就有以下两种:•情形:企业1已采取行动“开发”;•情形:企业1已采取行动“不开发”。•所以,1x2x212{,}Xxx•企业2的战略集就包含以下四个战略:战略:,战略:,战略:,战略:,•企业1的战略集就包含以下两个战略:战略:战略:2S12s121()sxa122()sxa22s221()sxa222()sxb32s321()sxb322()sxa42s421()sxb422()sxb1S11s21s11sa21sb企业1的战略集和行动集相同。完全信息静态博弈的战略•在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。关于战略组合的标记•在n人博弈中,用表示n个参与人的战略组合(strategyprofile),它表示博弈中每个参与人采取战略的一种博弈情形。12(,,,)nssss(1,2,,)iinis•例如,在“新产品开发博弈”中,战略组合表示博弈中企业1采用战略(即博弈开始采取行动“开发”),企业2采用战略。1312(,)ss11s32s4.支付•支付(payoff),是指参与人在博弈中的所得。•在博弈分析中,除特别说明外,一般情况下也是用效用函数来表示参与人在博弈中的所得(即支付)。因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。关于支付的标记•用表示参与人i的支付(效用水平),支付组合表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。•博弈中每种特定博弈情形的出现都是参与人相互作用的结果,因此,参与人在每种博弈情形下的支付(效用水平),不仅与自己的选择(行动或战略)有关,而且还与其他参与人的选择(行动或战略)有关。参与人的支付可表示为:(1,2,,)iuin12(,,,)nuuuu(1,2,,)iin12(,,,)iinuusss•用表示除参与人i以外其他参与人的战略组合,则•因此,参与人的支付就可表示为:111(,,,,,)iiinsssss12(,,,)(,)niissssss(1,2,,)iin(,)iiiiuuss新产品开发中参与人支付的标记•在“新产品开发博弈”中,参与人的利润就是其支付;•在市场需求大的情况下:如果参与人都选择“开发”,则其支付都为300万元,即,;如果参与人1选择“开发”,而参与人2选择“不开发”,则参与人1的支付为800万元,而参与人2的支付为0,即,。1(,)300uaa2(,)300uaa1(,)800uab2(,)0uab5.信息•信息(information),是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。•信息是对博弈问题进行系统科学分析的基础,在不同的博弈问题中,根据具体情况博弈问题具有不同的关于博弈信息的假设。•在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;•如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。•此外,还有所谓的“完美信息”假设:完美信息:指在轮到某一参与人行动时,对其他参与人的行动选择有准确的了解的情况,否则则为不完美信息;•完美信息一般针对什么类型的博弈而言?•战略式博弈(strategicformgame)是博弈问题的一种规范性描述,有时亦称标准式博弈。•战略式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或战略,并且这些选择是同时进行的。二、战略式博弈定义:战略式博弈战略式博弈包含以下三个要素:1参与人集合;2每位参与人非空的战略集,即;3每位参与人定义在战略组合上的效用函数。{1,2,...,}niS,iiS11(,...,,...,)niinissss1(,...,,...,)iinusss•一般而言,如果我们要用战略式博弈对一个博弈问题进行建模(或者描述),那么我们只需要说清楚博弈问题的三个构成要素即可,即博弈问题所涉及到的参与人、每位参与人有哪些战略可供选择使用以及每位参与人定义在战略组合上的效用函数。战略式博弈的标记•如果且,也就是,如果博弈中参与人的人数以及每个参与人的战略有限,则称这个博弈问题为有限博弈(finitegame)。•对于有限博弈,我们一般用三元组来表示战略式博弈。iiS,{;();()}iiGSu例1完全信息静态博弈的战略式描述考察“新产品开发博弈”。试用战略式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。“新产品开发博弈”的战略式博弈(需求大时)300,300800,00,8000,0企业2企业1开发不开发开发不开发“新产品开发博弈”的战略式博弈(需求小时)-400,-400200,00,2000,0企业2企业1开发不开发开发不开发•需要指出的是,由于战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。•对于完全信息动态博弈问题,虽然可以给出博弈问题的战略式描述,但无法看到原问题所具有的动态特性。-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白两个罪犯的得益矩阵囚徒2囚徒1囚徒1:坦白囚徒2:坦白结论:个人理性与集体理性的矛盾囚徒困境说明了什么在(坦白、坦白)这个组合中,两囚徒A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。囚徒困境的意义“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。对经典经济学的冲击古典经济学的创始人亚当·斯密曾经描述,市场机制这只“看不见的手”,会引导人们自利的行为促进社会的福利。博弈论的“囚徒困境”却揭示,非合作的自利行为可能导致两败俱伤的情景。公共资源悲剧哈丁(GarritHadin)1968年在《Science》杂志上发表了一篇文章,题为TheTragedyoftheCommons。哈丁举例:一群牧民面对向他们开放的草地,每一个牧民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是合算的,尽管因平均草量下降,可能使整个牧区的牛的单位收益下降。每个牧民都可能多增加一头牛,草地将可能被过度放牧,从而不能满足牛的食量,致使所有牧民的牛均饿死。这就是公共资源的悲剧。现实中的“囚徒困境”见义勇为者常常孤立无缘;我国的应试教育制度下,学生的负担、家长的焦虑;军备竞赛价格大战(家电、民航、奶业)。。。。。应用二:三鹿奶粉的囚徒困境无辜的孩子们失去了宝贵的生命,三鹿的领导者们锒铛入狱,曾经辉煌的乳液巨头们陷入了巨额亏损的无底深渊。究竟是什么原因让一个行业陷入危机?难道仅仅是几个利益熏心的奶霸吗?其实,这只是表像而已,隐藏在表象背后的是企业在激烈的竞争中陷入了囚徒困境,而最终拯救囚徒的,只能是代价巨大的推倒重来。这些年来乳品企业坚持不懈的宣传在潜移默化中改变了中国人的消费观念和习惯,各种各样的乳品走进了千家万户,而巨大的市场面前乳品企业之间的竞争也随之日趋激烈。如果说一开始竞争的关键在于渠道和营销的话,近年来关于奶源的争夺则扮演了越来越重要的角色。“囚徒困境”的正面效用从消费者的角度,竞争带来降价,得到实惠。从企业的角度,鼓励竞争,激励企业不断创新,开发新技术,提升产品质量,拓展市场,从而赢得市场。举出你身边或了解到的囚徒困境案例,并分析如何走出困境?作业与讨论:如何走出困境?“囚徒困境”的正面效用从消费者的角度,竞争带来降价,得到实惠。从企业的角度,鼓励竞争,激励企业不断创新,开发新技术,提升产品质量,拓展市场,从而赢得市场。1.2.2智猪博弈(boxedpigs)假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位成本,若大猪先到槽边,大猪吃9个单位,小猪吃1个单位;若
本文标题:第二章-战略式博弈-静态博弈与纳什均衡
链接地址:https://www.777doc.com/doc-7331542 .html