竞争与博弈论

博弈论与竞争策略博奕理论基础几种典型博奕模型及应用策略行动几种相关的策略小结例题博弈论博弈论(GameTheory)也叫做对策论或竞赛论，在20世纪50年代由数学家约翰·冯·诺依曼和经济学家奥斯卡·摩根斯坦引入经济学，目前已经成为经济分析的主要工具之一。博弈论在近数十年中获得了长足的发展，且应用的领域十分广泛，它对寡头理论、信息经济学等经济理论的发展作出了非常重要的贡献。1994年的诺贝尔经济学奖颁发给了约翰·纳什等三位在博弈论研究中作出重大贡献的经济学家，1996年的诺贝尔经济学奖又授予在博弈论的应用方面有着重大成就的经济学家，由此可见博弈论在现代经济学中有相当重要的地位。博奕问题的刻画博奕论:描述和研究行为者之间策略相互依存和相互作用的决策理论，其目的在于说明决策主体如何在缺乏其决策后果的充分信息的条件下做出合理的决策。博奕问题的构成：1、参与博奕的博奕者,也称为参与者；为一个决策主体，可以是一个自然人，也可以是一个组织，其目的是通过选择某种策略使自己的收益最大化。2、每个博奕者可能采取的策略，即博奕参与者所采取的行动方案；3、所有博奕者可能选择的每一种策略组合情况下每一个博奕者所得到的收益（也称为支付）。所谓收益就是策略实行后的结果。收益矩阵又称为支付矩阵、得益矩阵或报酬矩阵，它表明了博奕的参与者采取的每种策略组合的结果或收益。某一寡头市场上有A、B两个企业，他们的目标是通过价格变化来增加他们的利润。假定每家企业有两种可能的策略：或保持现在的价格水平；或涨价。在这一搏奕中，有四种可能的策略组合：两家企业都涨价、两家企业都不涨价、企业A涨价但企业B不涨价和企业B涨价但企业A不涨价。四种策略组合的每一结果可以用收益矩阵来表示。企业B价格不变涨价价格不变企业A涨价10，26，815，010，5占优策略均衡与纳什均衡如何决定什么是最优策略？如何确定一个博奕的大致结果？占优策略：指不管对方选择什么策略，对博奕方来说都是最优的策略。也就是说，在一个博奕中，如果某一个博奕者具有占有策略，那么无论其他博奕者选择什么策略，该博奕者确信自己选择的唯一策略都是最优的在上表所表示的博奕中，涨价是企业B的占优策略。涨价也是企业A的占优策略。博奕均衡：指博奕中的所有参与者都不想改变自己的策略的这样一种状态。在上面分析的例子中，（涨价，涨价）这一对策略组合下的博奕状态，就是一种均衡状态。占优策略均衡：由博奕中的所有参与者的占优策略组合所构成的均衡。纳什均衡：假定其他的参与者的策略既定的话，博奕中所有的参与者都不会改变自己的策略。将上表做一点改变，变成下表，现在企业A没有了占优策略.两企业都涨价是一个纳什均衡企业B价格不变涨价价格不变企业A涨价20，26，815，010，5总结占优策略均衡是不管你选择什么策略，我所选择的是最好的；不管我选择什么策略，你所选择的是最好的。纳什均衡是给定你的策略，我所选择的是最好的；给定我的策略，你所选择的是最好的。关系：占优策略均衡是纳什均衡的一种特殊情况况，但纳什均衡却不一定是占优策略均衡。最大最小策略纳什均衡的概念是建立在博奕者理性行为基础之上的。而在有些博奕中博奕者的理性行为是有局限性的，这一局限性，使得某些博奕达不到纳什均衡。请看下面这个例子。（新产品，新产品）是一个纳什均衡，且是唯一的纳什均衡企业B无新产品有新产品无新产品企业A有新产品1,01,1-1000,02，1企业可能采用一种风险—厌恶策略，即最大最小策略，也就是在确保在最坏结果中得到最好的结果，即指博奕者所采取的策略是使自己能够获得的最小收入最大化最大最小策略的实施：首先确定每一种策略的最低收益；在最小值中选取最大值。在上面的例子中，如果博弈双方都采取最大最小策略，，就是（无新产品，新产品）。最大最小策略特点：非利润最大化，避免亏损过多。几种典型博奕模型及应用非合作性和合作博奕性别之战与公共标准的争夺重复博弈与序列博弈非合作性和合作博奕非合作性博奕：囚犯的困境非合作性博奕是指在这种博奕中博弈双方无法通过协商达成某种形式的用来约束彼此行为的协议。现实中的企业竞争通常是处于非合作性的博奕中。在有些情况下，非合作性博奕能够导致既非参与者也非社会所需要的结果。例囚犯的两难境地有两个犯罪嫌疑人A和B在校园里偷自行车时被逮捕，检察官将他们分别关在两处进行审讯。检察官对嫌疑人A说，“我们实行的是‘坦白从宽，抗拒从严’的政策，如果你们两个人都不坦白，你们都将被起诉判刑2年；如果你坦白了而他不坦白，那么你将只被判1年，他将被判8年；如果他坦白了而你不坦白，那么你判8年他判1年；如果你们两个都坦白，你们都将被从轻宣判。”当然，检察官对嫌疑人B说的话也是完全一样的。但实际上，如果两个人都坦白，却会因涉及更多的罪案而都被判刑5年。案犯B坦白不坦白坦白案犯A不坦白－5，－5－1，－8－8，－1－2，－2最可能出现的结局是两人都坦白，即(坦白，坦白)的结局。囚犯的困境反映了一个深刻的问题，即个人理性与集体理性的矛盾。每个人都以自身利益最大化为出发点进行决策，结果是不符合集体理性的。例2寡头垄断市场的价格竞争广告竞争假设一个市场中只有A、B两家企业，每家企业可采取的定价策略都是10元或15元，我们可用下面的收益矩阵来说明每种策略组合的结果。在矩阵中每一对数字，前一数字表示企业A可获得的利润，后一数字表示企业B能获得的利润，单位为万元。企业B10元15元10元企业A15元100,80180,3050,170150,120企业B少做多做少做企业A多做30，3010，4040，1020，20广告之战例3应用囚犯的两难境地适用于许多博奕场合。其中一个重要的例子就是前苏联和美国之间的军备竞赛。两个国家都在导弹花了几万亿美元，其能力足以毁灭对方几次。这些消费是有机会成本的，是以牺牲教育、住房建设、医疗保健等为代价的。但是谁也不愿意减少这方面的支出，因为怕对方会取得军事上的优势。合作性博奕合作性博奕是指在这种博奕中，博奕双方有可能彼此协商、签订协议，从而都有义务执行既定的策略。合作和非合作博奕之间的基本差别在于签订合同的可能性。在合作博奕中有约束力的合同是存在的，而在非合作博奕中他们是不可能的。女音乐会电影音乐会男电影2，10，00，01，2从上述得益矩阵中可以看到，分开将使他们两人得不到任何满足，只要在一起，不管是看电影还是听音乐会，两人都会得到一定的满足。但音乐会将使男的得到更大满足，看电影则使女的得到更大满足。在这样一个对局中，男的和女的最优策略依赖于对方的选择，一旦对方选定了某一项活动，另—个人选择同样的活动就是最好的策略。因此，如果男的已经买好了音乐会的门票，女的当然就不再反对；反之，如果女的已经买好了电影票，男的也就会与她一起去看电影。那么，在这个对局中是否存在均衡状态呢?容易看到，两人都去看电影即（电影，电影）是一种均衡状态。也就是说，在这种状态下，双方都不想再改变他们的策略。显然，完全类似地，（音乐会，音乐会）也是—种均衡状态。在市场竞争中，同样存在与性别之战类似的情况。『例』一对恋人准备在周末晚上一起出去，男的喜欢听音乐会，但女的比较喜欢看电影。当然，两个人都不愿意分开活动。不同的选择给他们带来的满足由上表表示。性别之战公共标准的争夺『例』20世纪90年代初，日本企业在高清晰度电视（HDTV）的发展方面居于领先地位。高清晰度电视技术将极大地改善电视图像的质量，并将成为未来的互动式电视传播方式的基础。但高清晰度电视的发展面临一个重大的战略问题，即如何确定世界范围的技术标准?日本企业已经有了它们的标准，这种标准被称为MUSE，而欧洲企业也在开发它们自己的技术标准。假定这两类企业的技术标准的策略选择将使它们得到如表所示的得益矩阵。上述得益矩阵可见，对日本企业来说，如果日本企业和欧洲企业都采用日本标准，它们获得最大得益；同样地，对欧洲企业来说，它们的最大得益也要求双方都采用欧洲标准。由此可见，协调对双方都非常重要，如果它们各自采用自己的标准，它们的得益都将远远低于采用同—种标准的情况。『表』高清晰度电视技术标准的争夺欧洲企业日本标准欧洲标准日本标准日本企业欧洲标准100，5030，200，060，90在这—对局中，我们也可以找到两个均衡点，即（日本标准，日本标准），或者（欧洲标准，欧洲标准）。也就是说，—旦—方选定了某种标准，另—方的最好策略就是采用与对方同样的技术标准。但问题是，双方对于采用何种技术标准的意见是完全对立的。或许我们会期望，两个均衡中总有—个会成为最终的结局，但实际情况是，日本与欧洲至今并未达成有关HDTV技术标准的协议，他们仍在各自发展自己的标准。美国的态度使这一问题进一步复杂化。美国联邦通讯委员会决定，美国的HDTV信号必须与美国现存的电视机相兼容。因此，美国企业也在发展它们自己的技术标准，而这一标准既不同于日本的技术标准，也不同于欧洲的技术标准。世界上最终能否实行一个统一的高清晰度电视技术标准，还是像电视机和录像机那样同时存在几十个制式被不同的国家采用，我们将拭目以待。中国的CVD与SVCD也存在着上述标准之争,最后用超级VCD重复博弈与序列博弈（一）重复博弈1、无限次重复博弈在前面的分析中我们看到，在寡头垄断市场中，企业在进行价格或产量决策时常常会发现自己处于囚犯的困境中，为了摆脱这种困境，企业之间可以合作，但是，合作常常因为履行协议不可能从而使合作瓦解。除此之外，企业还能找到其他方法脱离这种困境，从而使寡头之间的协调和合作能够成功吗？下面我们来分析这个问题。在现实中的大多数企业之间的竞争一般都将持续一个较长的时期，也就是说企业之间进行的是重复博奕，即反复进行多次的博奕。在博奕可以多次重复的情况下，竞争的结局是否会有所改变呢?对博弈的参与者来说，此时是否存在一种最好的策略呢?仍以企业的价格竞争这一博奕来作分析。如表那样.企业B低价高价低价企业A高价10，10100，-50-50，10050，50如果这个博奕可以一次次重复，例如企业A和企业B在每一周的第一天同时宣布价格，此时这个博奕会如何进行下去，企业会以什么样的方式进行这个博奕呢？在重复博弈的情况下，容易想象，企业在选择策略的时候不仅需要考虑当前的博奕，而且还需考虑当前选择的策略对于以后的博奕将产生怎样的影响。美国密执安大学教授罗伯特·阿克赛罗对无限次重复博弈进行了系列研究，他曾邀请博弈理论家就案犯的困境问题提出他们各自能想到的以重复方式进行这个博奕的最好策略，然后，用计算机模拟的方式来决定哪种策略将是最好的策略。有14位来自经济学、心理学、政治学、社会学和数学领域的博弈论专家提交了程序。阿克赛罗让这些程序及一个随机程序进行循环赛，重复了5次，总共进行了12万次对局。结果令人吃惊，获胜的程序就是最简单的程序：“以牙还牙”。这一程序以合作的策略开始，以后每一次的选择都只是模仿对方上一次的选择。其后，阿克赛罗公布了第一次竞赛的结果，并再次征集新的程序。这一次他收到了62个程序，许多程序设计复杂而精巧，还有的程序是对“以牙还牙”策略的改进。但第二次竞赛的结果与第一次一样，获胜的仍然是最简单的原则：“以牙还牙”。在企业的价格竞争中，这一策略意味着：在第一次博奕中，企业应选择高价策略。如果对方在第一次选择高价，你也就选择合作:定高价；如果对方在第一次选择低价竞争，你就在第二次也降价竞争。只要对方在某一次降价竞争，你就马上选择降价作为报复；反之，如果对方保持“合作”的态度，你也就一直合作下去。为什么这种以牙还牙策略的结果是最好呢？特别是企业用了以牙还牙策略就能促使他的对手进行合作吗？设该博奕是无限重复的。也就是说，我的竞争者和我的每周定价要永远重复进行下去。这时合作行为是对以牙还牙策略的理性反应。设想在某周中我的竞争者定了一个低价，即降价与我竞争，因而在这个周中获得较大的利润，但该竞争者也知道下个周我也会降价，从而它的利润就会下降，并且只要我们俩一直都定低价就一直将是低价。由于该博奕是无限重复的，所导致的累计损失必然会超过第一个周降价所得到的短期利润。因而降价竞争是不明智的。事实上，在一个无限重复博奕中，

竞争与博弈论

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

XXXX年最新功能分类科目电子档

江西省农村中小学现代远程教育工程

01-网络通信技术基础

运用合作游戏

XXXX年(上)横山中学第一学月质量检测

广西桂林市国美电器圣诞狂欢促销活动策划案(doc 17)

中美风险投资比较分析

XX投资股份公司质量管理质量文件汇编(原件）（DOC 156页）

莲花山煤矿安全培训管理制度汇编

投递系统日常操作流程介绍讲义

相关文档

相关搜索