您好,欢迎访问三七文档
第七章竞争型决策分析博弈论(gametheory)是由美国数学家冯·诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。博弈论是一门十分有趣但理论上又是十分艰深的学问,我今天打算用一些大家能够凭直观或简单分析就能把握的例子为同学们介绍博弈论的基本概念及应用。“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”——保罗·萨缪尔森什么是博弈论?博弈论是研究理性的决策者之间的冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。什么是博弈?博弈是指代表不同利益主体的决策者,在一定的环境条件和规则下,根据所掌握的信息,同时或先后、一次或多次从各自允许选择的行动方案中加以选择并实施,从而取得各自相应结果的过程。田忌赛马-续篇古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1千金给赢方。双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下。实际上,田忌的上马、中马要优于齐威王的中马、下马。比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛。这个案例生动地告诉我们,巧妙地运用策略是多么的重要。但是,事情并没有结束,齐威王也很聪明,他利用各种手段,很快明白了自己输掉比赛的原因而及时地调整了自己的对策。这样,齐威王与田忌的赛马也就成了一个具有策略依存特征的决策较量,构成了一个典型的博弈问题如果把赢一千金记成收益1,输一千金记成收益为-1,则齐威王和田忌在各种策略组合下的收益如下表所示:田忌赛马-续篇上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3齐威王田忌田忌赛马-续篇田忌赛马-续篇在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1千金,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故博弈的要素1、参与人:是指博弈中独立决策、独立承担结果的决策主体。他们可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人,而只能当做环境参数来处理。如指手划脚的看牌人、看棋人,企业的顾问等。博弈的要素2、策略指每个博弈方在进行决策时可以选择的方法、做法等,策略有纯策略和混合策略之分。纯策略指参与人在博弈中可以选择采用的行动方案,混合策略是在纯策略空间上的一种概率分布,表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。博弈的要素3、支付:每个博弈方从各种策略组合中获得的收益或效用,它是策略组合的函数,所以也称支付函数记为ui(s)。ui(s)=ui(s1,s2…,si,…sn-1,sn).博弈的要素4、博弈方的信息信息是博弈参与方有关其他博弈方的策略、收益等知识。5、博弈的次序规定一个博弈就必须规定其次序,不同的次序是不同的博弈。6、结果和均衡结果指博弈中博弈方的行动所产生的每一可能情形。博弈的分类一、按参与方数目:1、单人博弈2、两人博弈3、多人博弈博弈的分类二、按各博弈方可选策略数量的多少1、有限博弈2、无限博弈博弈的分类三、按参加博弈的各个博弈方从博弈中所获得的利益总和1、零和博弈2、常和博弈3、变和博弈博弈的分类四、按参与人行动的先后顺序1、静态博弈2、动态博弈博弈的分类五、按参与人所掌握的信息1、完全信息博弈2、不完全信息博弈行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾(1975)博弈的分类-综合划分第二节完全信息静态博弈一、占优战略均衡二、重复剔除的占优战略均衡三、纳什均衡一、占优战略均衡不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstrategies)。占优战略均衡只要求所有的参与人是理性的,而并不要求每个参与人知道其他参与人也是理性的。因为,不论其他参与人是否理性,占优战略总是一个理性参与人的最优选择。1.囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑5年;若两人都不招则未获证据但因私入民宅各拘留1年。一、从“囚徒困境”谈起甲和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。局中人所选择的战略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。表1囚徒困境博弈乙招不招招甲不招(问题1:甲、乙如何选择?)-5,-50,-10-10,0-1,-1对甲来说,尽管他不知道乙是选择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。表1囚徒困境博弈乙招不招招甲不招-5,-50,-10-10,0-1,-1甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。总结囚徒困境反映了一个深刻的问题,这就是个人追求最大自身利益的行为,常常并不能导致实现社会的最大利益,也常常不能真正实现个人自身利益的最大化。我们可以利用这个道理来分析日常生活中的许多不合作现象。2.生活中的“囚徒困境”例子例子1:商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。例子2:为什么要加入WTO?WTO是一个自愿性申请加入的自由贸易联盟,即WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。二、重复剔除的占优战略均衡严格劣战略:是指无论其他博弈参与人采取什么战略,某一参与人的相对不利战略是唯一的。1.智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。表4给出这个博弈的支付矩阵。二、智猪博弈:对诸多经济现象的解释表4智猪博弈小猪按等待按大猪等待5,14,49,-10,0这个博弈没有“剔除劣战略均衡”,因为大猪没有劣战略。但是,小猪有一个劣战略“按”,因为无论大猪作何选择,小猪选择“等待”是比选择“按”更好一些的战略。所以,如果小猪是理性的,小猪会剔除“按”,而选择“等待”;大猪知道小猪会选择“等待”,从而自己选择“按”,所以,可以预料博弈的结果是(按,等待)。这称为“重复剔除劣战略的占优战略均衡”,其中小猪的战略“等待”占优于战略“按”,而给定小猪剔除了劣战略“按”后,大猪的战略“按”又占优于战略“等待”。总结在寻找智猪博弈的均衡解时,我们的做法可归纳如下:1、首先找出某一博弈参与人的严格劣战略,将它剔除掉,从新构造一个不包括已剔除战略的博弈;2、然后继续剔除这个新的博弈中某一参与人的严格劣战略;3、重复进行这一过程,直到剩下唯一的参与人战略组合为止。这唯一的参与人战略组合,就是这个博弈的均衡解,称为重复剔除的占优战略均衡。生活中的智猪博弈例子1:股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息、预测股价走势,但大量散户就是小猪。他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓“散户跟大户”的现象。例子2:为何股份公司中的大股东才有投票权?在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,不会直接花精力去监督经理,因而没有投票权。例子3:为什么中小企业不会花钱去开发新产品?在技术创新市场上,大企业是大猪,它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。三、纳什均衡纳什均衡(Nashequilibrium)是指这样一种策略组合,这种策略组合由所有参与人的最优策略组成,也就是说,在给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡。情侣博弈大海和美凤正在热恋中,难得的周末又到了,安排什么节目好呢?大海是个超级球迷,周末晚上,中国足球队要在世界杯外围赛中和伊朗队做生死之战。而美凤从小练习芭蕾,对斯拉夫民族的芭蕾艺术崇拜的五体投地,这周末是正宗俄罗斯芭蕾舞剧《胡桃夹子》的谢幕演出,怎么办?我说,一个在家看电视直播的足球,一个去剧院看芭蕾演出不就得了?问题是他们是热恋中的情侣,分开各自度过这难得的周末时光,才是他们最不乐意的事情,于是他们就面临一场温情笼罩下的博弈(见下图)情侣博弈女方足球芭蕾男方足球3,10,0芭蕾0,01,3情侣博弈在情侣博弈中,双方都没有严格优势策略和严格劣势策略,芭蕾不是大海的劣势策略,因为如果美凤坚持芭蕾,他选足球只得0,选芭蕾还可以得1。足球当然更不是大海的劣势策略。所以,大海没有全面的劣势策略。同样,美凤也没有全面的劣势策略。这样,严格劣势策略消去法就没有用武之地了!情侣博弈纳什均衡就是解决这类问题的良方,我们只须关心一种双方的“相对优势策略”的组合。在情侣博弈中,双方都去看足球或者双方都去看芭蕾,这就是我们所说的相对优势策略的组合:一旦处于这样的位置,双方都不想单独改变策略,因为单独改
本文标题:决策理论与方法
链接地址:https://www.777doc.com/doc-613942 .html