您好,欢迎访问三七文档
第十章博弈论与竞争策略博弈论,又名对策论,它是用来扩展和深化对厂商决策行为的分析的。博弈论的应用是微观经济学的重要发展。第一节:博弈的基本要素与分类第二节:完全信息静态博弈第三节:完全信息动态博弈第四节:不完全信息博弈:静态与动态分析•“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”-保罗-萨缪尔森2004年2月10日•“虽然博弈论是作为数学的一个分支出现的,但是它在军事、政治、经济许多方面都有很多重要的运用,其中以在经济学内的运用最多也最为成功。”-泽尔腾1994年诺贝尔经济学奖获得者博弈论的诞生•1944年,由约翰.冯.纽曼和摩根斯坦恩合作撰写《博弈论和经济行为》一书出版,宣告了博弈论的诞生。•1950-1951,约翰.纳什发表了两篇关于非合作博弈的重要文章,塔克定义了“囚徒困境”的经典例子。奠定了非合作博弈论的基石。•1994年,诺贝尔经济学奖授予了三位博弈论专家:纳什、泽尔腾和海萨尼。标志着博弈论在经济学中的地位正式得到承认。博弈论美藉匈牙利数学家冯·诺依曼(JohnVonNeuman)和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于普林斯顿大学,他们于1944年出版了经典著作《博弈论与经济行为》,为现代博弈论的发展奠定了基础。美国的数学家、经济学家纳什(JohnNash),美籍匈牙利经济学家海萨尼(JohnC.Harsanyi)和德国经济学家泽尔滕(R.Selten)因对博弈论的卓越贡献而获得1994年度的诺贝尔经济学家。海萨尼纳什值得一提的是纳什,他发表奠定其在博弈论中重要地位的学术论文时,年仅22岁,被人称为“一个天才”。1959年,纳什被精神病医生诊断为“妄想性精神分裂”,饱受精神病折磨40余年。泽尔滕博弈论是分析企业和个人行为的一个重要工具,在分析企业与企业或个人与个人之间的互动的时候尤为重要。博弈论(gametheory)研究企业或个人(agent)的策略行为(strategicbehavior),这些策略行为取决于其他企业或个人的行动(action)互相依存又互相影响。博弈论工具的作用非合作博弈(non-cooperativegame):在非合作博弈中,不存在通过谈判协商(negotiation)或有约束力的合约(bindingcontract)的方式限制局中人的行为。我们这里讨论的一般为非合作博弈合作博弈(cooperativegame):在合作博弈中,局中人通过谈判一个有约束力的合约来实现其联合策略。博弈论工具的作用博弈论可以帮助我们分析存在两个或数个行为主体时的最佳策略。如分析在存在寡头垄断时一个企业的行为,以及不同企业行为之间的相互影响。博弈论应用的例子包括对寡头垄断行为的分析,对外部性的分析,对军事策略的分析,等等。博弈论工具的作用博弈论工具的作用例:“HowtowinFriendsandInfluencePeople”(DaleCarnegie,1936)1.Showrespectfortheotherperson'sopinions.2.Gettheotherpersonsayingyes,yesimmediately.3.Lettheotherpersondoagreatdealofthetalking.4.Lettheotherpersonfeelthattheideaishisorhers.5.Tryhonestlytoseethingsfromtheotherperson'spointofview.6.Besympatheticwiththeotherperson'sideasanddesires.博弈论工具的作用例:“Nash’sBargainingSolution”Youwillnegotiatewellwhen:–Youseemmorewillingtoriskconflict–Concessionswouldhurtyoualot–Youhavelesstolosefromconflict–YoucanmakecredibleTHREATS一个完整的博弈包括以下要素:局中人(players):两个以上。规则:谁在什么时候行动?如何行动?每个局中人有至少两个以上可供选择的策略(strategies)。得益:每个可能的策略都有一个相应的报酬(payoffs)。基本假设:局中人偏好于报酬高的结果。博弈论要素(二)单人博弈、双人博弈和多人博弈(三)有限策略博弈和无限策略博弈(四)零和博弈、常和博弈与变和博弈1.零和博弈2.常和博弈3.变和博弈:不同策略组合下各博弈方的得益之和不相同。(五)静态博弈和动态博弈1.静态博弈:是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。2.动态博弈:是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、行动的博弈。博弈论分类作为博弈论的介绍,我们主要讨论两人博弈(two-playergame)模型,即每个博弈只有两个局中人。同时,我们也假设每个局中人只有两个可供选择的策略。两人博弈模型我们将两个局中人叫做A和B。A有两个(策略)选择:上(up)或下(down)。B有两个选择:左(left)或右(right)。说明:(1)A和B的策略选择可以相同也可以不同;(2)每个策略选择可以被看作是一个投资决定或者利益分配计划。两人博弈的一个例子两人博弈的一个例子(续):两个局中人,每个局中人各有两个选择,结果有四个不同的策略选择组合:上左,上右,下左,下右。每个策略组合中,每个局中人的报酬已知,见下页报酬矩阵(payoffmatrix)或一般形式(normalform)。Thisisthegame’spayoffmatrix.PlayerBPlayerA通常的表达方式是,第一个局中人的报酬在前,第二个局中人的报酬在后。LRUD(3,9)(0,0)(1,8)(2,1)得益矩阵UDLLRR(3,9)(1,8)(0,0)(2,1)ABB报酬矩阵也可以用展开式(extensiveform)或树形图(treediagram)来表示。博弈论的扩展式信息集(informationset)决策结(decisionnode)信息集(informationset)表明了哪一个局中人应该作决定,并且个局中人作决定所掌握的信息。充分信息(perfectinformation):一个信息集里只有一个决策结。不充分信息(imperfectinformation):一个信息集有多个决策结。局中人不能区分其作决策时位于哪个决策结。博弈论的信息集一个展开形式肯定有唯一相对应的报酬矩阵;但一个报酬矩阵可能反映多个展开形式。如下面两个不同的展开形式有相同的报酬矩阵。报酬矩阵与展开形式之间的关系前面我们讨论了一个博弈的表达形式。现在我们来解这个两人博弈,即每个局中人的最佳策略是什么?我们还是用前面的那个例子。纳什均衡E.g.ifAplaysUpandBplaysRightthenA’spayoffis1andB’spayoffis8.Thisisthegame’spayoffmatrix.PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)纳什均衡AndifAplaysDownandBplaysRightthenA’spayoffis2andB’spayoffis1.Thisisthegame’spayoffmatrix.PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerA两个局中人的策略组合表示为(U,R),括号中第一个字母是A选择的策略代码,第二个字母是B选择的策略代码。LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡这个博弈的结果会是什么样的呢?PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIs(U,R)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIfBplaysRightthenA’sbestreplyisDownsincethisimprovesA’spayofffrom1to2.So(U,R)isnotalikelyplay.Is(U,R)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIs(D,R)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIfBplaysRightthenA’sbestreplyisDown.IfAplaysDownthenB’sbestreplyisRight.So(D,R)isalikelyplay.Is(D,R)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIs(D,L)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIfAplaysDownthenB’sbestreplyisRight,so(D,L)isnotalikelyplay.Is(D,L)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIs(U,L)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡PlayerBPlayerAIfAplaysUpthenB’sbestreplyisLeft.IfBplaysLeftthenA’sbestreplyisUp.So(U,L)isalikelyplay.Is(U,L)alikelyplay?LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡纳什均衡(NashEquilibrium):如果给定B的策略选择,A的选择是最佳策略(optimalstrategy);同样地,给定A的选择,B的选择也是最佳的,这样的策略组合就叫做纳什均衡。纳什均衡NashEquilibrium:–“I’mdoingthebestIcangivenwhatyouaredoing”–“You’redoingthebestyoucangivenwhatIamdoing.”纳什均衡在我们前面的例子中,存在两个纳什均衡:(U,L)和(D,R)。如果A选了上,B会选左;如果A选了下,B会选右。反过来,B选左,A会选上;B选右,A会选下。说明:在这个博弈中,A和B的选择是同时进行的。纳什均衡PlayerBPlayerA(U,L)and(D,R)arebothNashequilibriaforthegame.结论:一个博弈中可能存在多个纳什均衡。LRUD(3,9)(0,0)(1,8)(2,1)纳什均衡事实上,在上个例子的两个纳什均衡中,两个局中人都倾向于(U,L)这个均衡,因为这个均衡为两者带来的报酬都较高,我们把它叫做帕累多偏好均衡(Pareto-preferredequilibrium)。问题是这两个局中人会不会肯定同时选(U,L)呢?纳什均衡在回答前面这个问题之前,我们再看一个例子,这就是著名的囚犯困局(theprisoner’sdilemma)。这个例子是这样的,两个嫌疑犯同时被捕,并被隔离审问。这两个囚犯都有两个选择:坦白(confess)还是不坦白(deny)他们的罪行。问题是:在互相不知道对方的选择的情况下,应该坦白还是不坦白呢?囚犯困局(Prisoners’Dilemma)模型•规则1:隔离审讯•规则2:假如两人都招供,各判5年有期徒刑假如只有一个人招供,招供者免于刑罚,不招供者判8年有期徒刑假如两人都不招供,各判1年这一案例可由下面得益矩阵来直观地表示。支付矩阵囚徒乙交代D不交代C交代D-5,-50,-8不交代C-8,0-1,-1囚徒困境的得益矩阵囚徒甲乙甲(-5,-5)(0,-8)(-8,-
本文标题:博弈论-(1)
链接地址:https://www.777doc.com/doc-4645203 .html