您好,欢迎访问三七文档
初晓博弈理论的概念知识;认识繁复纷乱的社会现象;分析经营管理的实践案例;和谐错综复杂的人际关系;提高思维决策的能力水平。著名经济学家保罗.萨缪尔森:要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。保罗.萨缪尔森两条路在树林里分叉,而我选择人迹罕至的那一条,从此一切变了样。博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。汉语:“游戏”;game在英语的意思是人们遵循一定规则下的活动,进行的目的是使自己“赢”。奥林匹克运动叫OlympicGame。在英语中,game有竞赛的意思,进行game是很认真的,不同于汉语游戏的概念。在汉语中,游戏有儿戏的味道。因此,将关于game的理论,即gametheory翻译成博弈论或者对策论。“博彩”“弈秋”《学弈》(《孟子•告子》):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化博弈理论开始于1944年由冯·诺依曼VonNeumann和摩根斯坦恩Morgenstern合作的《博弈论和经济行为》(TheTheoryofGamesandEconomicBehaviour)一书的出版。JohnNashJohnHarsanyLeihadenSelten•泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”•海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型RobertAumannThomasShelling1.局中人或参与者(Players)2.规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。3.策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。4.相机策略(contingentstrategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。5.行动:局中人在特定条件下的行为6.支付(Pay-off):博弈结束时,各方得到的收益。7.策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。上策均衡我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的NASH均衡我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。而当对局者选择的都是上策的时候,这种均衡叫做上策均衡所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。上策均衡与前面的均衡的区别:第一,完全竞争、垄断竞争等市场结构中最终实现的均衡状态都是在假定厂商是追求最大利润的,而且厂商在均衡状态也实现了最大利润第二,在上述几种竞争模式中,可供厂商选择的竞争策略也相对较少。上策均衡是博弈均衡的一种特殊状态。均衡是经济学中的重要概念。均衡即是平衡的意思,英文是:equilibrium。在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去。此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之均衡产量。均衡分析是经济学中的重要分析。纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。上策均衡与纳什均衡的区别:⑴上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。⑵纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。⑶上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。合作博弈:研究人们达成合作时如何分配合作得到的收益,即收益分配问题。非合作博弈:研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息;反之,则称为不完全信息。静态博弈和动态博弈静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。•第一节理性与策略•第二节故事中的博弈论25•《三国演义》中的博弈论•博弈是互动性的决策•一个博弈论实验:因人而异的理性程度•不是博弈论的故事2728•博弈论——“互动性的策略运用”•大西洋海战•珍珠港事件•GameTheory——“游戏理论”•下棋和玩牌29•IBM——深蓝与卡斯帕罗夫•人类的直觉•直觉与理性之间的关系•进化博弈论•博弈论是最近40年来在经济学中运用的最广泛和最深刻的分析工具之一30•邀请10名志愿者,让他们每人在一张纸条上写下0-100中的某个整数,同时交出1元钱,写的数最接近所有人写的数的平均值的一半的人可赢得其他人的钱。如果有多名实验者同时成为获胜者,则平分奖金。313233•战略中的策略行为——“俾斯麦海战”•囚徒困境•运用囚徒困境设计的锦标赛提升制度35•俾斯麦海海战(BattleofBismarckSea)是1943年3月2日至3日,为了阻止日本联合舰队运送第51师团增援莱城,盟军西南太平洋航空兵在乔治·丘吉尔·肯尼的指挥下,以110架轰炸机,50艘战斗机对在俾斯麦海对木村昌福指挥的日本运输船队进行水平跳弹攻击。36•美军只付出了6艘飞机的代价,就击沉了日本全部8艘运输船,8艘护航驱逐舰中的四艘,7000日军中只有800人赤裸裸的游泳到莱城,3000人淹死,其余3000人被救起返回。这次海空战是日本在新几内亚战争的转折点,日军大本营称之为俾斯麦海峡的悲剧。37日本海军北部航线南部航线美国空军北部航线2,-22,-2南部航线1,-13,-33839•囚徒困境(prisoner'sdilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。40•囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。41•然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。42•但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。43B坦白抵赖A坦白-8,-80,-10抵赖-10,0-1,-144•述例子可能显得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,将结果划成同样的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模拟生物面对无止境的囚徒困境博弈。囚徒困境可以广为使用,说明这种博弈的重要性。45B努力不努力A努力-2,25,1不努力1,53,346•第一节理性与策略•第二节故事中的博弈论47•占优策略•劣策略•一阶理性•囚徒困境48•试举出一个你知道的,可以用“囚徒困境”来解释的其他例子;49A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问在这场博弈中A的最优策略。故事模型B(80%)A:30%C(100%)A的行动选择集合(1)对空发射,(2)射B,(3)射C如A对空发射,B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击(A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率为0.2*0.3=0.06。总体存活概率41.2%。概率树工具A射空B射死C0.8B未射死C0.2A射死B0.3A未射死B0.7B射A不中0.2A射死C0.3A未射死C0.7C射A不中0对空发射:存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%A可以采取的行动向C发射:存活概率为0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4%向B发射:存活概率为0.7×41.2%=28.84%•A和B似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。•这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。•但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。•在这个“同盟”里,最忠诚的是B——只要C不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。•B是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲B换取下次自己的先手之利。•除了压力较小之外,而且还有一个动力驱使A背叛,那就是一旦干掉C后,B的机会比他要大,他至少要保持先下手,才可能一争高下。
本文标题:1何为博弈
链接地址:https://www.777doc.com/doc-3025445 .html