您好,欢迎访问三七文档
博弈论及经典案例+比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。+比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。+在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。假如你正在和朋友用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的朋友拨电话过来?很显然,你是否应拨电话过去,取决于你的朋友是否会拨过来。如果你们其中一方要拨,那么另一方最好是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。*在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖博弈无处不在石头、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石头剪子布博弈方2石头剪子布博弈方1老虎鸡虫杠子老虎鸡虫杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,0博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义所以,一个比较有效的学习方法是重复博弈论简介+博弈论(GameTheory)又名对策论,游戏论–博弈论,英文为Gametheory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。–博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。–博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。博弈论研究对象博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。冲突、竞争现象的定量分析理论。参加竞争的各方为了获胜而需研究出一组对付对方的策略。博弈论的产生和发展(1)我国古代围棋、国际象棋(印度)等;(2)1912年,数学家翟墨罗把对策从模拟模型抽象为数学模型;(3)第一次、第二次世界大战,军事对策应用于战役和战略研究;(4)1944年,冯·诺意曼、摩根斯特合写了“博弈论和经济行为”,推动了博弈论在经济管理中的应用;(5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖(1994),进一步推动了博弈论的研究。博弈论的产生和发展《学弈》(《孟子•告子》):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若之矣。为是其智弗若与?吾曰:非然也。1.博弈在中国博弈又称博戏,是一门古老的游戏。《世本》说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战1943年,冯·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。2.博弈论的开山之作二、基本概念1.局中人或参与者(Players)2.规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。3.策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。4.相机策略(contingentstrategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。5.行动:局中人在特定条件下的行为6.支付(Pay-off):博弈结束时,各方得到的收益。7.策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的上策与上策均衡所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。而当对局者选择的都是上策的时候,这种均衡叫做上策均衡所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。纳什均衡纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。上策均衡与纳什均衡的区别:⑴上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。⑵纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。⑶上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。纳什均衡的意义所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问在这场博弈中A的最优策略。故事模型B(80%)C(100%)A:30%分析过程A的行动选择集合(1)对空发射,(2)射B,(3)射C如A对空发射,B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击(A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率为0.2*0.3=0.06。总体存活概率41.2%。概率树工具A射空B射死C0.8B未射死C0.2A射死B0.3A未射死B0.7B射A不中0.2A射死C0.3A未射死C0.7C射A不中0对空发射:存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%A可以采取的行动向C发射:存活概率为0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4%向B发射:存活概率为0.7×41.2%=28.84%再说三个枪手A和B似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。再说三个枪手在这个“同盟”里,最忠诚的是B——只要C不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。B是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲B换取下次自己的先手之利。除了压力较小之外,而且还有一个动力驱使A背叛,那就是一旦干掉C后,B的机会比他要大,他至少要保持先下手,才可能一争高下。诸葛亮在《隆中对》中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟。三国中的博弈——联吴抗魏所以,弱者总是有动力去维持一个稳定的三角形结构:与次强者联盟,但是却不愿真正消灭强者。火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何还将捉曹重任交给关羽?三国中的博弈——华容道结论:诸葛亮并不想杀掉曹操——曹操一死,刘备亦亡矣!有人会问:既然放操,为何又设三重拦截?如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看其威胁到的人。现实例子:总统竞选,实力最弱的开始时总是表现低调,实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的竞选者粉墨登场。“功高震主”“木秀于林,风必摧之”一个对他人利益不构成威胁的人,自然不会是他人意欲除掉的对象,反而能在各种政治风云中幸存下来。能力最强,本事最大的人,反而最有可能走向悲剧结果。C的存活概率只有14%。能力处于中间状态的,是最可能存活的。B:56%能力最弱的,也可以比最强者有更大的生存机会。A:41.2%。三国中的博弈-孙刘联盟的瓦解孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。三国中的博弈-孙刘联盟的瓦解如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),他自己也险些在逍遥津送命。可从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手A突然翻脸向B开火。坐收渔利的当然是C。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到A的地位,就该以A的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。三国中的博弈-孙刘联盟的瓦解面对诸葛亮的空城,司马懿真的是不敢攻城吗?三国中的博弈——空城计非也!正是因为诸葛亮的存在,才使曹魏对其有所依赖。一旦诸葛亮倒下,也就是他被逐出朝廷甚至迫害的日子。“兔死狗烹”即使这个道理。既然“兔死狗烹”,那么猎狗最好不要让兔子全部死掉。公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。囚徒困境模型两人因盗窃被捕,警方怀疑其有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人
本文标题:博弈论及经典案例
链接地址:https://www.777doc.com/doc-5827853 .html