您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 博弈论中的囚徒困境在生活中的应用
博弈论中的囚徒困境在生活中的应用囚徒困境最早出现在1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相“背叛”),则二人同样判监2年。如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:(1)若对方沉默、背叛会让我获释,所以会选择背叛。(2)若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。一,囚徒困境之于异地恋异地恋成功率很低,如果一个事件大量发生,那么我们视之为一个大概率事件,不是偶发事件,或者就可以叫一种现象。尽管很多人认为这是感情问题,但是感情问题是感性问题,感性问题不足以解释现象,那么造成这种现象的原因可以用博弈论中的囚徒困境来解释。那么异地恋同样可以视为一组囚徒困境假设一:分开两地(距离较远)的情侣视为甲、乙两人假设二:甲乙两个都是经济人假设三:甲乙两个人由于分开两地无法完全了解对方的选择,即信息具有不透明性甲乙的两个选择:坚守、放弃选择A:若甲乙都选择不顾时间长短和地理的距离,都选择坚守,那么甲乙情侣关系维持,之前的时间和异地造成的机会成本没有浪费,对甲乙来说得利最大选择B、C:若某一方率先选择放弃,找到新欢再抛弃另一方,那么这一方的机会成本会为新的得利(找到新欢)的得利收获所弥补,但另一方在这组博弈中得利为0,之前投入的机会成本全部变为沉没成本。选择D:若两方同时选择放弃,那么两方的机会成本都变为沉没成本。在四组选择中,A选择似乎是对两人的最优选,但是由于假设条件的存在,信息的不透明性会导致甲乙选择的结果大多不会是A,由于担心对方选择放弃,导致自己的机会成本变为沉没成本,在面临优选的时候,甲乙很容易形成选择BCD的局面。在这个博弈中有两个变量,就是分开的地理位置的长短以及分开的时间的长短,这两个变量直接影响了最后的选择,时间、距离越长,造成BCD的局面的可能性也更加大。实际上在囚徒困境中,双方互不背叛的得利比互相背叛的大,但是由于利己性的存在,两个一般都选择互相背叛。如果一方选择背叛另一方,而另一方不变,那么背叛方就得利了,而坚守的一方损失了。也就是说,是如果保持静态均衡,就是两个人同样不选择背叛对方,那么均衡就可以保持。如果一方先打破均衡,那么他就是得益方,而另一方就是受害方。假设人是利己的,那么两个人都有可能趋向于背叛对方。博弈论的结论如何是根据概率而来的,要么就是一般性的结果。概率是根据大量观察实验做出的,很多“特殊”情况就被忽略了。
本文标题:博弈论中的囚徒困境在生活中的应用
链接地址:https://www.777doc.com/doc-4934511 .html