您好,欢迎访问三七文档
博弈论(GameTheory)——科学地参与竞争当我们对社会发展和人类竞争的内涵进行概括的时候,可以用一个简单的字眼来表达——博弈。博弈学可以说是在研究社会中人和人、人和制度间的“勾心斗角”,探究数以万计的人打着各自的算盘做出决定之后所造成的群体现象。博弈从未远离过我们的生活,而且可能发生在更宽广的范围……什么是博弈?博弈论的基本预设:——人都是理性的游戏:三个火枪手的决斗游戏规则:假定你们是3个决斗的枪手,每人一把枪,枪里只有一发子弹,并假定你们的命中率为100%,而你们每人的目标是:尽量使最少人活着。即:最优结果:其他枪手都被打死,自己活着;次优结果:有一个枪手活着,自己也活着;三优结果:三人同归于尽;最差结果:自己被打死,其他人一个或两个活着。问题:当仲裁人说开始时,枪手开枪还是不开?思考:如果仲裁人对其中一个枪手说:给你一个机会,让你先开枪,你可以瞄准其他枪手,也可以有另一个选择,即对空中开枪,你会如何选择?如果先开枪的枪手选择朝空中开枪,其他枪手又会如何抉择?教室中有一群孩子。其中有几个孩子脸上有泥巴。这些孩子能够看到其他孩子脸上是否有泥巴,而看不到自己脸上是否有泥巴。老师进教室对他们说:“你们中有人脸上有泥巴,知道自己脸上有泥巴的人请举手。”游戏:谁的脸上有泥巴?问:当老师重复询问多少遍,才有孩子举手说“知道”,并且有多少个孩子同时举手?“脸上有泥巴的孩子”之谜(MuddyBoyPuzzle)结论:掌握的信息越多越有利于决策囚徒困境——prisoners’dilemma两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小偷从律师那里得知:如果两人都坦白,将被各判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其中一人坦白另一人抵赖,坦白的将会得到宽大处理而被无罪释放,而抵赖的将被重判,判刑6年。问:两个小偷将会如何选择?给出“囚徒困境”博弈问题的数学模型描述:-4,-40,-6-6,0-1,-1小偷2小偷1坦白抵赖坦白抵赖表格的行和列,分别代表参与对策的双方可能采用的策略。而单元格中的数字则代表对策者的盈利。这样的表格称为(对策者的)盈利矩阵。总结这是“非合作博弈”的典型模式。代表了处于相同困境状态下,不同的人面对同样的几种选择,最后必将背叛其他人,作出最利于自己的选择的一种情况。一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。双方都坦白是他们作出的稳定决策。虽然都抵赖是更好的选择,但任何一方都不会单独改变策略。Nash均衡——谁都不能改变策略在一组策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他单独改变策略,他的收益将会降低。这种情况称为“Nash均衡”。Nash均衡是稳定结果,但不是最优结果。从“囚徒困境”中获益厂商的价格大战(彩电大战、冰箱大战……)在价格博弈中,企业与企业之间,很多情况下与困境中的囚徒所遇情形一样,只要以对方为敌手,那么不管对方的决策怎样,自己总是采取低价策略会占便宜,这就促使双方都采取低价策略。价格战的结果:谁都没钱赚。OPEC的合作问题——通过“合作”可以破除“囚徒困境”OPEC石油输出国组织的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。问题:这样的合作牢靠吗?思考与实践找出你身边的一、二个竞争现象(如体育比赛团体赛排阵,商业竞争,棋牌游戏等等),列出竞争者的盈利矩阵,寻找Nash均衡。如何做能改变“囚徒困境”中的双方都坦白的困境?二人零和纯策略对策及其最优解新几内亚战役历史背景:1943年2月,第二次世界大战新几内亚战争处于关键阶段,日本决定从新不列颠附近的岛屿调派援兵。日方:日本运输船可以沿新不列颠北侧航行,但是可能会遇上下雨,能见度也较差;或者沿岛屿的南侧航行,天气会比较好。日本军事指挥部希望运输船暴露美军攻击火力下的时间尽可能少。美方:希望轰炸日军船队的天数达到最大,但是美军没有足够的侦察机兼顾南北两条路线,只能将大量的侦察机集中在南部或者北部路线上。问题:日方和美方各自应该选择哪条路线?盈利矩阵单元格中的数字(估计出的留给美空军轰炸日军船队的天数)代表了行对策者(美军)的盈利。此外可以加上一个数字代表对策者(即日军)的盈利。比如说,如果肯尼将军的盈利是3,代表美军轰炸日军的天数为三天,则日军的盈利为-3,代表日军遭到轰炸的天数为3天。这样双方盈利正好相反的对策称为零和对策。最优解的确定最佳原则:局中人希望使其安全程度最大化的最大最小原则。美军:若选择侦察北部,则最坏的结果是两天空袭;选择侦察南部,最坏的结果是只能空袭一天。两种策略的安全程度,即为矩阵中每一行中元素的最小值。如图中最右边的两个数字2,1所示。美军侦察北部策略的安全程度(值2)比侦察南部的的安全程度(值1)要高。为了使其安全程度最大,应该侦察北部。由于它对应于取每行元素最小值的最大值的结果,所以称为最大最小策略。日军:每种策略的安全程度如图下方的数字所示。由于对策双方的得失恰好相反,因此美军盈利越大时,日军盈利就越少。为了使其安全程度最大,日军应该选择沿北侧航行。因为这个选择是必取每列最大值中的最小值所对应的策略,所以称为最小最大策略。注意:两位局中人的最大最小策略和最小最大策略导致的结果相同。当这种情况发生时,此最大最小和最小最大策略称是Nash均衡的。在具有Nash均衡的零和对策中,和均衡点相对应的的一对策略被认为是最优策略。历史事实对策双方都选择了与均衡结果相对应的最大最小和最小最大策略,从而使各自的安全程度最大。日军决定让船队沿新不列颠岛的北侧航行,而美军将侦察机集中侦察岛的北面。结果日军护卫队遭受到两天的轰炸。思考与实践找出你身边的一、二个竞争现象(如体育比赛团体赛排阵,商业竞争,棋牌游戏等等),列出竞争者的盈利矩阵,寻找Nash均衡点或其最优解。如何做能改变“囚徒困境”中的双方都坦白的困境?“新几内亚战役”中的日方还能找到更好的选择么?
本文标题:11博弈论
链接地址:https://www.777doc.com/doc-3797243 .html