您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 6、重复博弈和进化博弈
重复博弈与进化博弈马林一、重复博弈重复博弈:基本博弈重复进行构成的博弈过程但是博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益判断发生变化,从而影响策略选择。将整个重复博弈的过程作为整体进行研究。NobelPrizeinEconomicSciences2005RobertJ.Aumann奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。重复博弈的现实意义静态和动态博弈—社会活动中短期一次性的合作与竞争关系。重复博弈—长期反复的合作与竞争关系。如两家企业在一个市场的长期竞争,商业中的回头客问题重复博弈的分类有限次重复博弈——有明确的重复次数或结束时间。无限次重复博弈——一个基本博弈一直重复下去,没有次数限制。随机结束的重复博弈——虽然重复博弈的次数是有限的,但是重复的次数或博弈结束的时间是不确定的。重复博弈的得益一、总得益:即博弈方各次重复得益的总和二、平均得益:总得益÷重复次数重复博弈的决策特点一、决策受之前决策及其收益的影响二、决策的选择更依赖于平均得益失火门博弈酒吧的少数者博弈100个人很喜欢泡酒吧,每个周末这些人都要决定去酒吧还是在家里休息。酒吧的容量是60人,如果去的人多了,那么去酒吧的人就会不舒服,那么他们留在家中就会更舒服。那么每周这100个人是如何做出决策的呢?前提条件:每个参与者的信息只是以前去酒吧的人数,所以只能根据历史数据进行决策,而没有其他的信息参考。那么,每个人将如何作出决策?对真实实验的结果显示,实验对象的预测呈有规律的波浪状形态。周数NN+1N+2N+3N+4N+5N+6N+7人数4476237745667822采取策略的方式不同,但都基于归纳法实验结果代表现实中多数人理性的选择周数NN+1N+2N+3N+4N+5N+6N+7人数4476237745667822错误率5676777755667878计算机的模拟结果:不固定——60:40人员不固定,比例不变。结论:在实际生活中,人们根据历史进行预测多数情况是不准确的,是一个非线形的过程,即未来的情形对初始值有着强烈的敏感性。决策更依赖于平均得益菜场买菜。“我是天天在这里卖菜的”!”火车站商贩和街道商贩的区别为什么换防的部队总要小小的进攻一下59岁现象一次性博弈—机会主义,最大化利益—增加“交易成本”。重复博弈—增加信任因为上当受骗的人能够来进行报复行动,报复来报复去的长期结果是,理性的人们会认识到,这样大家谁也没有好处,于是就把相互的欺骗行为减少了,诚信就产生了。重复博弈的优点一报还一报的伟大胜利密西根大学罗伯特.爱克斯罗德教授。计算机竞赛:要求参加者根据囚徒困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。验证面对囚徒困境时人们可选择的策略以及这些策略的有效程度。参赛者二参赛者一合作背叛合作3,30,5背叛5,01,1竞赛的游戏方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。1、博弈进行多次,N=200次。所谓的“重复的囚徒困境”,它更逼真地反映了具有经常而长期性的人际关系。2、允许程序参考对手前几次的选择之后做出合作或背叛的抉择。如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。第一回合:14个程序。竞赛的桂冠属于其中最简单的策略:一报还一报(TITFORTAT)。多伦多大学心理学家阿纳托.拉帕波特提交。第二回合:62个程序。一报还一报又一次夺魁。一报还一报策略:以合作开局,但从此以后就采取以其人之道还治其人之身的策略。永远不先背叛对方——“善意的”对对手的前一次合作给予回报(哪怕曾经背叛过它)——“宽容的”采取背叛的行动来惩罚对手前一次的背叛——“强硬的”策略极为简单,对手一望便明——“简单明了的”“一报还一报”的稳定成功的原因它综合了善良性、报复性、宽容性和清晰性。善良性:防止它陷入不必要的麻烦。报复性:使对方试着背叛一次后就不敢再背叛。宽容性:有助于重新恢复合作。清晰性:容易被对方理解,引出长期合作。启示:重复博弈中,一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。什么样的人容易成功1.善意的2.宽容的3.强硬的4.简单明了孔子:己所不欲,勿施于人以德报德,以直报怨毛泽东:人不犯我,我不犯人人若犯我,我必犯人有限理性和进化博弈有限理性及其对博弈的影响1、理性的局限性和有限性2、有限理性:均衡结果的寻找和偏离过程有限理性博弈分析框架1、适用的均衡:具有真正稳定性和较强可预测性的均衡。即必须通过博弈方模仿、学习的调整过程达到,可以经受错误偏离的干扰,受到少量干扰后仍然可以恢复的稳健的均衡。2、更具有现实性,且理论意义和应用性也很高。有限理性快速学习模型分析条件:博弈方有较强的学习能力,虽然在复杂局面下准确判断分析和运用预见性的能力稍差,但是能对不同策略的结果作出比较正确的事后评估,并相应调整策略。博弈方二博弈方一ABA50,5049,0B0,4960,60AAAAABBBBBABAAA1个BBBAAA2连BABABA2非连BBBBAA3连BABABB3非连BBABBB4个B•经过计算可以知道•第n个时期博弈方i的两个邻居中只要有1个选择A,那么第n+1阶段i就就会选择A•第n个时期博弈方i的两个邻居都选择B,那么第n+1阶段i就就会选择BABAAAAAAAABBAAAAAAAA1个B的情况2连B的情况ABABABAAAAAAAAABBABABAAAAAAAAA2非连B的情况3连B的情况ABABBBABAAABAAA3非连B的情况AAAAABABBBABABBBABAA4个B的情况ABAAAAAAAAA策略是进化稳定策略,即在32种情况中除了5个B的情况外,其他31种情况最后都会收敛到A策略均衡。而B不是。社会道德的演变。博弈论的进化博弈与生物进化理论有异曲同工之处。问答题1、请问这是什么动物的声音?2、是不是所有的青蛙都会叫?3、青蛙为什么要叫?蛙鸣博弈亿万年前青蛙的祖先既没有耳朵也不会发声,但是经过长期进化的现代青蛙变成了雄蛙能够非常响亮的鸣叫,而雌蛙则有相当好的听力。根本原因是为了获得更多的交配和繁衍后代的机会,或者说能够发声的雄蛙和有较好听力的雌蛙有较多的交配机会。实验表明两只都不鸣叫的青蛙获得交配的几率各是0.5,当一只不叫一只叫的情况下,鸣叫的青蛙的交配几率上升到0.6。鸣叫的代价:容易被天敌发现,消耗宝贵的能源青蛙的博弈都不鸣叫,吸引来的雌蛙为0,交配机会是0。1只叫,1只不叫,可以吸引来1只雌蛙,交配的机会为m,(0.5m1),但要消耗成本z。如果都鸣叫,则各能吸引p只雌蛙,或者说交配的几率为(mp1),各有成本z。青蛙甲青蛙乙鸣叫不鸣叫鸣叫p-z,p-zm-z,1-m不鸣叫1-m,m-z0,0该博弈的纳什均衡关键在于p、m、z的相对水平。mp1,所以m-zp-z(1)m-z0:因为p1,则有p-z1-mm=0.6,z=0.7,p=0.8两只青蛙都不鸣叫就是纳什均衡青蛙甲青蛙乙鸣叫不鸣叫鸣叫p-z,p-z(0.1)(0.1)m-z,1-m(-0.1)(0.4)不鸣叫1-m,m-z(0.4)(-0.1)0,0(2)m-z0,即mz,且p-z1-mm=0.6z=0.5p=0.8都鸣叫多带来的好处不足以抵消多付出的成本则有两个纳什均衡或者都以一定的概率决定是否鸣叫。青蛙甲青蛙乙鸣叫不鸣叫鸣叫p-z,p-z(0.3)(0.3)m-z,1-m(0.1)(0.4)不鸣叫1-m,m-z(0.4)(0.1)0,0(3)m-z0,即mz,且p-z1-mm=0.6,z=0.2,p=0.8,都鸣叫多带来的好处足以抵消多付出的成本这种情况下,都鸣叫就是最后的纳什均衡。青蛙甲青蛙乙鸣叫不鸣叫鸣叫p-z,p-z(0.6)(0.6)m-z,1-m(0.4)(0.4)不鸣叫1-m,m-z(0.4)(0.4)0,04月7日,奥运圣火从伦敦开始传递起,不断受到藏独分子的骚扰和阻挠。尤其是在巴黎,藏独分子用残忍的暴力手段从坐在轮椅上的我国残疾运动员金晶受上抢夺火炬未遂,更用尽种种卑鄙手段冲击圣火传递队伍,辱骂爱国留学生、撕毁我五星红旗!而在此过程中,3000名脚穿滑轮鞋的巴黎警察袖手旁观,极度偏袒和纵容藏独分子的暴力行为!巴黎市政府竟把藏独伪旗帜和藏独标语挂上市政大厦!更有龌龊的西方媒体,极尽偏袒污蔑之能事,用谎言为藏独恐怖分子正名,侮辱中国政府和人民!为表达我们的愤慨,全国各大城市的广大网友倡议举行此次家乐福五一行动,计划如下:本活动是一次真正非暴力的抵制行动,行动并不是要请大家去做什么,想请大家做的只是在5月1日这天不去家乐福这家法国超市,全国各大城市的本地网络都有类似宣传,希望在5月1日能促成一次全国性的活动.其实论超市,家乐福之外我们还有众多选择,我想这件事的难度要比彻底抵制某国的商品要简单的多.如果您认可这个提议那么还请大家都行动起来吧,向您周围的朋友、亲人宣传一下这个提议吧,这样传十传百的让这成为现实,谢谢!!福州3男子在家乐福超市门口拉横幅抗议4月15日上午,3名男子在福州家乐福福新店门前拉起横幅。“坚决反对家乐福公司抵制中国2008”。活动持续了40分中,家乐福报警,3人被劝离。13日,一名网友在北京白石桥家乐福门口抗议人群反应逛家乐福的程序:先选雪糕、冰激凌,装一车,然后推着在商场里面逛,最后找个地方把小车一扔,走人。请严格按照程序规范操作!贺延光:我也曾是个愤青,我不抵制家乐福白岩松:不要拿别人的错误来惩罚自己传家乐福将用降价促销应对五一抵制活动(转)我一个朋友就在家乐福公司管理层上班,我给他短信说,大家要抵制你们了。他说他们已经接到总部命令,说早想好对策了,说中国人就是贱,他们的应对措施就是五一全国大促销。然后说只要价格低个一成,肯定人满为患的,末了还说不要再踩死人就行。2007年11月10日重庆一家“家乐福”超市促销引发踩踏惨剧,多人死伤•重庆家乐福踩踏惨剧:5万桶油两小时被抢光•庆贺10周年店庆,家乐福4家店准备了5万桶5升装的新元菜子油,原价51.4元,特价39.9元。•5升的油直接往人群里抛•造成3人死亡,31人受伤,其中7人重伤。•2007年10月26日:上海居民抢购超市低价豆油15人受伤•2007年10月13日:杭州首家沃尔玛开张顾客拥挤堪比春运我们的爱国热情如何合理的、有效的体现?(一虎一席谈)理性的思考对策,让我们的行动更有效,更有力。支持北京2008年奥运。谢谢
本文标题:6、重复博弈和进化博弈
链接地址:https://www.777doc.com/doc-5493676 .html