您好,欢迎访问三七文档
博弈论参考书目:《博弈论基础》,罗伯特·吉本斯,高峰译中国社会科学出版社,1999年3月《策略-博弈论导论》,乔尔·沃森,费方域,赖丹馨译,上海人民出版社,2010年11月《经济博弈论(第二版)》,谢枳予复旦大学出版社,2002年1月主要内容第一章完全信息静态博弈第二章完全信息的动态博弈第三章非完全信息静态博弈第四章非完全信息动态博弈在所有社会,人们经常互动。互动有时是合作,有时是竞争。在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。相互依赖的情形可称为策略环境。因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。博弈就是策略对抗博弈的定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。四个核心方面博弈的参加人(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)目前,博弈论被许多来自不同领域的专业人士使用,这些领域包括经济学、政治学、法律、生物、国际关系哲学以及数学。事实上,大多数情形即包含了冲突元素,也包含了合作的元素。我们对博弈的组成要有一个广义的理解。简而言之,博弈是策略环境的正式描述。因此,博弈论是研究相互依赖情形的正式的方法论。这里,“正式”是指一种以数学化的精确,以及逻辑上的一致见长的结构。利用正确的理论工具,我们可以研究各种情况下的行为,从而更好地理解经济中的相互作用。静态博弈:所有博弈方同时或可看作同时选择策略的博弈—石头剪刀布、猜硬币、古诺模型动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动—弈棋、市场进入、斯坦博格型市场结构完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”完美信息博弈:每个轮到行动的博弈方对博弈的进程完全了解的博弈不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈约翰·福布斯·纳什(JohnForbesNashJr.,1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。1994年约翰·福布斯·纳什、约翰·C·海萨尼以及莱因哈德·泽尔腾,三人同时因为他们对博弈论的研究,所作出的突出贡献,而获得诺贝尔经济学奖。JohnHarsanyJohnNashLeihadenSelten三位大师主要的贡献1950年和1951年纳什的两篇关于非合作博弈论的重要论文,证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。泽尔腾(1965)将纳什均衡概念引入了动态分析,提出了“精炼纳什均衡”概念。海萨尼发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。泽尔腾和海萨尼进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型。第一章完全信息静态博弈1.1基本理论:博弈的标准式和纳什均衡1.2应用举例1.3混合策略和均衡的存在1.1基本理论:博弈的标准式和纳什均衡例1儿童游戏:“石头、剪刀、布”。参与人:1,2。策略空间:S1=S2={石头、剪刀、布}收益:两人出手的函数u1(石头,石头)=0,u1(石头,剪刀)=1,u1(石头,布)=-1……u2(石头,石头)=0,u2(石头,剪刀)=-1,u2(石头,布)=1……博弈的标准式表示(normal-formrepresentation)(1)参与人(player).n个参与人:1,2,…,i,…,n(2)策略(strategy).一个参与人的策略是他采取的一个行动。参与人i的策略:si参与人i的策略空间:Si策略的一个组合:s={s1,s2,…,sn}简化表示:s-i={s1,…,si-1,si+1,…,sn}(3)收益(payoff).参与人i的收益:ui=ui(s1,s2,…,sn)n个参与人博弈的标准形式表示:G={S1,S2,…,Sn;u1,u2,…,un}博弈标准式特例:u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11s12s13参与人1参与人2s21s22S1={s11,s12,s13}S2={s21,s22}收益表(Payoff):两个参与人,有限个战略的博弈的表示方法0,01,-1-1,1-1,10,01,-11,-1-1,10,0石头剪刀布石头剪刀布P1P2囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。两人的选择:(招认,招认)。-1,-1-9,00,-9-6,-6囚徒2沉默招认沉默招认例囚徒困境(ThePrisoner’sDilemma)囚徒1占优17每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时,你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。鹰鸽博弈(斗鸡博弈)参与人:鹰和鸽策略:保持原方向和转向偏好:如果他们都保持原方向,就会撞车。如果都转向,就都保住了面子。如果只有对方转向,就会被称为硬汉。保持转向保持0,03,1转向1,32,2鸽鹰公共财产的悲剧1\2少吃多吃少吃2,20,3多吃3,01,1智猪博弈1\2按下不按按下4,22,3不按6,-10,0小猪大猪定义:si是si的严格劣势战略(strictlydominated),如果:ui(si,s-i)ui(si,s-i)“沉默”是“招认”的严格劣战略-1,-1-9,00,-9-6,-6囚徒2沉默招认沉默招认囚徒1理性的参与人不会选择严格劣策略公共财产的悲剧1\2少吃多吃少吃2,20,3多吃3,01,1重复剔除严格劣策略1,01,20,10,30,12,0上下参与人2左中右参与人11,01,20,30,1上下参与人2左中参与人1博弈结果(上,中)两人都没有严格劣策略保持转向保持0,03,1转向1,32,2鸽鹰1\2按下不按按下4,22,3不按6,-10,0小猪大猪定义:s*=(s1*,…,sn*)是一个纳什均衡(Nashequilibrium),如果对i,ui(si*,si*)ui(si,si*)纳什均衡为如下最大化问题的解ui=ui(s1*,…,si,…,sn*)iiSsmax给定你的策略,我的策略是最好的策略给定我的策略,你的策略也是最好的策略因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失纳什均衡特例:u1(s11,s21),u2(s11,s21)u1(s11,s22),u2(s11,s22)u1(s12,s21),u2(s12,s21)u1(s12,s22),u2(s12,s22)u1(s13,s21),u2(s13,s21)u1(s13,s22),u2(s13,s22)s11s12s13参与人1参与人2s21s22(s11*,s21*)是纳什均衡,如果u1(s11*,s21*)≥u1(s12,s21*)u1(s11*,s21*)≥u1(s13,s21*)u2(s11*,s21*)≥u2(s11*,s22).寻找纳什均衡的方法之一:划线法-1,-1-9,00,-9-6,-6囚徒2沉默招认沉默招认囚徒1-6,-6没有哪个博弈方有偏离这个预测结果的愿望第一类决策矛盾:强烈的个人动机将导致集体的损失对于策略组合S和S’,如果所有的参与人相对于S’都更偏好于采取S,而且至少对一个参与人来说是严格偏好的,我们就说S比S’更有效率。用数学来表示,如果ui(S)ui(S’)对每个参与人i都成立,并且不等式至少对一个参与人是严格成立的,那么S比S’更有效率。-1,-1-9,00,-9-6,-6囚徒2沉默招认沉默招认囚徒1(沉默,沉默)比(招认,招认)更有效率如果不存在其他更有效率的策略组合,我们就称这个策略组合S是有效的。用数学来表示,不存在其他策略组合S’对每个参与人i来说都满足ui(S’)ui(S),同时对某个参与人j来说满足ui(S’)ui(S)。-1,-1-9,00,-9-6,-6囚徒2沉默招认沉默招认囚徒1(沉默,沉默),(招认,沉默),(沉默,招认)都是有效的策略组合寻找纳什均衡的方法之一:划线法1,01,20,10,30,12,0上下参与人2左中右参与人11,2寻找纳什均衡的方法之一:划线法0,44,05,34,00,45,33,53,56,6上中下参与人2左中右参与人16,6寻找纳什均衡的方法之一:划线法2,10,00,01,2帕特歌剧拳击歌剧拳击克里斯性别战(thebattleoftheSexes)1,22,1第二类决策矛盾:达成均衡的方式不止一种,策略不确定性有时会阻碍有效结果的获得沟通寻找纳什均衡的方法之一:划线法鹰鸽博弈保持转向保持0,03,1转向1,32,2鸽鹰制度、规则、行为及文化第二类决策矛盾:达成均衡的方式不止一种,策略不确定性有时会阻碍有效结果的获得现实生活中无效率均衡的例子-QWERTY的键位设计第三类决策矛盾:习惯已经根深蒂固了标准的键位设计(第三行以QWERTY开始)是由打字机的发明者为了防止按键卡死而修正的。对于机械打字机来说,当两个位置接近的按键同时按下的时候,会导致用来敲打色带的铅字杠杆之间发生纠结,因此发明者设计键位的原则是将那些经常连在一起使用的字母分开排列。但按键卡死在现代来说并不是一个问题。20实际30年代,AugustDvorak和WilliamDealey通过对英语中单词运用的仔细研究,设计了一种新的键盘-Dvorak键盘,人们确信这种键盘比使用QWERTY键盘打字效率显著提高。为什么QWERTY键盘现在仍然是标准?寻找纳什均衡的方法之一:划线法公共财产的悲剧1\2少吃多吃少吃2,20,3多吃3,01,1寻找纳什均衡的方法之一:划线法智猪博弈按下不按按下4,22,3不按6,-10,0小猪大猪为什么中小企业不会花钱去开发新产品?协调博弈1\2ABA1,10,0B0,01,1帕累托协调博弈1\2ABA2,20,0B0,01,1帕累托上策均衡5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)设猎人2选抓兔子的概率为p,则猎人1选抓鹿的期望得益:5(1-p)选抓兔子的期望得益:3(1-p)+3p由5(1-p)3(1-p)+3p得p2/5考虑其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。三个主要的广播电视台:A、B、C。所有这三个电视台都可以选择讲晚间新闻现场直播时间定在晚上6点或是推迟到7点,每个电视台的目标都是使他的收视率最大化。AB6点7点6点14,24,328,30,277点30,16,2413,12,50AB6点7点6点16,24,3030,16,247点30,23,1414,24,326点7点C缔约(contract)缔约不仅仅用于防止策略的不确定,还可以缓解共同利益和个体利益之间的冲突。即缔约为各参与者提供了一种防止无效率协调的方法。1\2INI8,8-4,4N10,-20,01\2INI8,8-4,4N7,10,0让我们集中考虑z1+z2x1+y2,z1+z2x2+y1,且z1+z
本文标题:博弈论经典
链接地址:https://www.777doc.com/doc-7986900 .html