您好,欢迎访问三七文档
4.1有限理性与进化博弈论然而,完全理性在现实中很难满足,当社会经济环境和决策问题较复杂时,人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响,有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。4.1.1进化博弈的基础假设——有限理性传统的博弈均衡,例如Nash均衡及其精炼是以完全理性都是共同知识(commonknowledge)为前提的。第四章进化博弈论4.1.2有限理性及其对博弈的影响有限理性局中人:不满足完全理性假设的局中人有限理性意味着一般至少有部分局中人不会采用完全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再次偏离有限理性局中人会在博弈过程中学习博弈通过试错寻找较好的策略4.1.3合作的行为生态动物的适应性是在和生存环境的相互作用中形成的。在竞争中,动物最终选择进化稳定策略(EvolutionaryStableStrategy,简称ESS)——该策略是被种群大多数成员所采取的,而且不会受到其它对策的侵蚀。一种ESS一旦确立,社会稳定下来,偏离的行为将会受到自然的惩罚。有利它主义和合作行为在动物界普遍存在。该行为也可能发生在没有亲缘关系的情况:如共生现象。在有限理性博弈中具有真正稳定性和较强预测能力的均衡,必须是能够通过博弈方的模仿、学习的调整过程达到的,具有能经受错误偏离的干扰的均衡,是在受到少量干扰后仍然能够“恢复”的均衡。4.1.4有限理性博弈的分析框架4.1.4有限理性博弈的分析框架最优反应动态:有快速学习能力的小群体成员的反复博弈复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈进化稳定策略(ESS)4.2最优反应动态4.2.1协调博弈的有限博弈方快速学习模型4.2.2古诺调整过程4.2.1协调博弈的有限博弈方快速学习模型12345两个NASH均衡,但考虑到对对方理性的信任问题,风险态度等因素,可能选(A,A)。考虑5个有限理性的局中人之间,相邻局中人相互博弈,快速学习并动态调整。局中人1局中人2ABA50,5049,0B0,4960,60反应、策略调整规则推导BtxAtxtxtxBtxtxAiiiiii时,采用;当时,采用当的得益:采用的得益:采用61/22)(61/22)(60)](2[0)(49)](2[50)(()Aixtti表示在时期,局中人的邻居中采用策略的数量;B-()ixti则采用策略的数量为2。则局中人:局中人1局中人2ABA50,5049,0B0,4960,60最优反应动态模拟:初次博弈1个AABABABABBBAAAAABAAAABAABB初次博弈相邻2个AAAAAAAABAABBBAA初次博弈相连3个ABAABAAAAAA5.2.2古诺调整过程古诺模型反应函数23231221qqqq1234………博弈方12.51.52.1251.875博弈方231.752.251.93751||||1221dqdrdqdr问题:两寡头始终假设对方产量不变最优反应动态模拟收敛条件4.3复制动态和进化稳定性:两人对称博弈设某一群体进行随机配对重复博弈,且该博弈为对称博弈,即群体中个体无角色区分,所有个体均具有相同的战略空间。这时博弈分析的核心不是博弈方的最优策略的选择,而是有限理性的博弈方组成的群体成员的策略调整过程、趋势和稳定性,这里的稳定性是指采用特定策略的成员的比例不变,而非某个博弈方的策略不变。引例:签协议博弈的复制动态和进化稳定策略签协议博弈:1,10,00,00,0同意(y)局中人2不同意(n)同意(y)不同意(n)00)1(00)1(1xxuxxxuny在有限理性的前提下,并非所有的局中人开始就能找到最佳策略(y,y)。下面分析(y,y)是ESS。假设群体中采用“同意”比例为x,则不同策略期望得益和总平均得益为:2)1(xuxuxuny00)1(00)1(1xxuxxxuny2)1(xuxuxuny所以,除x=0外,有:uuuuyny,在不断的重复博弈过程中,只要局中人有基本的判断能力,早晚会发现该差异。于是,得益较差的局中人会或早或迟模仿另一方。这意味着两种类型局中人的比例x和1-x不是固定不变的,而是时间的函数:x(t)和1-x(t)。局中人策略类型比例的动态变化是进化博弈分析的核心。上述比例动态变化的速度取决于模仿的速度。该速度取决于两个因素:(1)被模仿对象的数量大小(可用x表示);(2)被模仿对象的成功程度(可用模仿对象的期望得益超过平均得益的幅度表示,即)。uuy所以,上述比例动态变化的速度可以表示为下列微分方程:)(uuxdtdxy以采用“同意”策略类型局中人的比例为例,其动态变化速度可用下列微分方程反映:3222)1()()(xxxxxxxuuxdtdxy动态微分方程的相位图dx/dtx010.53222)1()()(xxxxxxxuuxdtdxy稳定状态、不动点:x*=0,x*=1结论:(1)当x=0时,dx/dt=0,是稳定状态。其意义为,开始没有人采用“同意”策略,就没有学习模仿的榜样,因此所有的局中人不会有意识的改变策略。(2)当x0时,dx/dt0,则x呈增加趋势,直至x=1达到稳态。其意义为,只要开始有人采用“同意”策略,最终所有的局中人都趋于采用“同意”策略。进化稳定策略的检验2)1()1(000)1(101)1(nynyuuuuu2)1(000)1(10)1(ynnyuuuuu策略选择了“不同意”意”比例的博弈方偏离“同比例的博弈方偏离“不同意”策略选择了“同意”nyuu01nyuu0虽然x*=0,x*=1均为稳态,但不一定都是ESS。验证如下:ESSx是进化稳定策略1不是进化稳定策略0x1xx局中人无积极性选择不同意,即选择同意的比例会越来越大,进而趋向1xx选择同意的比例会越来越大,进而趋向结论:(1)一个稳定状态必须对微小扰动具有稳健性才能称为进化稳定策略(ESS)。即,作为稳定策略的x*,除了本身必须是稳定状态以外,还必须具有这样的性质,那就是如果某些局中人由于偶然的错误偏离了它们,复制动态仍然会使x恢复到x*。(2)在数学上,ESS相当于要求:xxxxxFdtdx,当,当00)(或:0)(xF所以,从复制动态方程的相位图来看,ESS为与水平轴相交且交点切线斜率为负的点。dx/dtx010.5例如,签协议博弈中,只有x=1,即(同意,同意)是ESS。xxxxxx当时,是增长趋势;当时,是减小趋势;一般两人对称博弈复制动态和进化稳定策略一般模型a,ac,bd,db,c策略1局中人2策略2策略1策略2一般2X2对称博弈进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。基本模型是两个局中人之间的对称博弈。含义是两个博弈位置是无差异的。其中abcd可以是任何得益,根据问题设定。复制动态分析2121)1()1()1(uxuxudxcxubxaxu)])(1()()[1(dbxcaxxxdx/dtx1x)(1uuxdtdx复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例复制动态相位图a,ac,bd,db,c策略1局中人2策略2策略1策略2一般2X2对称博弈稳态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)例:鹰鸽博弈的复制动态和进化稳定策略,0,v,v,0鹰局中人2鸽鹰鸽鹰鸽博弈2cv2vv代表双方争夺的利益c是争夺失败一方的损失2cv2v复制动态方程和相位图]2)1(2)()[1()(vxcvxxxxFdtdx)61)(1(xxx设v=2,c=12,则方程为:dx/dtx11/60因为F′(0)0,F′(1)0,F′(1/6)0所以只有x*=1/6是ESS。即采用攻击性策略的博弈方的数量常常稳定在1/6左右的水平。练习:求猎鹿博弈的ESS古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果一个猎人单兵优作战,一天最多只能打到3只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说,3只兔子能保证一个人3天不挨饿,而一只鹿却能让两个人吃上5天。鹿兔子鹿兔子5,50,33,03,34.4生物间合作的机制:亲缘效应和互惠式的合作行为(1)合作博弈合作不合作合作不合作3,30,55,01,1(2)斗鸡博弈退进退进3,31,55,10,0(5,0)(1,1)(0,5)(3,3)0(5,1)(1,5)(3,3)0问题:如何得到帕累托(Pareto)改进?汉密尔顿法则:通过亲缘选择促进利他行为的条件是rbc其中,c为利他者付出的代价,b为受益者获得的好处,r为亲缘系数。例如,上述合作博弈中,若局中人I选择利他行为,收益组合由(1,1)变为(0,5),故c=1,b=4,所以,当亲缘系数r1/4时,“利他基因在种群基因库中的频率才会增加”。坦白抵赖坦白抵赖-8,-80,-10-10,0-1,-1合作博弈合作不合作合作不合作3,30,55,01,1思考:囚犯困境中,当亲缘系数多大时,囚犯会选择利他行为?
本文标题:第四章-进化博弈论
链接地址:https://www.777doc.com/doc-4640888 .html