您好,欢迎访问三七文档
2020/1/261第三章完全信息动态博弈•本讲开始讨论动态博弈。动态博弈的根本特征是各博弈方不是同时而是先后、依次进行选择或行动。•由于动态博弈中,后行为的博弈方有更多的信息帮助自己选择行为,可以减少决策的盲目性,有针对性的选择合理的行为。但信息越多并不意味着有更好的得益。这一点正是博弈论引人入胜的地方之一。•动态博弈中,其他博弈方行为之后,轮到行为的博弈方也并不总是了解此前的所有博弈过程。这种情况称为具有“不完美信息”的。相应的,完全了解自己行为之前的博弈过程的博弈方称为具有完美信息的。•如果所有博弈方都是具有完美信息的,就称为完美信息动态博弈;如果至少一个博弈方是不完美信息的,就称为不完美信息动态博弈。2020/1/262本章的主要内容•1.完全且完美信息动态博弈。•2.完全但不完美信息动态博弈。•动态博弈中一个博弈方的一次行为称为一个阶段。动态博弈中的行为一般不止一次,甚至有无数次。我们关心的是整个博弈的结果,它依赖于整个博弈过程中的全部决策,或者说是一个完整的行动计划。2020/1/263动态博弈的特点•策略和行为静态博弈中,博弈方的行为就是一个策略,行为和策略是一致的。动态博弈中,只考虑一次行为是不行的。但是,动态博弈中,要考虑整个博弈过程中的所有行为。我们把这一整套行为称为策略,就是说,在动态博弈中,策略和行为是不同的。•结果动态博弈的结果,首先是指各博弈方的策略组合(不是行为组合),其次是各个博弈方的策略组合形成的一条联结各个阶段的路径,最后是各个博弈方实现博弈路径的得益。即必须包含策略组合、路径、得益。•非对称性因为有先后次序,后行为方有更多的信息,使自己的行为避免盲目性,所以是不对称的。但并不是信息越多越有利。2020/1/2641.完全且完美信息动态博弈•动态博弈的一个中心问题是可信性问题。即动态博弈中的先行为方是否相信后行为的博弈方会采取对自己有利还是不利的行为。后行为方采取对先行为方有利的行为相当于一种“承诺”,采取对先行为方不利的行为相当于一种“威胁”。因此,可信性分为承诺的可信性和威胁的可信性。要注意,承诺和威胁是后行为方理性的行为,并无好坏之分。而且,承诺还是威胁都是不必讲出来的。2020/1/265借钱投资问题•设甲准备投资开采一个价值4万元的金矿,但缺1万元资金,而乙正好有1万元可以投入。甲向乙借这1万元用于开矿,并承诺收益双方平分。假设金矿的价值经权威探测,是确实的。乙是否应该借钱给甲呢?•乙最关心的是甲得到金子后是否履行诺言跟乙平分收益。万一甲采到金子后不分收益,甚至赖账,乙连本钱都收不回来。•我们用下面的扩展形的方法分析:2020/1/266借款投资的扩展形(博弈树)•乙甲借不借分不分(2,2)(0,4)(1,0)2020/1/267分析•乙先决策:不借,则博弈结束,乙保住自己的1万元,但得不到投资利润。若乙选择借,则到博弈的另一阶段,由甲决策:分或是不分。不论分与不分,博弈都将结束。分,则皆大欢喜,甲得到了2万元采金收益,乙的1万元投资也增值到2万元。不分,则甲独得4万元,而乙则一无所有。•乙清楚自己的处境,他决策完全取决于甲的分钱承诺是否可信。不考虑道德因素,甲的分钱承诺并不可信。因为,甲不分才能使自己收益最大化。所以,本博弈以乙不借钱而结束。2020/1/268改进•本博弈因为甲的不可信的分钱承诺而使甲乙的合作没有成功,开矿带来的3万元的社会效益也没能实现。能否改进措施,使甲的承诺变为可信?我们增加一个对甲的行为的制约。•当甲选择分钱时,双方达到最佳结局。当甲选择不分时,让乙通过打官司来保护自己的利益,打官司乙肯定能赢,但要耗费财力物力,假设乙除掉打官司的花费,正好收回1万元投资,而甲的全部采金收入将被没收。这样,就变成了三阶段的动态博弈。2020/1/269有可信的诺言和威胁时的博弈树乙甲乙不借借分不分打不打(2,2)(1,0)(0,4)(1,0)2020/1/2610分析•加上了第三博弈阶段,结果就不同了。当甲选择不分时,乙不打官司,则什么都没有了,但打官司可以收回自己的1万元投资,即使不以惩罚甲带来的心理效用来考虑,乙的打官司威胁是可信的。则甲的分钱承诺就是可信的了。所以本博弈的解应是乙先选择借,当甲选择不分时选择打官司。解的路径是借→分。达到最佳结果。•可见,完善的法律制度,不仅能保障社会公平,还能提高社会经济效率。•如果法律保障不够充分,比如乙打官司不能收回投资,并且还要在投入1万元,结果就不同了。2020/1/2611法律保障不足时的博弈树乙甲乙不借借分不分打不打(2,2)(-1,0)(0,4)(1,0)2020/1/2612市场占领•市场经济中有一种非常普遍的现象:当某厂商开拓或占领了某一市场后,总有其他厂商随后跟进抢夺市场,分享利润。面对后来者,先占领市场的一方会通过各种手段打击排挤,以图长久的垄断市场。当然打击对手自己也会有很大的损失。那么这个模型中,各博弈方会怎么决策?2020/1/2613市场占领有可信威胁的情形后进者先到者进不进打击不打击(-3,6)(5,5)(0,10)2020/1/2614市场占领有不可信威胁的情形先到者进不进打击不打击(-3,6)(5,8)(0,10)后进者2020/1/2615分析•前一个图中,当后来者选择进入市场时,先到者打击的收益是6,不打击的收益是5,因此,打击是一个可信的威胁,那么后来者选择进得-3,不进得0,当然应选择不进。•后一个图中,当后来者选择进入市场时,先到者打击的收益是6,不打击的收益是8,因此,打击是一个不可信的威胁,那么后来者选择进得5,不进得0,当然应选择进。•后一种情形是可能的。当后进者进入市场后,进一步开拓了市场,其得益并非从前者手中夺取的。2020/1/2616子博弈和逆推归纳法•为了把动态博弈问题简化,或分析的方便,我们把动态博弈的某一阶段开始的后续所有阶段构成的博弈称为子博弈。比如,在借钱投资问题中,乙选择借以后,从甲开始决策起的博弈,就称为原博弈的子博弈。当然,当甲选择不分时,乙又开始决策,从这时起的博弈既是原博弈的子博弈,也是从甲开始的子博弈的子博弈。•原博弈并不作为特殊的子博弈。也并不是每一个博弈方开始决策时都能形成子博弈。2020/1/2617•动态博弈的中,先行为的博弈方总要考虑后行为的博弈方在随后的阶段(即子博弈中)的决策。因此,后面阶段(或子博弈)的决策是分析动态博弈时要首先关注的。这就形成了解动态博弈的一般方法—逆推归纳法。•逆推归纳法:从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前推以求解动态博弈的方法。•比如,海盗分金币问题、借钱投资问题、市场占领问题都可以逆推归纳法来求解。2020/1/2618动态博弈纳什均衡问题•用逆推归纳法导出的动态博弈的结果是各博弈方的一种行为依次构成的。没有考虑各博弈方的总体策略考虑。•前面的借钱投资问题中,博弈本来有三个阶段,但当甲选择分时,博弈就结束了。因此实际上只有两个阶段。像这种从第一阶段开始到达博弈结束的终端的各博弈方的行为组合称为一个路径。例如(借、分)就是博弈的解的路径。当然,(不借)、(借、分、不打)、(借、不分、不打)等都是博弈路径。我们就是要从众多路径中选择必然的、各博弈方都接受的路径。2020/1/2619•静态博弈中,博弈方的行为和策略是一致的,但动态博弈中,要考虑整个博弈过程中的所有行为。这一整套行为称为策略。由于策略概念的不同,纳什均衡概念在静态和动态博弈中有不同的理解。•如借钱投资问题中,(借,分)的策略是这样购成的:乙先选择借,如果还需要选择时就选打;甲的策略是分。双方于是形成这样的均衡(借(不分则打),分)。这个策略组合是稳定的,符合纳什均衡的定义。因为谁单独偏离该策略组合不能获得更大收益,甚至减少收益。2020/1/2620•再看法律保障不足时的借钱投资问题:乙甲乙借不借分不分打不打(1,0)(2,2)(-1,0)(0,4)2020/1/2621分析•只是稍微改动,结果却大不相同。甲不分时,乙的打官司威胁变为是不可信的。因此,乙第一阶段应该选不借,博弈结束。但是,用静态博弈中纳什均衡概念对照,发现(借(不分则打),分)仍是纳什均衡。因为谁单独离开这个组合将不会增加收益。这两种分析的结论是矛盾的。原因在于,实现(借(不分则打),分)的纳什均衡策略包含一个不可信的威胁—即乙在第三阶段选打。就是说,一般的纳什均衡概念在分析动态博弈时,不能排除不可信的承诺和威胁。纳什均衡概念不能完全照搬。2020/1/2622子博弈完美纳什均衡•1965年塞尔顿(Selten)给出了子博弈完美纳什均衡的概念。它需要包含两点:1.是纳什均衡.2.不包含不可信的承诺和威胁。•定义:若动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成纳什均衡,则该策略组合称为子博弈完美纳什均衡。•用这个概念来看前面的借钱投资问题。在前面的那个问题中,乙选借(不分就打)、甲选分是子博弈完美纳什均衡。而当乙打官司成本提高后,打的威胁不可信时,在从甲开始的子博弈中不是纳什均衡。因此,(借,分)不是稳定的。•就是说,在静态博弈中要用纳什均衡,在动态博弈中要用子博弈完美纳什均衡概念。二者是同等重要的。2020/1/2623几点说明•逆推归纳法就是寻找子博弈纳什均衡的方法,虽然我们经常只说用逆推归纳法来求解,不明说在找子博弈纳什均衡。•在分析动态博弈时,有两点需要说明:•1.各博弈方的策略必须对每一个阶段的各种可能性设定行动方案。否则就无法确定是否存在不可信的威胁和承诺,无法使用子博弈纳什均衡概念。如前面的问题中,甲在第二阶段会选择分,但由此乙在第一阶段不考虑第三阶段的行动方案,只决定第一阶段选借,则不能构成子博弈纳什均衡。2020/1/2624•2.分析动态博弈时,必须始终假定和强调所有博弈方都是理性的和不会犯错误的。而且每一个人也都知道所有人都是理性的和不会犯错误的。但现实决策中,有些人会由于赌气、冲动、盲目或其他原因而采取不理智的行为。这在实际问题中要注意。如果考虑这些因素,问题就变得复杂的多。2020/1/2625•例看这个博弈甲乙甲ABCDEF2,01,13,00,22020/1/2626分析•用逆推归纳法很容易知道,博弈的解应是甲在第一阶段选A,博弈结束。但若甲第一阶段选B,乙会怎么想,甲一定是不理性或犯错误了吗?不一定。也许正是甲认为乙有可能会犯错误,使博弈进入第三阶段,才故意这样选。那么乙如何选?乙要判断甲是真的犯错误,还是故意的。若真犯错误,那他会再犯错误吗?如果这样,乙应选D,使自己有可能获得最大收益。若甲是故意犯错误,乙应该选C使博弈结束。由此可见,不理性或犯错误将使问题变得很复杂。所以,理论分析中要求各方是理性的和不犯错误的。2020/1/2627练习•博弈如下:1212abcdefgh5,32,44,38,53,62020/1/2628•找出全部子博弈,讨论该博弈的可信性问题,求子博弈完美纳什均衡。•解:有三个子博弈:1选a后;2选c后;1选f后。•该博弈最好的路径是a—c—f—g。但实现该路径的策略中,2选g是不可信的。因此1选f也变为不可信的,那么,2选c也就成为不可信的,最后到第一阶段,1选a就成为不可信的,所以,上述路径不可能实现。结果是1第一阶段选b,博弈结束。2020/1/2629•逐步逆推可知,子博弈完美纳什均衡是:1第一阶段选b,第三阶段选e,2第二阶段选d,第四阶段选h。博弈的结果是1第一阶段选b.
本文标题:博弈论5
链接地址:https://www.777doc.com/doc-3313507 .html