您好,欢迎访问三七文档
1AnintroductiontoGameTheory博弈论基础主讲人:李唯滨世事洞明皆学问人情练达即文章2345启示:6博弈的划分:行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps和Wilson(1982)Fudenberg和Tirole(1991)7静态博弈经常是一次性的行为,决策一旦作出就不能再更改结果。动态博弈有一个重复的性质,前边的所有信息影响到后边的决策,博弈的结果要经过多次博弈之后才能看到,所以是一个连续的过程,这就决定了同一参与者在动态博弈时和静态博弈时表现出不同的行为。如果把为人处世看作一个博弈过程,我们就会发现静态博弈和动态博弈的区别。8比如说一个坏人,他遇到了一个他从来都没遇到过的人而且以后再也不会和他见面的陌生人,他就可能会变得肆无忌惮,本来的面目暴露无遗,因为这种情况是静态博弈,是一锤子买卖。同样一个坏人又会在经常打交道的人面前伪装成好人,因为这种情况是动态博弈,前边的所有信息会影响到后边的决策。为了自己的长远利益,他现在必须极力制造一些虚假的信息,让后边的决策对自己更加有利,所以见面时会很客气,表现得很好,以便让别人后边的行动不要对自己不客气。9例:猎人与猎狗的博弈10第三章完全且完美信息的动态博弈本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型.11如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。12本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论133.1动态博弈的表示法和特点3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点143.1.1阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒153.1.2动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合,构成一条路径得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。16122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)战略式表述(strategicformrepresentation)多用矩阵2,2-1,-1-1,-11,12LSLS1扩展式表述(extensiveformrepresentation)多用博弈树战略式与扩展式171.1.2.1动态博弈扩展式表述一般以扩展型式来表示:G=(N,H,P,I,U),包括5要素:(1)局中人N;(2)历史H:博弈树是一个多环节与枝干的集合,从单一的起始环节,直到终结环节,代表博弈历史;(3)对每个环节的分配法则P:将每个环节(除终结环节外)分配给不同的局中人,并赋予行动时可选的策略;(4)局中人行动时的信息集合I;(5)对应局中人可能选择策略,各局中人在终结环节所得到的报酬U。18博弈的扩展式表述包括三个要素:参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付19动态博弈的基本构造1.结(nodes):结包括决策结(decitionnodes)和终点结(terminalnodes)两类。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。在博弈树中,“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。2.枝(branches):在博弈树上,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。3.信息集(informationsets):博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结。20122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)结nodes信息集分单节信息集和多节信息集;如果用虚线匡起来表示2知道自己位于信息集内,但不知道是哪一点,因为他没能观察到对手的行动;如果博弈树的所有信息集都是单结的,称为完美信息博弈21122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)完美信息(perfectinformation)与不完美信息(imperfectinformation)122LLSSLS(2,2)(-1,-1)(-1,-1)(1,1)不完美信息:2不能区分1是采用了L还是S完美信息:2能区分1是选择了L还是S22案例-房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价7千万;如果市场上只有一栋楼需求大时,可卖1.8亿需求小时,可卖1.1亿23A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结信息集24A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在决策时不确切地知道自然的选择;B的决策结由4个变为2个房地产开发博弈25A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)房地产开发博弈26例:“人不犯我,我不犯人;人若犯我,我必犯人”的动态表示273.1.2.2动态博弈的战略式表述4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述28-3,-3-3,-31,01,00,10,00,10,0AB(进入,进入)进入不进入(进入,不进入)(不进入,进入)(不进入,不进入)市场进入博弈的战略式进入不进入ABB进入不进入不进入进入收益:AB-3,-31,00,10,0市场进入的扩展式29在市场进入博弈中:A有两个行动:“进入”、“不进入”。由于是先行动者,只有两个战略:选择“进入”或“不进入”。B有两个行动:“进入”、“不进入”。但是,有4个战略:(1)若A选择“进入”,B选择“进入”,若A选择“不进入”,B选择“进入”,即(进入,进入)(2)若A选择“进入”,B选择“进入”,若A选择“不进入”,B选择“不进入”,即(进入,不进入)(3)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即(不进入,进入)(4)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即(不进入,不进入)30练习:3132扩展式表述动态博弈若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发);B有两个信息集,四个可选择的行动,B有四个纯战略:开发策略:不论A开发不开发,我开发;追随策略:A开发我开发,A不开发我不开发;对抗策略:A开发我不开发,A不开发我开发;不开发策略:不论A开发不开发我不开发简写为:(开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx’什么是参与人的战略?33扩展式表述动态博弈足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’男的策略:{足球,芭蕾}选择足球;还是选择芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追随策略:他选择什么,我就选择什么2、对抗策略:他选择什么,我就偏不选什么3、芭蕾策略:不管他选什么,我都选芭蕾;4、足球策略:不管他选什么,我都选足球。策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。343.2可信性和纳什均衡的问题3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题353.2.1相机选择和策略中的可信性问题与静态博弈不同,在动态博弈情形,“战略”不等同于“行动”。在动态博弈中,在每一个信息集上有一个行动选择的问题,而一个局中人在由他进行行动选择的所有信息集所进行的行动选择构成他的一个战略,即战略是行动选择的一个谱系,一个战略规定了局中人在由他进行选择的所有信息集上所要选择的行动,即局中人在博弈开始之前所制定出的一个“相机行动计划”,它表明“如果……发生,我将选择……。”36当博弈是动态进行的时,与静态博弈相比,局中人就有了一种额外的选择,即事后机会主义。如果博弈是静态的,则局中人所声明的行动选择就是他们实际进行的选择,但是,如果博弈在行动选择上局中人有选择行动的先后顺序,那么,一些轮到稍后进行行动选择的局中人完全可以不按事前所声明的战略所规定的行动选择选择其行动,而是根据博弈进行到此时对局中人最为有利的方式选择行动。37这就是说,在动态博弈中,即使局中人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个局中人在其所有信息集上的行动选择,这些行动选择也可能并非局中人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以预言局中人届时不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。38不同版本的开金矿博弈——分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信39第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什
本文标题:博弈论基础
链接地址:https://www.777doc.com/doc-6127492 .html