您好,欢迎访问三七文档
博弈论第四讲威胁与承诺房琳经济与管理学院2015.9S.L.F.L.game猜数字游戏任选一名学生与老师共同完成老师在0-100之中任选一个数字写好;学生在0-100之间猜数字,有5次机会,每次猜完后老师告知大于或小于目标数字。S.L.F.L.目录4.1动态博弈的描述4.2威胁与承诺的可信性4.3序贯理性4.4逆推归纳法S.L.F.L.4尝试考虑以下问题1、是不是信息越多越有利?2、过程是否重要?3、动态博弈与静态博弈有哪些异同之处?4、人们对已经过去的博弈是更注重结果还是更注重过程?其意义何在?4.1动态博弈的描述S.L.F.L.4.1动态博弈的描述动态博弈:博弈方先后、依次进行选择、行动,且后行动方知道先行动方的选择。静态博弈:同时或可看做同时动态博弈——序贯博弈S.L.F.L.行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择。为了做出最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?下棋、买东西、谈婚论嫁4.1动态博弈的描述S.L.F.L.为进入一行业,进入者必须付出4000万元的(沉没)成本建工厂。进入者不进入,在位者能继续定高价,享受垄断利润10000万元。进入者进入:在位者可以“容忍”,维持高价,此时在位者只能赚到5000万元,进入者将赚到1000万元的净利润;在位者可以“阻挠”,把价格压低,这种商战导致双方的低利润:在位者的利润下降到3000万元,进入者将有1000万元的净损失。进入不进入,阻挠不阻挠?4.1动态博弈的描述S.L.F.L.每一种可能行动组合下的收益是共同知识如果企图进入者不进入,则在位者独享10000万元利润;如果进入而在位者容忍,则在位者得5000万元,进入者利润1000万元;如果进入并且在位者阻挠,则在位者利润3000万元而进入者-1000万元。4.1动态博弈的描述信息完全且完美S.L.F.L.4.1动态博弈的描述●ⅠⅡ●●不进入进入容忍阻挠(0,10000)(1000,5000)(-1000,3000)扩展形表示法(博弈树)S.L.F.L.•扩展形表示法(博弈树)的构成:节点(nodes)决策节点(decisionnodes)终点节(terminalnodes)树枝(branches):每一条树枝代表一个行动信息集(informationsets):参与人在决策节点选择行动时,需要有关信息;对此前博弈过程的一个全部而明确的认识就构成一个信息集。4.1动态博弈的描述S.L.F.L.战略在动态博弈中,博弈方的战略是在不同时点做出的,因此战略不再是单一的行动。是一个完备的行动计划,为博弈方在每个时点上规定一个动作。“华容道”、刘备“过江招亲”4.1动态博弈的描述S.L.F.L.战略一种无条件的回应规则限制/规定自己的行动,达到博弈的目的(提前说明规则)一种威胁或承诺楚国孙叔敖令治水渠4.1动态博弈的描述S.L.F.L.4.2威胁与承诺的可信性4.2.1威胁与承诺4.2.2一个威胁可信性问题4.2.3一个承诺可信性问题4.2.4威胁与承诺的可行性S.L.F.L.可信性——动态博弈中,先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。后行为博弈方的许诺是否可信呢?后行为博弈方的威胁是否可信呢?S.L.F.L.4.2.1威胁与承诺威胁——对不肯与你合作的对手进行惩罚的一种回应规则。强迫性威胁人质事件阻吓性威胁核武器S.L.F.L.4.2.1威胁与承诺承诺——对愿意与你合作的人提供回报的一种回应规则。强迫性许诺证人阻吓性许诺劝诱S.L.F.L.威胁与承诺有时难以区分打卡扣钱制度威胁:迟到一次罚款10元(警告)承诺:不迟到就不扣钱(保证)4.2.1威胁与承诺S.L.F.L.当实施威胁策略或承诺策略时,首先考虑的应该是可信度问题。进口食材的威胁曹操寿宴兄弟之间承诺与威胁的可信度有多大,策略成功的概率就有多大。4.2.1威胁与承诺S.L.F.L.4.2.2一个威胁可信性问题“只要进入就阻挠”的威胁是否可信?●ⅠⅡ●●不进入进入容忍阻挠(0,10000)(1000,5000)(-1000,3000)S.L.F.L.4.2.2一个威胁可信性问题事实上,这个威胁是不可信的,因为理性的在位者知道(如同潜在进入者所知),一旦进入已经发生了,容忍并保持高价是符合自己利益的。容忍得5000万元,阻挠得3000万元。●ⅠⅡ●●不进入进入容忍阻挠(0,10000)(1000,5000)(-1000,3000)稳定的结果是(进入,容忍)S.L.F.L.新的博弈格局:4.2.2一个威胁可信性问题Ⅱ不进入●(0,7000)进入Ⅰ容忍●●阻挠(1000,2000)(-1000,3000)设在位者现在(而不是后)投资于万一进入发生时增加产量和进行价格战所需要的额外的生产能力,成本是3000万元。当然,如果今后在位者保持高价(不管是否有进入),这个额外成本将减少在位者的得益。S.L.F.L.Ⅱ不进入●(0,7000)进入Ⅰ容忍●●阻挠(1000,2000)(-1000,3000)4.2.2一个威胁可信性问题阻挠的威胁是完全可信的,它是在位者投资额外生产能力的决策的结果。(3000万元>2000万元)潜在进入者现在知道进入的结果是商战,所以不进入该行业是理智的。20世纪70年代,美国杜邦公司在二氧化钛行业中阻止进入,投资近4亿美元增加生产能力……S.L.F.L.4.2.2一个威胁可信性问题先来后到的启示后进者信息多,但利润不如先进入者。S.L.F.L.4.2.3一个承诺可信性问题开金矿甲去开采一价值4万元的金矿,缺1万元,乙恰好有1万元可以投资。甲向乙借1万元开金矿,并“许诺”成功后与其对半分成。乙是否该借钱给甲呢?如果乙借钱给甲,甲是否该分钱给乙呢?S.L.F.L.甲的承诺是否可信?4.2.3一个承诺可信性问题(1,0)乙甲借不借分不分(2,2)(0,4)S.L.F.L.根据自身利益最大化原则,甲的选择是不分,而乙清楚甲的行为准则,则选择不借。对乙来讲,本博弈中甲有一个不可信的承诺。怎样使甲的承诺变为可信,既让乙能保住本钱,又能有更多的收益呢?关键在于增加一些对甲行为的约束。4.2.3一个承诺可信性问题(1,0)乙甲借不借分不分(2,2)(0,4)S.L.F.L.若乙采取法律手段,即打官司保护自己的利益,则产生了一个新的博弈过程如图所示。在新的博弈中,乙的唯一选择是打官司,对甲来讲,乙打官司的威胁是可信的,是肯定会信守的,他最理智的选择就是分。4.2.3一个承诺可信性问题乙甲乙打(2,2)不分分不借借(0,4)(1,0)不打(1,0)法律保障的开金矿博弈——分钱打官司都可信S.L.F.L.乙的策略:第一阶段借,如甲在第二阶段选择不分,则第三阶段选择打;甲的策略:若乙第一阶段借,则他在第二阶段就选择分。在双方这样的策略组合下,本博弈的路径是(借,分),双方得益为(2,2),实现有效率的理想结果。4.2.3一个承诺可信性问题乙甲乙打(2,2)不分分不借借(0,4)(1,0)不打(1,0)S.L.F.L.若乙采取法律手段,但结果是劳民伤财,使自己经济上受损。在新的博弈中,乙的唯一选择是不打官司,对甲来讲,乙打官司的威胁是不可信的,甲最理智的选择就是不分。4.2.3一个承诺可信性问题法律保障不足的开金矿博弈——分钱打官司都不可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)S.L.F.L.开金矿的启示让别人有机会对你发出一个威胁永远不是好事。你大可以选择按照对方的希望行动,却没有必要等到听见一个威胁。4.2.3一个承诺可信性问题S.L.F.L.4.2.4威胁与承诺的可信性以色列的一贯原则:坚决不跟恐怖分子谈判这是一个威胁,意在阻吓恐怖分子,打消他们企图劫持人质,以此索取赎金或者要求释放犯人的念头。假如这个决不谈判的威胁是可信的,那么,恐怖分子就会意识到他们的行动注定徒劳无功。S.L.F.L.项羽破釜沉舟:巨鹿之战项羽率领大军渡河。然后“破釜沉舟”,命令士兵只携带三日粮,以此表示有进无退。于是历史上闻名的巨鹿之战上演了:当时,诸侯军救巨鹿的十多支队伍,却没有人敢向围城的秦军挑战。而只有项羽的军队勇猛、视死如归,以一当十。这一战不但打垮了秦军主力,也将秦军不可战胜的神话彻底击破,更一举奠定了“楚兵冠诸侯”的英明。在军事上,孤注一掷有时并不是一个愚蠢的策略。军队通常借助断绝自己后路的做法而达成遵守承诺的目标。4.2.4威胁与承诺的可信性S.L.F.L.4.3序贯理性4.3.1动态博弈中的理性要求4.3.2子博弈4.3.3子博弈完美纳什均衡S.L.F.L.4.3.1动态博弈中的理性要求在动态博弈中,博弈方如果是理性的,他应该“向前看”——不管事前制订的计划如何,他在新的时点上做决策都应该根据当前的情况选择最优的行动。运筹帷幄,决胜于千里之外将在外,军令有所不受S.L.F.L.序贯理性要求博弈方在一个接一个的决策节点上都要选择最优行动。进一步,如果某个博弈方是序贯理性的,那么他所使用的战略将是由他在每个时点上的最优行动组成。该战略不仅在事前最优,也是事后最优的,将满足动态一致性原则。4.3.1动态博弈中的理性要求S.L.F.L.4.3.2动态博弈中的子博弈动态博弈要求博弈方是序贯理性的,这意味着从任意一个决策点开始的决策情形就像是在原有博弈基础上开始一个“新的博弈”。S.L.F.L.4.3.2动态博弈中的子博弈子博弈:能够自成一个博弈,由一个动态博弈的某阶段(第一阶段除外)开始的后续博弈阶段构成。具备进行博弈所需的各种信息。(1,0)乙甲乙借不借分不分(2,2)不打打(0,4)(1,0)开金矿(守信)--子博弈S.L.F.L.384.3.2动态博弈中的子博弈注意:原博弈的初始节点开始的博弈为原博弈本身,不称它为原博弈的子博弈,即第一个节点不能作为子博弈的初始节点。S.L.F.L.可以看出,每个子博弈都代表这博弈方所面临的一个决策时机或情形,即每个子博弈都是一个独立的博弈,那么也有它的纳什均衡。一个博弈中有多个子博弈,那么博弈方在每一个子博弈上选择的最优行为就构成相应子博弈的纳什均衡。4.3.3子博弈完美纳什均衡S.L.F.L.4.3.3子博弈完美纳什均衡在动态博弈中由于博弈过程是逐步深入的,这一过程由每个阶段所采取的策略构成,由此引出“路径”的概念。路径:从第一阶段开始通过每阶段一个行为,最后达到博弈结束的一个终端各博弈方的行为组合。找到了路径也就找到了一个分阶段的策略组合,这一策略组合恰似一个完整的计划,计划的最终实现取决于过程中各阶段的实现。S.L.F.L.4.3.3子博弈完美纳什均衡在开金矿案例中,策略组合(借,分)是一个稳定的策略组合,因为如果不分,则有乙打官司的威胁,这是双方都不愿得到的结果。“稳定”意味着博弈方都不会单独改变策略,这恰似纳什均衡的概念。(1,0)乙甲借不借分不分(2,2)(1,0)开金矿(信守)乙打不打(1,0)(0,4)S.L.F.L.4.3.3子博弈完美纳什均衡由于动态博弈与静态博弈有较大的差异,那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展?以开金矿为例(注意此例与以前开金矿例子的差异)S.L.F.L.开金矿博弈的变形甲开金矿,向乙借钱,如果甲在获利之后不分钱给乙,而乙打官司对自己并没有好处,不能增加自己的利益时,博弈发生了变化。4.3.3子博弈完美纳什均衡S.L.F.L.4.3.3子博弈完美纳什均衡逆推可得,乙不借,乙打官司的威胁不可信。甲在第二阶段分的许诺也变为不可信。结局是,甲开不成金矿,乙保本,甲失去挣钱的机会。(2,2)(-1,0)(1,0)乙甲乙借不借分不分不打打(0,4)开金矿(2,2)(1,0)(1,0)乙甲乙借不借分不分不打打(0,4)开金矿变形S.L.F.L.按照静态博弈的分析方法,(借,分,打)的策略组合为一个纳什均衡,因为任何一方都不会单独改变策略而降低自己的得益这与逆推法得到
本文标题:博弈论威胁与承诺.
链接地址:https://www.777doc.com/doc-2598411 .html