您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 投融资/租赁 > 07-非合作博弈模型及分析
非合作博弈模型及分析1.典型博弈及纳什均衡2.博弈的分类3.古诺的寡头竞争模型4.斯坦克伯格寡头竞争模型(1)囚徒困境两个犯罪嫌疑人甲和乙联手作案,被警方逮住但未掌握足够证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱5年;若二人都招则两人各判刑3年;若两人都不招则因证据不充分,只能各拘留1年。问题:甲、乙如何选择?1典型博弈及纳什均衡乙招不招招甲不招-3,-30,-5-5,0-1,-1它的纳什均衡是(坦白,坦白)。纳什均衡:通俗的讲是指参与人(局中人)单独改变策略不会得到好处的对局(策略组合),就叫做纳什均衡。完全信息静态博弈纳什均衡分析方法针对矩阵表达的形式一般采用相对优势策略划线法连续策略的情况下各自最优化自己的收益函数混合策略博弈下各自最优化自己的期望收益函数完全信息动态博弈子博弈精炼纳什均衡分析方法逆向归纳法(倒推法)(2)智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。请问:大猪和小猪如何选择?小猪按等待按大猪等待5,14,49,-10,0它的纳什均衡是(大猪按,小猪等)。(3)夫妻博弈丈夫喜欢看足球,妻子喜欢看芭蕾舞。他们都宁愿在一起,也不愿分开行动。本例有两种纳什均衡结果会出现,要么一起去看足球,要么一起去看芭蕾舞,但在一次博弈中究竟会出现哪一种???妻子足球芭蕾1,20,00,02,1丈夫足球芭蕾博弈方是政府和流浪汉,流浪汉的有两个策略:找工作或游荡,政府的策略是:救济或不救济。流浪汉找工作游荡0,0-1,1-1,33,2政府救济不救济(4)社会福利博弈2.0,5.0)1(3)]1(2[max))(1()]1(3[max21则uu假设政府救济的概率为;流浪汉找工作的概率为;则(5)抓钱博弈不拿不拿不拿拿钱拿钱拿钱拿钱不拿(1,1)(2,2)(3,3)(4,4)(5,5)甲甲乙乙(a)“利益一致”的抓钱博弈(b)“你死我活”的抓钱博弈不拿不拿不拿拿钱拿钱拿钱拿钱不拿(2,0)(1,3)(4,2)(3,5)(6,4)甲甲乙乙(c)“温和对抗”的抓钱博弈不拿不拿不拿拿钱拿钱拿钱拿钱不拿(0,4)(6,0)(0,8)(10,0)甲甲乙乙(,)202博弈的分类1)博弈中的参与人2)博弈中的策略或行动3)博弈中的支付(得益)4)博弈的过程5)博弈的信息结构6)参与人的能力和理性1)参与人:博弈中的决策主体,他的目的是通过选择行为(或战略)以最大化自己的收益(支付)。自然(Nature)作虚拟参与人处理,即决定外生的随机变量的概率分布的机制。根据参与人数量分单人博弈两人博弈多人博弈最常见的是两人博弈,单人博弈是退化的博弈2)博弈中的策略策略:博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同有限博弈:每个博弈方的策略数都是有限的无限博弈:至少有某些博弈方的策略有无限多个3)博弈中的支付支付:各博弈方从博弈中所获得的利益得益对应博弈的结果,也就是各博弈方策略的组合得益是各博弈方追求的根本目标及行为和判断的主要依据根据得益的博弈分类:零和博弈、常和博弈、变和博弈零和博弈:也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同—猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系—分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。—囚徒困境、产量博弈等4)博弈的过程博弈过程:博弈方选择行为的次序,包括是否多次重复选择行为。博弈过程对博弈结果也有重要影响。根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。静态博弈:所有博弈方同时或可看作同时选择策略的博弈—田忌赛马、猜硬币、古诺模型动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动—弈棋、市场进入、领导——追随型市场结构重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能—长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈5)博弈的信息结构若各博弈方完全了解所有博弈方在各种情况下的支付,称为“完全信息(CompleteInformation)博弈”。A、关于支付的信息若至少部分各博弈方不完全了解其它博弈方的得益情况,称为“不完全信息(IncompleteInformation)博弈”。又称“不对称信息(AsymmetricInformation)博弈”。B.关于博弈过程的信息动态博弈中在轮到行为时对博弈的进程完全了解的博弈方,称为具有“完美信息”(PerfectInformation)的参与人,如果动态博弈的所有参与人都有完美信息,则称为“完美信息的动态博弈”。动态博弈中轮到行为的参与人不完全了解此前全部博弈的进程时,称为具有“不完美信息”(ImperfectInformation)的参与人,有这种参与人的动态博弈则称为“不完美信息的动态博弈”。C.共同知识(commonknowledge)与信息有关,指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”6)参与人的能力和理性完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷个体理性和集体理性个体理性:一个体利益最大为目标集体理性:追求集体利益最大化合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈决策信息静态动态完全完全信息静态博弈纳什均衡纳什(1950、51年)完全信息动态博弈子博弈精炼纳什均衡泽尔腾(65年)不完全不完全信息静态博弈贝叶斯纳什均衡海萨尼(67、68年)不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾等(75年)常见博弈分类3古诺的寡头竞争模型寡头产量竞争——以两厂商产量竞争为例QQPPqqQ8)(21121111112)](8[)(qqqqqcQPqu212116qqqq221cc221222222)](8[)(qqqqqcQPqu222126qqqq古诺模型的反应函数4;2)6()()6()()6max(max*2*1*2*11211222212112121111uuqqqqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古诺模型的反应函数图示理性局限和古诺调整若两者联合,形成垄断,则8943)6max(max*2*1*2*12uuqqQUQQu4斯坦克伯格(Stackelberg)寡头竞争模型两企业先后选择产量的竞争博弈把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。QQPPqqQ8)(,21221cc121111112)](8[)(qqqqqcQPqu212116qqqq221222222)](8[)(qqqqqcQPqu222126qqqq)6()()6max(max1211222221222qqRqqqqquq运用逆向归纳法,先分析企业2的最优产量,是企业1产量的函数代入企业1的收益函数企业1预测到企业2将根据来选择产量,则在第一阶段,企业1最大化自己的收益函数,有)6()(121122qqRq3))6(6max(max*1211121111qqqqquq因此5.1)6()(12112*2qqRq两企业收益分别为25.25.4*2*1uu古诺模型与斯坦克博格模型的比较q1q2u2u1静态博弈静态合作动态博弈22441.51.54.54.531.54.52.25p453.5先行优势
本文标题:07-非合作博弈模型及分析
链接地址:https://www.777doc.com/doc-1811470 .html