您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第八章博弈论(微观经济学-哈工大,周燕)
第一节博奕论的基本知识一、博奕论博奕论(GameTheory)对称对策论、游戏理论或策略运筹论,是指一些个人、队组、或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行动或策略中进行选择并加以实施,从中各自取得相应的结果的过程。该理论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。后者涉及的个人决策:是在给定的价格参数,收入的条件下,追求效用最大化的决策(消费者均衡或生态者均衡),个人利益(效用)只依赖于自己选择,而外在于他人的选择。而博论:个人效用不仅依赖于自己的选择,而且依赖于他人的选择。博奕论与经济学决策理论的区别:二、博奕论的基本要素1.博奕方(参与人、局中人):博奕中独立决策、独立承担博奕结果的个人。囚犯两难中的警察和齐威王田忌赛马中的孙膑,不是博奕方。单人博奕两人博奕多人博奕——破坏者3个城市80个委员:3329182.行动(策略):参与人在博奕的某个时点的决策变量3.支付(得益):指在一定的策略组合下,参与人得到的确定效用水平,根据各博奕方得益之和情况的不同,把博奕分为:零和博奕:一方的收益必定是另一方的损失(见表:法律诉讼)特点:总得益=0(石头、齐、硬币……)双方是你死我活的关系常和博奕:得益和非零常数,如在几个人分配固定数额的资金,财产或利润时——零和是常和的特例。双方基本关系仍是竞争。变和博奕三、博奕类型1.参与人行动的先后顺序:静态博奕:博奕中,参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动。动态博奕:指参与人行动有先后顺序,且后行动者能观察出先行动者行动的选择。2.信息结构:参与人对有关其他参与人的特征,战略空间、支付函数的知识完全信息不完全信息顺序信息静态动态完全信息完全信息静态博奕纳什均衡完全信息动态博奕子博奕精练纳什均衡不完全信息不完全信息静态博奕贝叶斯纳什均衡不完全信息动态博奕精练贝叶斯纳什均衡第二节完全信息静态博奕一、最优策略均衡一般,每个参与人的最优战略选择依赖于所具有其他参与人的选择,但在一些特殊博奕中,一个参与人的最优战略可能并不能依赖于其他参与人的战略选择。这种不论其他参与人的策略如何,能使自己的支付对自己最为有利的策略叫最优策略。企业B广告促销不作广告广告促销企业A不作广告广告战:50101582610二、重复剔除的最优策略均衡在每个参与人都有最优策略的情况下,最优策略均衡是很理想的,但大多数情况下,该均衡是不存在的。尽管如此,在有些博奕中,仍可用最优策略逻辑找到均衡。智猪博奕小猪按等待按大猪等待1432-1070小猪的最优策略:等待大猪无最优策略:即大猪的最优策略是依赖于小猪的策略此时用重复剔除严格劣策略的思路找出均衡:小猪的严格劣策略为按,剔除“按”后,小猪只有一种策略等待,大猪仍有两个策略,但此时,“等待”已成为大猪的劣策略,剔除,大猪的最优策略——按这是一个“多劳不多得,少劳不少得”的均衡类似:股份公司中的大股东、小股东;股市中的大户、小户;市场中的大企业、小企业。三、纳什均衡它是完全静态博奕解的一般概念:指在知道其他参与人采取的策略后,能够使自己的支付最为有利的策略组合。一旦达到纳什均衡,双方都不会改变其策略,所以纳什均衡——稳定解1.麦片商博奕B咸麦片甜麦片咸麦片A甜麦片-510-51010-510-52.斗鸡博奕:两个手持利剑从独木桥的两端走向中间进行决斗。B进退进A退-30-3220003.夫妻之争足球服装足球服装10200201四、囚犯的难题揭示了:纳什均衡并不一定导致帕里托有效的结果裁军计划排队上车——找熟人,托关系,走后门。双寡头选择产量的博奕——卡特尔协定不是纳什均衡第三节完全信息动态博奕有些博奕中可能不止一个纳什均衡,而究竟哪个均衡实际上会发生从动态的角度分析,可减少纳什均衡的个数。博奕的标准型的三个要素:参与人、可选策略、支付函数——两人博奕可用矩阵表示博奕的另外一种形式——扩展型,包括五个要素:参与人每个参与人选择行动的时点每个参与人在每次行动时可供选择的行动集合每个参与人在每次行动时有关对于过去行动选择的信息支付函数例:市场进入阻挠博弈A——唯一供给者B——可能竞争者A高价(默许)低价(斗争)进入B不进入50040-1030030000假定进入前垄断利润为300,进入之后寡头利润共为100(各50),进入成本为10静态分析时有两个纳什均衡:(进入,高价)(不进入,低价)动态分析:这里,企业B选择行动(进入或不进入),企业A后选择是合作或斗争,最后的数字为支付水平。低价斗争不进入进入企业B企业A高价合作40,50-10,00,300在动态博奕中,如果所有以前的行动成为“共同知识”,也就是说,每个人都对运去发生了什么(什么人在什么时候选择什么行动)很清楚,那么给定“历史”从每个行动选择开始至博奕结果又构成——子博奕。精练纳什均衡:只有当参与人的策略在每一个子博奕中都构成纳什均衡所以(进入、高价)是唯一的子博奕精练,纳什均衡。有些纳什均衡之所以不是精练纳什均衡,关健原因是:它们包含不可置信的威胁,如果参与人能在博奕之前采取某种措施改变自己的行动空间或支付函数,使不可信的威胁变得可信,均衡就会相应改变.使不可置信的威胁变为可置信的办法:承诺行动----指当事人在不施行这种不可置信的威胁时,就会付出更大代价。在上例中,企业A与第三者打赌——若企业B进入后他不斗争,他就付给第三者100单位——此时斗争变成可信的威胁,有了这个赌,企业B就不敢进入了,在位者实际上无需支付赌注便能得到300垄断利润。现实中的承诺行动:破釜沉舟保证该商品的价格是全市最低价重复博奕:指同一博奕反复进行所构成的博奕过程。有限次重复博奕:到一定重复次数后,肯定要结束的博奕,如签有一定年数的合作协议的两企业之间,多局决胜负的体育比赛。无限次重复博奕:不存在事先确定的肯定要结束的时间的重复博奕。注:只要博奕重复的次数是有阴的,则博奕的结果将与一次性博奕的结果相同,而无限次博奕——合作。第四节不完全信息静态博奕至少有一个参与人不知道其他参与人的支付函数市场进入的例子:(高成本情况)企业A高价低价进入企业B不进入50040-1030030000(低成本情况)企业A高价低价进入企业B不进入10014030-1040040000这是一个不完全信息博奕,对潜在竞争者B来说不知道企业A的成本函数,也不知企业A是否采取斗争策略。在给定B进入时,高成本企业的最优选择是高价(合作);低成本企业A的最优战略是低价(斗争),此时斗争之所以比合作好,可能由于在位者的生产成本如此之低,从而他在非常低的价格下获得的垄断利润高于相对高的价格下分享到的寡头利润。所以B——进退两难之境。海萨尼对此问题的解决B只有一种类型,A有两种类型(高成本,低成本),也就是说,进入者具有不完全信息,而A具完全信息,进入者B不知道A的真实类型,但假定它知道A是高成本的可能性为p,低成本的可能性为1-p,那么企业B选择进入时的期望利润为40p+(-10)(1-p)而选择不进入时期望利润为0,只有当40p+(-10)(1-p)0,即p0.2时,企业B进入才是最优的。追求博奕品德优良者追求你接受不接受追求追求者不追求1000100-500000追求博奕品德恶劣者追求你接受不接受追求追求者不追求=1000100-500000接受:期望效用100p+(-100)(1-p)不接受:期望效用为0P1/2时,均衡为:追求者追求,你接受P1/2时,均衡为:追求者追求,你不接受不过,一般在P1/2时,追求者不会选择追求策略,因为他知道自己没戏,不会徒增烦恼,自讨没趣。第五节不完全信息动态博奕参与人的行动有先后顺序,后行动者可通过对先行动者行动的观察获得有关他的偏好,支付及策略空间等信息,修正自己的判断,达到进一步了解对方。例如打麻将的心理过程又如:黔驴技穷
本文标题:第八章博弈论(微观经济学-哈工大,周燕)
链接地址:https://www.777doc.com/doc-1161247 .html