您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 纳什均衡及应用举例-博弈论
第一章完全信息静态信息博弈-纳什均衡一博弈的基本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例博弈论的基本概念与求解引例:房地产开发博弈设一个房地产开发商A打算开发一栋写字楼,面临的选择是开发或不开发;若开发,投入资金1亿元,不开发资金投入为0另有一个开发商B也面临同样的选择。影响因素:市场需求的大小影响因素:竞争对手的选择引例:房地产开发博弈如果市场上有两栋楼出售,需求大时,每栋售价1.4亿元,需求小时7000万元如果市场上只有一栋楼出售,需求大时。每栋售价1.8亿元,需求小时1.1亿元需求大,A开发,B开发,利润各4000万元需求大,A开发,B不开发,A8000万元,B为0需求大,A不开发,B开发,B为8000万元,A为0需求大,A不开发,B不开发,都为0需求小,A开发,B开发,AB各为-3000万元需求小,A开发,B不开发。A为1000万元B为0需求小,A不开发,B开发A为0,B为1000万元需求小,A不开发,B不开发,都为0房地产开发博弈房地产开发博弈4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况若双方同时决策若市场需求已知若市场需求未知,是否开发依赖于各自在多大程度上认为需求是大的,以对方是否开发房地产开发博弈若双方不同时决策,且市场需求不确定设B在A之前决策,且只有B了解市场需求若需求是大的,B选择开发若需求是小的,B的选择依赖于他多大程度上相信A会开发,而A是否开发依赖于A在多大程度上认为需求是大的。房地产开发博弈博弈的基本概念PlayersActionStrategies&strategiessetInformationPayoff&payofffunctionOutcome&EquilibriumPlayers决策主体:单人博弈、两人博弈和多人博弈。目的是通过选择行动或策略以最大化自己的支付或效用水平自然人或团体,如企业、国家、OPEC、EU重要的是每个决策主体必须有可供选择的行动或策略和一个很好定义的偏好而不做决策的被动主体只当作环境参数虚拟参与人:“自然”(nature)作为“虚拟参与人”(pseudo-player)来处理。这里的自然指决定外生随机变量的概率分布的机制房地产开发博弈4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况N高低[P][1-P]不进入进入不进入进入BB合作斗争合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)市场进入博弈行动action行动:是参与人的决策变量参与人的行动可以是离散的,也可以是连续的。如Ai={开发,不开发}行动组合:n个参与人的行动有序集(如(不开发,开发))行动顺序:有关静态博弈和动态博弈的区分在博弈论中,一般假定参与人的行动空间和行动顺序是所有参与人的共同知识Strategies&strategiesset战略:是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动战略组合战略与行动是两个不同的概念,战略是行动的规则而不是行动本身“人不犯我,我不犯人;人若犯我,我必犯人”是一种战略,这里的“犯”与“不犯”是两种行动,战略规定了什么时候选择“犯”,什么时候选择“不犯”静态博弈中参与人同时行动。战略和行动是相同的作为一种行动规则,战略必须是完备的,就是说,它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这种情况会实际发生房地产开发博弈4000,40008000,00,80000,0不开发开发商A开发不开发开发-3000,-30001000,00,10000,0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况如果B在市场需求情况未知下先行动,A在得知B的行动后再行动。B的战略SB=(开发,不开发)A的战略SA=({开发,开发},{开发,不开发},{不开发,开发},{不开发,不开发})一个战略组合s=({不开发,开发},开发),A的战略是“如果B开发,我不开发;如果B不开发,我开发”,B的战略是“开发”。类似的可以列出其他7个战略组合Information是Player有关博弈的知识,特别是有关其他参与人(对手)的特征和行动的知识.它是重要的决策依据和决定博弈结果的重要因素。信息集:参与人在特定时刻有关变量的值的信息CommonKnowledge即共同知识(所有参与人知道,所有参与人知道所有参与人知道,)CompleteandPerfect——完全信息与完美信息两者主要区别是在对博弈结果与博弈进程知识的掌握情况有差别:若每一个参与人都知道所有其他参与人的支付或结果,称为完全信息博弈(CIG).若有一个人不知道其他人的支付,称不完全信息博弈IIG.若每一个参与人都知道所有其他参与人的博弈进程,即动态博弈中轮到行为的博弈方完全了解此前行为的各博弈方的行为,即了解全部博弈进程,称为完美的,否则就是不完美的.如房地产开发博弈中,如果至少有一个参与人不知道市场需求的大小,信息是不完全的也是不完美的如果两个参与人都知道市场需求是大的还是小的,信息是完全的,但如果A不知道B选择了什么行动,那么A的信息是不完美的。CompleteandPerfect——完全信息与完美信息支付Payoff它是指在一个特定的策略组合下player得到的确定的效用水平,或者指参与人得到的期望效用水平。这是player真正关心的东西,是player博弈后所得利益。他的目标就是在自己可以选择的战略集合里,选择某个战略以最大化自己的期望效用函数(v-N-M预期效用函数)。支付如果有n人博弈,令ui为Playeri的支付(效用水平),u=(u1,…ui…un)为支付组合payoffprofile,博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择,即ui是所有参与人的战略选择的函数:ui=ui(s1,,…si,…sn),其中si是Playeri的战略选择。房地产开发博弈参与人的利润水平即是他们的支付,如果A,B同时行动UA(需求大,A开发,B开发)=UB(需求大,A开发,B开发)=4000UA(需求小,A开发,B开发)=UB(需求小,A开发,B开发)=-3000UA(需求大,A开发,B不开发)=8000UB(需求小,A不开发,B开发)=1000。。。。。。例如A认为高需求的概率是0.5,给定B选择开发,A选择开发的期望效用为:EuA(开发,开发)=0.5*4000+0.5*(-3000)=500Outcome&Equilibrium——结果与均衡博弈的结果是所有博弈方所关心的,如均衡策略组合,均衡行动组合,均衡支付组合。在房地产开发博弈中,可能的结果是(高需求,开发,开发),(uA,uB)=(4000,4000)(低需求,开发,不开发),(uA,uB)=(1000,0)均衡均衡是所有参与人的最优战略的组合,一般记为S*=(S1*,…,Si*,…,Sn*)其中,Si*是Playeri在均衡情况下的最优策略。在一般均衡理论中,均衡指由个人最优化行为导致的一组价格,而在博弈论里,这一组价格只是均衡的结果而不是均衡本身:均衡是指所有个人的买卖规则(战略)的组合,均衡价格是这种战略组合的结果在这里,“均衡”和“均衡结果”是两个不同的概念博弈分类博弈中的博弈方单人博弈两人博弈多人博弈博弈中的策略有限策略博弈无限策略博弈博弈中的得益零和博弈常和博弈变和博弈博弈的过程静态博弈动态博弈重复博弈单人博弈00M0A左B左A左B右A右B左A右B右单人迷宫得益矩阵入口出口(奖金M)单人迷宫AB单人博弈(M)AB(0)(0)单人迷宫扩展形两人博弈两人博弈就是在两个各自独立决策,相互具有策略依存关系的博弈方之间的决策问题两人博弈是博弈中最普通、最常见,也是研究得最多的博弈类型。如,囚徒的困境、齐威王与田忌赛马、猜硬币、石头·剪子·布,日常生活中的棋牌、球类比赛,以及经济活动中两厂商之间的竞争、谈判、兼并收购、劳资纠纷等等都是两人博弈问题两人博弈中的注意事项两个博弈方之间并不总是相互对抗,有时也会利益一致掌握信息较多并不能保证得益较多个人追求自身最大利益的行为常常并不能导致实现社会的最大利益。多人博弈例子11,1,100,5,55,0,52,2,2新技术老技术新技术老技术厂商2厂商厂商3—新技术(A)1厂商3—老技术2,2,21,10,110,1,15,5,0新技术新技术老技术老技术厂商2厂商(B)有限策略和无限策略不同的博弈问题中各博弈方可选策略的多少不同,一般分为:有限策略博弈和无限策略博弈有限策略(所有博弈方都只有有限种可选策略)的博弈只有有限种结果(一种结果就是每个博弈方各一种可选策略构成的一个组合,全部可能的结果的数量因而就等于各博弈方可选策略数的连乘积)有限策略博弈往往用支付矩阵、扩展形法将所有策略、结果及支付罗列出来。无限策略博弈其策略数种往往是一个连续数,只能用数集或函数式加以表示。有限策略与无限策略同时存在一个博弈问题中零和博弈零和博弈:社会总得益,即各博弈方得益之和总是为0-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面零和博弈零和博弈的特点:各博弈方之间的利益对立,“你死我活”的关系,结果不能完全确定,不能让他们猜出自己将选择的策略用零和博弈构成的重复博弈与非零和博弈构成的重复博弈会表现出很大的不同,零和博弈重复进行多次不改变博弈方之间相互对立的关系,其他博弈的重复博弈产生新的机会常和博弈常和博弈:每种结果之下各博弈方的得益之和不等于0,但总是等于一个非零常数,零和博弈本身可被看作是常和博弈的特例常和博弈的特点:各博弈方之间的利益关系也是对立的,博弈方之间的基本关系也是竞争不一定要有输家,利益的对立性体现在利益的多少,结果可能出现大家分得合理或者说满意的一份,因此也比较容易相互妥协和和平共处。这种博弈往往有一个确定的结果在重复博弈中,因为常和博弈的重复能使总得益增加,因此情况就会复杂得多,并会创造出许多新的结果变和博弈变和博弈:意味着在不同策略组合(结果)下各博弈方的得益之和不相同的变和博弈的特点:最一般的博弈类型,常和博弈和零和博弈则都是它的特例存在着社会总得益较大的策略组合和社会总得益较小的策略组合之间的区别,博弈方之间存在互相配合(不是指公开的合作,只是指各博弈方在利益驱动下各自自觉、独立采取的合作的态度和行为),争取较大的社会总得益和个人得益的可能性。这种博弈的结果可以从社会总得益的角度分为“有效率的”或“无效率的”、“低效率的”各博弈方之间的关系复杂,它们的重复博弈就更加复杂了博弈的过程(1)静态博弈:所有博弈方同时或可看作同时选择策略的博弈动态博弈:各博弈方不是同时,而是先后、依次进行选择、行动,后选择、行动的博弈方在自己选择行动之前一般能看到此前其他博弈方的选择、行动的博弈动态博弈与静态博弈中“策略”有差别:静态博弈中,博弈方都只有一次选择、行为的机会,“策略”是唯一的选择或行为,“策略”与“选择”、“行为”等价动态博弈中,一个博弈方可能有多次选择、行为,后选择、行为的博弈方在轮到选择、行为时会面临不同的情况,博弈方的决策内容就不是一个简单的单一选择,而是在每次轮到选择、行为时,面临各种情况,如何选择、行为的“完整的计划”,“策略”是指这种计划,策略与选择、行为之间不能简单等同博弈的过程(2)重复博弈:同一个博弈反复进行所构成的博弈过程重复博弈的分类:有限次重复博弈和无限次重复博弈重复博弈注意事项:重
本文标题:纳什均衡及应用举例-博弈论
链接地址:https://www.777doc.com/doc-1511465 .html