您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 耶鲁大学公开课博弈论笔记-博弈论-讲-
博弈论作业(博弈论24讲)数应专业一、1、理性人:指代这一类人,他们只关心自己的利益。2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。结论:不要选择严格略施策略。3、理性人的理性选择造成了次优的结果4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等5、协和谬误收益很重要,“如欲得之,必先知之”6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注意别人会怎么选择二、1、打渔问题、全球气候变暖与碳排放问题2、博弈的要素:参与人、策略集合、收益3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择4、军队的入侵与防卫问题5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性6、共同知识与相互知识的区别三、1、利用迭代剔除法领悟中间选民问题2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对优势的策略3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二维坐标系画出选择策略之后的收益分布四、1、罚点球:一个经过模型简化的点球模型:罚球者可以选择左路,中路,右路3种路线去踢点球,门将可以选择向左扑救或者向右扑救(门将没有傻站着不动的option)。罚球者的收益很容易理解出来,其结论是,无论什么时候,罚球者向中路踢都不是一个最优的选择。(当门将向左扑的概率大于50%时,球员向右踢比较好;反正同理)。将其推广:2、不要选择一个在任何“信念”(belief)下都不是最优策略的策略。3、这里的信念(原文是belief)并不是指门将会向左扑或者向右扑,而是指概率。我的理解是对中庸之道的批判。所以本例中,虽然罚球者的3种策略里没有劣势策略,不过还是可以用以上原则剔除掉一个策略。4、上述模型忽略的2个地方,①一名惯用右脚的球员,他向左踢和向右踢的准确率是不同的(踢过球的童鞋们都有这种体会,右脚球员从左侧进攻射门的舒适度比从右侧射门要好很多)。②门将可以选择在中路(TOBECONTINUED)五、1、纳什均衡(简称NE)定义2、学习NE的动机:不为当时做出的决定后悔,因为已经采取了最佳策略。3、任何参与人都严格不会改变策略,改变策略严格不会使参与人获得增益。4、其他参与人不改变行为的前提下,自己改变行为并没有任何好处。5、严格劣势永远不是最佳策略,最佳策略才可以出现NE。6、博弈会朝着趋向于一个均衡的方向自然发展,结果不断趋向一个NE7、较劣的不投资均衡相当于较优的NE处于帕累托劣势8、协调之所以能达成在于他不同于囚徒困境,它没有去说服人们采取一个严格劣势策略。六、1、举一个例子“一起看电影”,它的博弈学名叫“性别大战”,属于协调博弈,但是不同的参与人偏爱不同2、古诺的双寡头模型,讲的是同一个市场中只有两家公司互相竞争,该博弈介于完全竞争和垄断的两种极端情况之中,所以使得该博弈变得很有趣,在该博弈中参与人是:两家公司,策略是:生产同质商品的产量,q1、q2表示策略,生产成本;c*q,边际成本实常数c,市场价格:p=a-b*(q1+q2),可以画出需求曲线,收益:u1=p*q1-c*q1,垄断产量:(a-c)/2b完全竞争产出:(a-c)/b古诺产出:(a-c)/3b3、它与合伙人博弈及投资博弈都不同,它不是策略互补博弈,而是策略替代博弈,就是我的策略实施的越多,你的策略就实施的越少4、有没有使市场利润达到最大化的双方的产量?当第一家公司产量为垄断产量时或第二家公司产量为垄断产量时,市场利润达到最大化5、当两家公司得产量为(a-c)/3b时,此时整个行业的总产出为2*(a-c)/3b,而完全竞争产量为(a-c)/b,,垄断产量为a-c)/2b,所以古诺产出介于两者之间。七、1、介绍了伯川德模型,该博弈中参与人:生产相同的产品的两个公司,成本是固定的边际成本,生产1个单位产品消耗成本c策略:定价,该例中用1p代表公司1的价格,用2p代表公司2的价格,注意此处不同于前面课程用s来表示参与人的策略,2、家庭作业,介绍了线性城市模型,一个路贯穿城市,两个公司分别坐落在0、1点,消费者y到公司1的距离为y,到公司2的距离为1-y,假设每个消费者买且只买一个产品。消费者会选择对他而言总成本最小的例如:在y点的消费者,如果从公司1购买则他们支付21pTy,产品的价格1p,和交通成本2Ty;到公司2购买则需要支付211pTy,交通成本以距离的平方的速率增长。3、候选人选民模型,首先做出一些假设,假设选民在线上平均分布,候选人数目不固定,候选人不能选择他们的政治立场,每个选民都是一个潜在的候选人,且选民会将选票投给离他最近的候选人。在该博弈中参与人:选民策略:是否参选(选民将选票给与最近的候选人,得票最多者当选,平局掷硬币)收益:获胜赢得奖励B,参选付出成本C,且B2C;若选民不参选获胜者的立场距离该选民越远,则该选民将承受越重的负面效应,若该选民在线上X点,获胜者在Y点,则承担XY的成本,两点间距离的负向效应,也就是对方当选后给未参选的选民造成郁闷程度。八、1、原有左派1人和右派1人两派系,原本各占一半优势,如果左派又出现一个候选人,则左派将失去优势,右派获胜反之,右派出现新的候选人,亦可同理分析;2、原有极左、极右两人进行较量各占一半优势时,如果新进候选人持中立态度,则他/她有可能会成为获胜者;3、如果两个候选人极左、极右,则会出现新的候选人;4、种族隔离:大个子、矮个子选择居所问题:至少有三个纳什均衡存在,①是大个子住甲城,矮个子住乙城,②是大个子住乙城,矮个子住甲城,③混居且甲乙两成各占一半人口。其中①②为稳定均横,③为弱均衡;还有可能会出现一个均衡,那就是所有人选择了甲城/乙城,后被重新随机分配,这样的结果会趋于混居。5、一些看似不起眼的博弈规则可能是很重要的条件,有可能在短时间内说明问题,尤其在建模过程中不可忽视之6、不可轻易的根据可观察的东西来武断的下定义,比如说不能因为看到种族隔离,就认为人们喜欢种族隔离,它的存在可能与个人的偏好无关7、石头剪刀布游戏没有纯策略纳什均衡,在玩家双方均以(1/3,1/3,1/3)的混合策略选择时,才会出现唯一的纳什均衡九、1、混合策略的收益就是每个纯策略预期收益的加权平均值,该加权平均值一定位于混合策略所包含的纯策略预期收益之间2、如果一个混合策略是你的最优策略,那么该策略中的所有纯策略本身也都是最佳策略3、一个混合策略(P1*,P2*,……Pn*),是一个混合策略NE,当且仅当对任意参与人i,在面对P-i*时他的混合策略Pi*,是该参与人的BR4、混合策略在网球比赛中的应用:①本博弈不存在纯策略纳什均衡②如果V的混合策略均衡是纳什均衡,则策略L与R的预期收益相等,类似的,如果S的混合策略均衡是纳什均衡,则策略l与r的预期收益相等③混合策略纳什均衡NE:V(0.7,0.3)S(0.6,0.4)④如果S防左的概率大于0.6,那么V的BR是把球打向右侧如果S防左的概率小于0.6,那么V的BR是把球打向左侧十、1、我们只需考虑改选纯策略是否严格有利即可,如果不存在改选纯策略的严格有利改变,那么也就不存在改选混合策略的严格有利改变2、不存在改变纯策略的严格有利改变,则任何一个纯策略的收益都与混合策略的收益相等3、例子①applepicking摘苹果②YaleRepandseeplay耶鲁剧院去看戏③性别大战④税收问题纳税人的收益:对均衡纳税意愿有影响,决定着纳税人的混合策略是审计员的收益,不改变审计员的收益,当然也就不会改变纳税人的均衡混合策略。十一、1、进化论(Evolution)博弈论对生物学的重大影响,尤其在动物行为学中把基因看成策略,把遗传适应性当做收益,好的策略使种群不断壮大,即有适合基因的个体会繁衍,带有不适合基因的个体会灭绝。将动物的行为(策略)看做是天生,而不是自由选择简化模型,专注于种内竞争,通过双人对称博弈来进行研究,很大的种群,采取的策略与生俱来,对其进行随机配对。即采取相对成功策略的个体数量会增长,相反则会减少。不存在基因的重新分配。结论:①自然选择的进化结果是很糟的②如果一个策略是严格劣势策略,那么它就不是ES2、一个经济学案例:假设市场中存在这样的公司,这些公司并不关心什么策略能最大化利润,什么策略能尽可能降低成本,它们可能毫无科学根据地选择策略,在竞争激励的市场环境下,只有那些成本较低但利润颇丰适应环境的公司才能得以生存下来。公司倒闭和基因灭绝道理是类似的。十二、1、判定ES的方法:第一检验,对称NE(a,a)第二检验,是否是严格NE?(a,a)不是严格NE第三检验,a在偏移时的收益2、社会传统的进化(靠左行车还是靠右行车)可以有多种进化稳定的社会传统存在;社会没有绝对的高效率,习惯没有必要一样好3、自然界中混合均衡的两个解释①基因本身是随机的②稳定混合也意味着在ES中,以这种比例稳定存在4、鹰—鸽之争十三、1、帽子里的钱2、顺序博弈参与人2在作出决定之前知道参与人1的决策,且参与人1知道这种情况。…………关键问题是作出预测,沿着树形图向下看,站在后行动参与人的立场上思考,看下级参与人会有什么动机,找到他们的BR,再根据树形图倒回来。即向树的分枝看,然后在回到树的主干上来3、逆向归纳法4、希望得到一个更好的结果,某种动机却阻止我们达成更好的结局,称之为道德风险。典型的道德风险:选择限制项目的规模,或者说贷款额度,通过降低规模来降低被骗的风险。5、承诺(commitment)减少可选策略而改变其他人的行为,改变不了其他人的行为则毫无意义。十四、1、介绍了斯塔克伯格模型,探寻是先下手为强,还是等其他决策者决策后再决策更有优势,然后采用逆向归纳法来解决,得出结论,在斯塔克伯格模型下,厂家1不需要知道厂家2的产量也能有理由超过古诺产量继续生产,,因为这可以迫使对手减产,对厂家1是有利的,并且通过分析可以得出厂家1的利润将会高于古诺模型中的利润(双方取到纳什均衡解),而厂家2的利润将会低于古诺模型下取得的利润,还知道总生产量会上升,(视频中通过纯数学方法证明了上面所讨论的结论)。2、举了nbc和梅铎两家报纸公司建设厂房的例子,假设梅铎雇了间谍去nbc,并且nbc也知道有间谍,则nbc会选择建设一个很大的报纸厂房,说明有时获得更多的信息并不有利于决策,但是生活中也有很多后行者得利的例子,比如玩“石头,剪子,布”游戏时,大家都想在后面出手,除非你想输,在比如买家具,我可以让邻居先买,看他用的情况然后我在决定买不买,等等3、斯塔克伯格模型是一个先行者占优势的例子,完了“nim”的游戏,有两堆石头,有两个玩家,他们轮流去掉两堆石头里的石头,谁得到最后一个石头谁就获胜,这是一个既有先行优势,也有后行优势的博弈。(如果两个玩家都会玩这个游戏时,永远不要在两堆石头相等时获得选择权,如果你先选,就让两堆石头相等)。十五、1、策梅洛定理(Zermelotheorem)两个参与人,完全信息博弈,博弈有限节数三个结果参与人1win;loss;tie参与人1有赢策略,不论参与人2如何应对参与人1有平局策略,不论参与人2如何应对参与人2有赢策略,不论参与人1如何应对可以用数学归纳法证明之2、举例:Marienbad石子阵列,N行M列,可供选择的策略,被选中的点,其右、上的所有石子
本文标题:耶鲁大学公开课博弈论笔记-博弈论-讲-
链接地址:https://www.777doc.com/doc-5963044 .html