您好,欢迎访问三七文档
李勇Lsyg168@sohu.com国际医药商学院博弈论一、猎人的选择引言两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!”二、囚徒的困境如果两人拒不认罪,由于证据不足,则以较轻的妨碍公务罪各判处1年徒刑;如果两人中有一人坦白认罪,那么坦白者从轻处理,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们各判5年监禁。如果两人拒不认罪,由于证据不足,则以较轻的妨碍公务罪各判处1年徒刑;如果两人中有一人坦白认罪,那么坦白者从轻处理,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们各判5年监禁。三、师生博弈学校为了维持正常的教学秩序,保证良好的教学效果,一般都要求老师上课点名。但并不是每次课都点名,因此有些学生就存在侥幸的心理想逃课。如果逃课没有被发现(也就是没有点名),那他(或她)就会利用逃课的时间获得一定的收益(比如睡懒觉,玩游戏等);但如果逃课被发现(也就是点名了),那么就会影响自己的成绩。另一方面,老师如果点名则要花费一定的时间;但是如果不点名又有很多学生逃课,那么由于上课的学生人数太少而影响教学效果和质量。学生是逃课还是不逃课教材:谢识予,经济博弈论(第三版),上海:复旦大学出版社,2002,1参考书目:张维迎,博弈论与信息经济学,上海:上海三联书店,上海人民出版社,1996,8罗伯特·吉本斯,博弈论基础,北京:中国社会科学出版社,1999,3让·梯若尔、朱·弗登博格,博弈论,北京:中国人民大学出版社,2002艾克里·拉斯缪森,博弈与信息,北京:北京大学出版社,2003,10教材与参考书目内容提要¾1.1博弈论概述¾1.2博弈模型的构成要素及分类¾1.3经典博弈模型简介第一章导论“博弈论”英文是“GameTheory”“游戏”与“博弈”下棋、打牌、猜硬币游戏的特征规则、结果、策略、策略与利益的相互依存性具有策略依存性的问题普遍存在寡头市场的产量决策、公共资源问题、军备竞赛等“博弈论”称谓学术性、理论性、严肃性1.1博弈论概述1.1.1“博弈论”的由来博弈博弈是指一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈论博弈论是研究具有策略依存性的多个决策主体的策略选择及其均衡的理论。(1)博弈论的早期思想¾2000多年前我国古代的“齐威王田忌赛马”¾1500年前巴比伦犹太教法典中的“婚姻合同问题”¾1838年的古诺(Cournot)模型,被看成是早期博弈研究的起点¾1883年伯特兰德(Bertrand)提出的通过价格进行博弈的寡头竞争模型与古诺模型有异曲同工之妙。¾1881年艾奇沃斯(Edgeworth)提出的“契约曲线”则是后来合作博弈论重要概念“核”的特例。1.1.2“博弈论”的发展历史(2)博弈论的诞生¾1944年,冯·诺伊曼(vonNeumann)和摩根斯坦(Morgenstern)出版了《博弈论和经济行为》(TheTheoryofGamesandEconomicBehavior),标志着博弈论的诞生。¾该书的重要意义:促进了博弈论与经济学之间的联系;对博弈论的发展具有里程碑式的意义。vonNeumann98岁就掌握了微积分,19岁发表了第一篇学术论文930岁成为昀年轻的普林斯顿数学学院6名教授之一920世纪40年代开始转向应用数学领域z1943年为Manhattan项目的顾问(atomicbomb)z1944年第一台计算机的诞生,他作了主要贡献z1944年与摩根斯坦合作第一部博弈论著作91957年英年早逝(纯粹数学、应用数学、物理学)(1903-1957)(3)博弈论的成长和发展20世纪50年代,博弈论研究出现第一个高潮91950年纳什在普林斯顿的博士论文中首次提出了纳什均衡(NashEquilibrium)概念、并证明了纳什均衡存在性的纳什定理。91950年在兰德公司进行了“囚徒困境”博弈实验。91952-1953年间Shapley和Gillies提出了“核”(Core)作为合作博弈的一般概念,Shapley还提出了合作博弈的“Shapley值”概念。20世纪50年代中后期到70年代的兴盛期91965年,塞尔腾(Selten)提出了“子博弈完美纳什均衡”。91967-1968年,海萨尼(Harsanyi)提出了“贝叶斯纳什均衡”。91972年,JohnMaynardSmith发展了“进化博弈论”,提出了“进化稳定策略”(ESS)。(4)博弈论的成熟以及与主流经济学的融合20世纪80、90年代是博弈论走向成熟的时期91981年,Kohlberg引进了“顺向归纳法”(ForwardInduction)91982年,Kreps和Wilson提出了“序列理性”(SequentialEquilibrium)91988年,海萨尼(Harsanyi)和塞尔腾(Selten)提出了在非合作博弈和合作博弈中均衡选择的一般理论和标准91991年,弗登博格(Fudenberg)和泰勒尔(Tirole)提出了“完美贝叶斯均衡”的概念。博弈论在经济学中被广泛运用多名博弈论专家获得诺贝尔经济学奖2005年诺贝尔经济学奖授予奥曼(Aumann)和谢林(Schelling),以表彰他们“通过博弈分析,促进了人们对冲突与合作的理解”奥曼(Aumann)谢林(Schelling)2007年诺贝尔经济学奖授予赫维奇、马斯金、迈尔森,以表彰他们在创立和发展“机制设计理论”方面所作的贡献。研究内容博弈论系统研究各种博弈问题,寻求各博弈方在不同理性、能力条件下,合理的策略选择以及均衡的博弈结果,并分析这些结果的经济意义、效率意义。1.1.3博弈论的研究内容及方法研究方法¾昀大化分析前提:理性经济人;方法:给定其他博弈方的策略,寻求能够昀大化自身利益的策略。¾均衡分析均衡:指行为主体间相互作用的一种状态,在该状态下,没有人能够通过改变自身的策略而谋取更多的利益。方法:寻求各博弈方的策略对其他博弈方的昀佳对策1.2博弈模型的构成要素及分类1.2.1博弈模型的构成要素(1)博弈方博弈方/参与人(Players)是指博弈中独立决策、独立承担博弈结果的个人或组织,其目的是通过选择策略以昀大化自身的支付(效用)水平。博弈方可以是自然人或团体或法人,如企业、国家、地区、社团、欧盟、北约等。自然也可以作为虚拟的参与人。单人、两人、多人博弈。(2)策略策略(Strategies)是指博弈方在博弈中可以选择采用的行动方案,是参与人在给定信息结构的情况下的行动规则,它规定博弈方在什么时候什么情况下采取什么行动。策略是博弈方的行动计划,如“人不犯我,我不犯人;人若犯我,我必犯人”。博弈方可以选择的全部策略构成“策略空间”。有限博弈与无限博弈。(3)得益得益/支付(Payoffs)是指博弈方在各种策略组合下所获得的收益。得益可以是利润、收入,也可以是一个特定策略组合下某个参与人得到的确定效用水平,或者是期望效用水平。博弈方的得益不仅取决于自己的策略选择,而且取决于所有其他博弈方的策略选择,是策略组合的函数。得益是博弈方行为和判断的主要依据。零和、常和、变和博弈。(4)行动的顺序行动的顺序(theorderofplay)是指博弈方实施决策活动的顺序。在其他因素不变的情况下,如果行动的顺序不同,那么博弈方的昀优策略就不同,博弈的结果也不同。事实上,不同的顺序安排意味着不同的博弈。静态博弈与动态博弈。(5)信息信息(information)是指一个博弈中博弈方有关该博弈的知识,如关于其他博弈方的选择、策略集、支付函数、行动时间等.信息集(informationset)主要出现在动态博弈中,可理解为参与人在特定时刻上对有关变量的值的知识;一个参与人无法准确知道的变量的全体属于一个信息集。关于得益的信息¾完全信息(CompleteInformation)各博弈方都完全了解所有博弈方在各种情况下得益的信息称为完全信息。¾不完全信息(IncompleteInformation)至少存在部分博弈方不完全了解其他博弈方得益情况的信息称为不完全信息。关于博弈过程的信息¾完美信息(PerfectInformation)在动态博弈中,轮到行为时,博弈方对博弈的进程完全了解,称这样的信息为完美信息。¾不完美信息(ImperfectInformation)在动态博弈中,轮到行为时,博弈方不完全了解此前全部博弈进程,称这样的信息为不完美信息。(6)理性完全理性与有限理性¾完全理性9具有完美的分析判断能力和不会犯选择行为的错误9完全理性要求博弈方具有完美的理性意识、分析推理能力、识别判断能力、记忆能力以及准确行为能力。¾有限理性不满足完全理性要求则称为有限理性个体理性与集体理性¾个体理性以个体利益昀大化为目标称为“个体理性”¾集体理性追求集体利益昀大化称为“集体理性”¾个体理性与集体理性往往并不一致1.2.2博弈的分类博弈非合作合作完全理性有限理性静态动态完全信息不完全信息完全且完美完全但不完美重复不完全信息基本模型警察抓住了两个合伙犯罪嫌疑人,但是缺乏足够的证据指证他们的罪行。如果其中至少有一人供认犯罪,那么罪名就成立。为了得到所需要的口供,警察将这两名犯罪嫌疑人分别单独关押以防止他们串供,并给他们同样的选择机会:如果两人拒不认罪,由于证据不足,则他们以较轻的妨碍公务罪各判处1年徒刑;如果两人中有一人坦白认罪,那么坦白者从轻处理,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们各判5年监禁.1.3经典博弈模型简介1.3.1囚徒的困境得益矩阵初步分析(结果、意义)-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒11.3.2猜硬币博弈-1,11,-11,-1-1,1正面反面正面反面猜硬币方盖硬币方是否存在可以预测的稳定的博弈结果?基本模型猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另-头装有-个按纽,控制着猪食的供应。按一下就会有10单位的猪食进槽,但谁按谁就要付出相当于2单位猪食的成本。当猪食进槽时,若大猪先到,大猪可吃到9单位,小猪吃到1单位;若小猪先到,则小猪可吃到4单位,大猪吃6单位;若两者同时到,则大猪可吃7单位,小猪吃3单位。1.3.3智猪博弈得益矩阵5,14,49,-10,0按等按等小猪大猪基本模型一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。妻子更想去看时装表演而丈夫则更想去看足球赛,但又不愿意分头行动,争执不下就决定双方投票一次决定。若同时选择时装则去看时装表演;若同时选择足球则去看足球赛;若选择不一致则哪儿都不去。1.3.4“夫妻之争”博弈得益矩阵2,10,00,01,3时装足球时装足球丈夫妻子基本模型(得益、博弈方)学生如果逃课没有被发现(也就是没有点名),那他(或她)就会利用逃课的时间获得2单位的收益;但如果逃课被发现(也就是点名了),那么就会影响自己的成绩,其得益为-3单位。如果学生不逃课,那么不论老师是否点名,他(或她)来上课获得的收益是1单位。另一方面,老师点名则要花费一定的时间,如果点名时没有逃课的,那么老师的得益为-1单位;如果点名时有逃课的,那么老师的得益此时为-2单位。如果老师不点名又有很多学生逃课,那么由于上课的学生人数太少而影响教学效果和质量,此时他的得益为-4单位;如果学生不逃课,老师也不点名,那么老师由于节省了点名的时间,并且学生都来上课了,教学效果很好,因此老师此时的得益为2单位。讨论:师生博弈得益矩阵(1)-2,-3-1,1-4,22,1点名不点名逃课不逃课学生老师老师和学生的昀佳对策各是什么得益矩阵(2)——奖惩分明-2,-5-1,3-4,22,3点名不点名逃课不逃课学生老师老师和学生的昀佳对策各又是什么内容提要¾2.1基本分析思路和方法¾2.2纳什均衡¾2.3无限策略博弈分析和反应函数¾2.4混合策略和混合策略纳什均衡¾2.5纳什均衡的存在性¾2.6
本文标题:博弈论
链接地址:https://www.777doc.com/doc-4411624 .html