您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 环境污染监督博弈的动态性分析与控制策略
华中科技大学博士学位论文环境污染监督博弈的动态性分析与控制策略姓名:蔡玲如申请学位级别:博士专业:系统工程指导教师:王红卫2010-03-29华中科技大学博士学位论文I摘要政府对生产排污企业的监管机制是降低环境污染失控引起的风险和落实各项环境政策的关键,环境污染问题的动态性和复杂性使得对它的预测和控制经常失效,因此,对环境污染监管机制的研究刻不容缓。博弈论为解决环境问题中各种冲突关系提供了一种有效的理论工具。然而,目前利用传统博弈论分析环境问题主要关注博弈均衡的求解问题,忽略了有限理性条件下动态博弈过程的不确定性;近年来基于有限理性的演化博弈研究主要讨论演化稳定策略的存在性,缺少对该问题相关控制策略的分析;而针对环境污染中多人博弈问题,现有文献主要从企业“联合排污”的合作角度分析,忽略了企业之间普遍存在的“竞争”关系。鉴于此,本文尝试分析政府与生产排污企业之间监督博弈的动态演化过程,利用惩罚策略对博弈过程的波动性进行优化控制,抑制企业的超标排污行为。本文以政府与生产排污企业之间的监督博弈演化过程为研究对象,以优化惩罚策略为主要控制手段,围绕博弈的动态性分析和稳定性控制展开研究。文中利用博弈论对政府与生产排污企业之间长期的动态监督关系进行建模,将动态系统分析工具与系统动力学计算机仿真手段相结合,分析惩罚策略等环境政策对博弈过程和均衡的影响,揭示博弈过程的动态性,并尝试给出惩罚策略优化结构模式。具体来说,本文首先建立政府与生产排污企业之间混合战略博弈的系统动力学仿真模型,在假设博弈参与者策略变化率与期望获益成正比的条件下,分别分析了初始模型和信息延迟模型。在初始模型中假设信息获取不存在延迟,则博弈均衡需要经过多次博弈才能达到;在信息延迟模型中,针对博弈均衡的不可达提出了双重惩罚策略。通过稳定性分析指出了模型的均衡状态为临界稳定,任何微小的扰动都可能造成博弈均衡的不可达,从而揭示博弈过程动态性研究的重要性。接着,考虑有限理性条件下政府与生产排污企业之间的监督博弈动态演化过程,针对一般支付矩阵下不存在演化稳定策略的情况,提出了罚款额度与污染程度相关的动态惩罚策略,并通过理论分析和仿真证明了动态惩罚策略条件下演化稳定均衡的存在性。随后,进一步考虑政府对竞争条件下两个企业的监督博弈动态演化过程。通过对多人不对称演化博弈过程的仿真分析,指出罚款额度的惩罚系数k的大小与博弈过程的动态性密切相关。一般惩罚策略能有效抑制环境污染,而动态惩罚策略则在博弈过程波动性控制方面具有明显效果。华中科技大学博士学位论文II以控制环境污染和抑制博弈过程波动性为目标,本文昀后优化惩罚策略模式结构。分析了带停产整顿期(SOP)和不带停产整顿期(NSOP)的两种惩罚机制下政府与生产排污企业的微分博弈模型,指出了优化的惩罚策略模式不仅与企业超标排污行为相关,而且与政府环境监管部门的策略选择相关。关键词:环境污染;监督博弈;控制策略;惩罚策略优化;动态性分析;演化稳定策略;多人不对称演化博弈.华中科技大学博士学位论文IIIAbstractThesupervisionmechanismofenvironmentalregulationiscriticaltoreducetheriskoftheuncontrollablepollutionandtoensuretheperformanceofenvironmentpolicies.Thedynamicsandcomplexityoftheenvironmentalpollutioncommonlyinvalidatesthepredictionandcontrolstrategiesinreallife.Therefore,itisessentialtoinvestigatetheenvironmentalsupervisionmechanism.Gametheoryisaneffectivemethodologytoresolvetheconflictsontheenvironmentalresources.However,therelatedressarchworksuptodatemainlyfocusonfindingtheequilibriumstatesusingtraditionalgametheory,regardlessoftheuncertaintiesinducedbytheboundedrationalityinthedynamicgamingprocedure.TherecentstudiesontheapplicationofevolutionarygamemostlypayattentiontotheexistenceoftheEvolutionaryStableStrategy,inspiteofthediscussionaboutthecontrolstrategies.Researchesonmulti-persongamefocusedonthe“cooperativepollution”firms,neglectingthefactthatthecompetitionsbetweenfirmsaremorecommon.Thus,theobjectiveofthisthesisistoinvestigatethedynamicprocedureofsupervisorygameandtooptimizethepenaltymechanismtocontroltheover-pollutionbehavioroffirms.Thisthesisinvestigatesthedynamicsanalysisofevolutionaryprocedureofsupervisorygameandtheoptimizationofpunishmentstrategyasacontrolmethod.Thelongtermdynamicsupervisoryrelationshipbetweengovernmentandpollutingfirmsismodelledusinggametheory.ThedynamicsystemsanalysismethodologycombinedwithSystemDynamics(SD)areusedtostudytheeffectsofenvironmentpolicies,especiallythepenaltymechanism,ontheNashequilibriumandthecomplexdynamicgamingprocedure.Anoptimizedpunishmentstrategyisproposedinadifferentialgameframework.Inparticular,thisthesisfirstlydevelopsaSystemDynamicmodelformixed-strategygamebetweenthegovernmentandthepollutingfirm,withoutorwiththeconsiderationofinformationdelay.Forthecasewithoutinformationdelay,ittakesbothgameplayersalongtimetoreachtheNashequilibrium.Forthecasewithinformationdelay,adoublepenaltyisproposedtodealwiththeunreachableNashequilibrium.Asacriticalstablestate,theNashequilibriummightbeunreachablebyanysmallperturbation.SothedynamicanalysisofpathstotheequilibriumstateismoresignificantthantheNashequilibriumitself.Subsequently,consideringtheboundedrationalofdecision-makers,thedynamicevolutionaryprocedureoftwo-playerasymmetricgamemodelisinvestigated.Adynamic华中科技大学博士学位论文IVpenaltyissuggestedtodealwiththeproblemthattheredoesnotexitevolutionarystablestrategy(ESS)undertheconditionofstaticpayoffmatrix.Theoryanalysisandcomputersimulationvalidatethedynamicpenalty.Thisthesisfurtherconsidersthecompetitiverelationshipsbetweenthepollutingfirms.Thedynamicprocedureofmulti-personasymmetricevolutionarygamemodelisdeveloped.Thepenaltyfactork,whichindicatesthelimitoffine,iscloselyrelatedwiththevolatilityofthedynamicevolutionaryprocedure.Thestaticpenaltyhasabettereffectontherestrainofenvironmentalpollution,whilethedynamiconecanstabilizethefluctuationduringtheevolutionarygameprocedure.Lastly,itisconsidered,withintheframeworkofadifferentialgame,thattheenforcementofregulatorusinganappropriatepenaltycanforceapollutingfirmtoactinasociallyoptimalway.Twodifferentpenaltymechanisms,onewiththesuspensionofproduction(SOP)andtheotherwithoutSOP(NSOP),arediscussed.Acompletelyrestrainingpenalty(CRP),whichrelatestobothplayers’strategies,isidentifiedtoreducetheprobabilityofthefirm’spollutionbehaviors.Keywords:Environmentalpollution;supervisorygame;controlstrategy;optimizedpunishmentstrategy;dynamicanalysis;EvolutionaryStableStrategy;multi-personasymmetricevolutionarygame.独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和
本文标题:环境污染监督博弈的动态性分析与控制策略
链接地址:https://www.777doc.com/doc-829767 .html