您好,欢迎访问三七文档
第十一章决策论TheoryofDecision11.1决策分析的基本问题11.2确定型和非确定型决策11.3风险型决策11.4效用理论11.5马尔可夫决策“决策”一词来源于英语DecisionAnalysis,直译为“做出决定”。所谓决策,就是为了实现预定的目标在若干可供选择的方案中,选出一个最佳行动方案的过程,它是一门帮助人们科学地决策的理论。11.1决策分析的基本问题1.引例计划用6个鸡蛋煎饼,现已经向碗里打了5个鸡蛋,在打第6个鸡蛋前,有三种不同行动方案可供选择:a1:向盛有5个好蛋的碗里打第6个鸡蛋;a2:向另一个碗里单独打第6个鸡蛋,以便检查好坏;a3:放弃第6个鸡蛋。第6个鸡蛋有两种自然状态:θ1:好蛋;θ2:坏蛋。各种行动方案在各种不同的自然状态下会产生不同的结果oij:好蛋θ1坏蛋θ2打入碗里a1o116个蛋煎饼o125个好蛋浪费,无蛋煎饼单独检查a2o216个蛋煎饼,多洗一个碗o225个蛋煎饼,多洗一个碗丢弃a3o315个蛋煎饼,浪费一个好o325个蛋煎饼决策问题的构成要素决策者可供选择的的方案(行动、策略)自然状态(不能被决策者所控制的客观存在的环境)结果(每一方案选择所导致的后果,即收益或损失)2.决策系统决策系统可以表示为三个主要因素的函数:D=D(S,U,V)①状态空间不以人的意志为转移的客观因素,设一个状态为Si,有m种不同状态,其集合记为:miSSSSSSim,1}{},,,{321S称状态空间,S的元素Si称为状态变量。(1)状态空间S(2)策略空间U(3)损益函数V②策略空间人们根据不同的客观情况,可能做出主观的选择,记一种策略方案为Ui,有n种不同的策略,其集合为:njuuuuUjn,,1}{},,,{21③损益函数当状态处在Si情况下,人们做出Uj决策,从而产生的损益值Vij,显然Vij是Si,Uj的函数,即:njmiuSvVjiij,2,1;,2,1),(U称为策略空间;U的元素Uj称为决策变量。当状态变量是离散型变量时,损益值构成的矩阵叫损益矩阵.111212122212(,)(,)(,)(,)(,)(,)()(,)(,)(,)nnijmnmmmnvSUvSUvSUvSUvSUvSUVVvSUvSUvSU10决策问题根据掌握的信息多少进行分类确定型决策问题不确定型决策问题风险型决策问题确定型决策:在决策环境完全确定的条件下进行的决策,一个方案只能有一种确定的结果,其自然状态是为人们所掌握的.例1.背包问题例2.N台机器,N个工作,每台机器安排一项工作,如何安排生产费用最小?风险型决策:在决策环境不是完全确定的情况下进行决策.由于存在不可控制的自然状态,采取一种方案可能出现几种不同的结果,各自然状态发生的概率已知。例:天气产值策略最好较好坏A101-2B840C333概率0.150.600.25不确定型决策:不确定型决策对于各自然状态发生的概率,决策者是一无所知的,只能靠决策者的主观倾向进行决策。常用的不确定型准则有:1.悲观准则2.乐观准则3.折衷法准则4.等可能性准则5.最小机会损失(后悔)准则特征:1、自然状态已知;2、各方案在不同自然状态下的收益值已知;3、自然状态发生不确定。例:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵):S1(需求量大)S2(需求量小)A1(大批量生产)30-6A2(中批量生产)20-2A3(小批量生产)105自然状态行动方案自然状态行动方案11.2不确定型决策一、最小最大准则(悲观准则)决策者从最不利的角度去考虑问题:先选出每个方案在不同自然状态下的最小收益值(最保险),然后从这些最小收益值中取最大的,从而确定行动方案。用a(Ai,Sj)表示收益值自然状态行动方案S1(需求量大)S2(需求量小)Min[(Ai,Sj)]1j2A1(大批量生产)30-6-6A2(中批量生产)20-2-2A3(小批量生产)1055(max)二、最大最大准则(乐观准则)决策者从最有利的角度去考虑问题:先选出每个方案在不同自然状态下的最大收益值(最乐观),然后从这些最大收益值中取最大的,从而确定行动方案。用a(Ai,Sj)表示收益值自然状态行动方案S1(需求量大)S2(需求量小)Max[(Ai,Sj)]1j2A1(大批量生产)30-630(max)A2(中批量生产)20-220A3(小批量生产)10510三、等可能性准则(Laplace准则)决策者把各自然状态发生的机会看成是等可能的:设每个自然状态发生的概率为1/自然状态数,然后计算各行动方案的收益期望值,最大的收益期望值为最优方案。用E(Ai)表示第i方案的收益期望值.自然状态行动方案S1(需求量大)p=1/2S2(需求量小)p=1/2收益期望值E(Ai)A1(大批量生产)30-612(max)A2(中批量生产)20-29A3(小批量生产)1057.5四、乐观系数(折衷)准则决策者取乐观准则和悲观准则的折衷:先确定一个乐观系数(01),然后计算:CVi=max[a(Ai,Sj)]+(1-)min[a(Ai,Sj)]从这些折衷标准收益值CVi中选取最大的,从而确定行动方案。自然状态行动方案S1(需求量大)S2(需求量小)CViA1(大批量生产)30-619.2(max)A2(中批量生产)20-213.4A3(小批量生产)1058.5取=0.7当=0时,是悲观准则,当=1时,是乐观准则.决策者从后悔的角度去考虑问题:当决策者选定决策方案后,结果发现所选方案并非实际最优方案,必然产生后悔.这种后悔,实际上是一种机会损失。一定自然状态下所选方案的收益值与该状态下最优方案的收益值之差越大,后悔就越大.五、后悔值准则后悔值:某自然状态下最大收益与该状态下其他收益之差1.计算出在各种自然状态下各方案的后悔值,2.从各方案的最大后悔值中,选取后悔值最小的方案为最优方案.自然状态行动方案S1(需求量大)S2(需求量小)Maxaij'1j2A1(大批量生产)0(30,理想值)11[5-(-6)]11A2(中批量生产)10(30-20)7[5-(-2)]10(min)a3(小批量生产)20(30-10)0(5,理想值)20S1(需求量大)S2(需求量小)A1(大批量生产)30-6A2(中批量生产)20-2A3(小批量生产)105自然状态行动方案自然状态行动方案本节学习要点1.针对不确定型决策,本节介绍的五种方法有一定的局限性,是因条件所限,没有办法的办法.2.不同的决策者有不同的决策习惯;同一个决策者当自身的实力发生变化时,对同一个决策问题也会采取不同的决策方法.结论分析:在难以准确估计事件发生概率的条件下进行投资决策,主要取决于决策者对风险的偏好,根据决策者对风险持有的态度,得到不同的最优方案.作业:p297-1特征:在决策环境不完全确定的情况下进行的决策,已知自然状态概率集。由于使用了概率,所以称此类决策为风险型决策.11.3风险型决策风险型决策期望收益决策法决策树法选择期望收益最大的方案为最优方案.1.期望收益决策法例某建筑公司承建一项工程,需要决定下个月是否开工.如果开工后天气好,可以按期完工,并可获得利润50万元;如果开工后天气坏则将造成损失20万元;如果不开工,不管天气是好还是坏,都要付出窝工损失5千元.根据历史气象统计资料,预计下月天气好的概率是0.4,天气坏的概率是0.6,数据列表见表4.10.为使利润最大,该公司应决定开工还是不开工?解:计算各方案的期望收益值.开工方案:0.450+0.6(20)=8(万元)不开工方案:0.4(5)+0.6(5)=5(万元)根据计算结果,如选择开工方案能够获利8万元;如选择不开工方案则损失5万元。因此,选择开工方案作为决策最优方案。例4.6某市一家报社,现在每天印刷一种晚报15万份,其大部分通过零售网点发行。据100天内的销量调查,每天出售该晚报份数的分布如表所示。已知该晚报每份售价为0.3元,成本为0.25元。该报社领导决定根据市场销售量调查结果,确定一个最佳印刷量,使期望利润最大.该报社领导应如何决策?晚报销量分布表销量(万份/天)1514131211天数1220302513晚报销量分布表销量(万份/天)1514131211天数1220302513解:有5个备选方案:每天印刷1S3S4S5S:15万份;:14万份;:13万份;:12万份;:11万份;2S每天出售该晚报份数(万份)的自然状态有5种:151N142N133N124N115N,,,,,相应的自然状态概率为:,12.0)(1NP,20.0)(2NP,30.0)(3NP,25.0)(4NP13.0)(5NPiSjN(,1,2,3,4,5)ijaij方案在自然状态下得到收益值为则收益矩阵为.),()()()(2211niniiiNPaNPaNPaSE1,2,,im=L有)(1SE)(2SE)(3SE)(4SE)(5SE1290,3430,4970,5610,5500)(4SE4S比较可知:最大,故:每天印刷12万份为最优方案。练习某冷饮店要拟订6,7,8月份雪糕的日进货计划。雪糕进货成本为每箱60元,销售价格为110元,即当天能卖出去,每箱可获利50元;如果当天卖不出去,剩余一箱就因冷藏费及其他原因而亏损20元.现市场需求情况不清楚,但有前两年同期180天的日销售资料,见表4.11。问:应怎样拟订雪糕的日进货计划,才能使利润最大?解(1)根据前两年同期日销售量资料,进行统计分析,确定不同日销售量的概率,见表4.11的最后一列。则每日利润的计算方法如下:各进货方案在不同的日销售量条件下的利润是随供需关系而定的.设以代表日进货量,以(2)根据每天的日销售量,编制不同进货方案的收益表(见表4.12)QD代表市场的日可能销售量,当QD(11060)50QQ时,利润;当QD时,利润(11060)20()7020DQDDQ例如,日进货50箱,售出50箱,即QD,利润为5050=2500元,5070-2060=2300元,见表4.12。若需求量大于50箱,利润仍为2500元;又日进货60箱而售出50箱,即QD,这时的利润为计算各个进货方案的期望利润值。各个方案的期望利润,是在收益表的基础上,将每个方案在不同自然状态下的利润值乘以该自然状态发生的概率值之和。(3)决策。从表4.12的计算结果可以看出:进货70箱的计划方案期望利润最大。因此,该店的最优进货方案是日进货70箱雪糕。2.决策树法决策树法是风险决策中常用的方法。优点是能使决策问题形象直观,思路清晰,便于思考与集体探讨。在多阶段决策活动中,它更是层次分明,一目了然,计算简便。决策树的结构画决策树的具体步骤:(1)从左向右绘制决策树;(2)从右向左计算各方案的期望值,并将结果标在相应方案节点的上方;(3)选收益期望值最大(损失期望值最小)的方案为最优方案,并在其它方案分支上打∥记号。主要符号决策点方案节点结果节点单级决策例4.7为了适应市场需要,某市提出了扩大某种电器生产的两个方案:一个方案是建设大工厂,另一个方案是建设小工厂,两者的使用期都是10年。建设大工厂需要投资600万元,建设小工厂需要投资280万元,两个方案的年收益或损失值及自然状态的概率见下表。试用决策树法做出合理的决策。对一个决策问题,如果只需进行一次决策就可以选出最优方案,达到决策目的,这种决策称做单级决策。年度益损值计算表单位:万元/年自然状态概率方案建大厂建小厂销路好0.720080销路差0.34060年度益损值计算表单位:万元/年自然状态概率方案建大厂建小厂销路好0.720080销路差0.34060解:第1步.画出决策树,如图所示。第2步.计算各点的期望收益值。如点②0.7200×10+0.3(40)×10=1280(万元)第3步.进行决策。把点②与点
本文标题:运筹学之决策论
链接地址:https://www.777doc.com/doc-623989 .html