您好,欢迎访问三七文档
第十一章统计决策统计决策是统计科学中一个相对比较新的研究领域。自统计学家瓦尔德(A.Wald)1950年发表第一本关于统计决策的专著《统计决策函数》(StatisticalDecisionFunctions)。课时安排第一节统计决策的基本概念(0.5学时)第二节完全不确定型决策(1学时)第三节一般风险型决策(0.5学时)第四节贝叶斯决策(2学时)第一节统计决策的基本概念一、什么是统计决策二、统计决策的基本步骤三、收益矩阵表一、什么是统计决策狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。二、统计决策的基本步骤确定决策目标决策目标是决策者希望达到的结果。反映决策目标的变量,称为目标变量。拟定备选方案备选方案是决策者可以调控的因素。行动变量和行动空间。列出自然状态状态是指实施行动方案时,可能面临的客观条件和外部环境。状态空间和状态空间的概率分布。选择“最佳”或“满意”的方案实施方案三、收益矩阵表状态θ1θ2…θn概率P1P2…Pn方案a1a2…amq11q12…q1nq21q22…q2n…………qm1qm2…qmn收益矩阵的元素qij反映在状态θj下,采用行动方案ai得到的收益值。这里所说的收益是广义收益指标。这里所说的收益是广义的,利润、产量、销售收入等属于正的收益指标,成本、亏损等属于负收益指标。收益是行动方案和自然状态的函数,qij=Q(ai,θj)i=1,2,…,m;j=1,2,…n表11-2某项投资的收益矩阵表单位:万元状态需求大需求中需求小概率0.50.30.2方案方案一方案二方案三400100-140200200-20000第二节完全不确定型决策一、完全不确定型决策的准则二、各种准则的特点和适用场合一、完全不确定型决策的准则(一)最大的最大收益值准则先选出各种状态下各方案的最大收益值,然后再从中选择最大收益所在的方案a*={qij}(11.2)(二)最大的最小收益值准则先选出各种状态下各方案的最小收益值,然后再从中选择最大者所对应的方案a*={qij}(11.3)jiMaxMaxjiMinMax•(三)最小的最大后悔值准则后悔值是由于决策失误而造成的最大可能收益值与其实际收益值之差。rij=Q(ai,θj)qij;rij≥0(11.4)该准则主张应先选出各种状态下每个方案的最大后悔值,然后再从中选择最小者所在的方案。a*={rij}(11.5)jiMAXMin•(四)折衷准则主张根据经验和判断确定一个乐观系数α(0≤α≤1),计算各方案的期望收益值,并选择期望收益值最大的方案。E(Q(ai))=α{qij}+(1-α){qij}(11.6)a*=E(Q(ai))(11.7)iMaxiMiniMax(五)等可能性准则假定未来各种状态可能出现的概率相同,在此基础上求得各方案收益的期望值,并以期望收益值最大的方案作为所要选择的方案。a*=MaxE(Q(ai))(11.8)E(Q(ai))=(i=1,2,---,m)(11.9)njjinq11,【例11-3】假设例11-1中(见表11-2),有关市场状态的概率完全不知道,试求出后悔矩阵并根据最小的最大后悔值准则进行决策.解:市场需求大Q(ai,θ1)=400市场需求中Q(ai,θ2)=200市场需求小Q(ai,θ3)=0代入求后悔的公式可求得以下后悔矩阵。根据最小的最大后悔值准则,应选择方案一。表11-3某项投资的后悔矩阵表单位:万元状态需求大需求中需求小方案方案一方案二方案三01001402000204002000二、各种准则的特点和适用场合最大的最大收益值准则只有在客观情况很乐观,或者即使决策失误,也可以承受损失的场合才采用。最大的最小收益值准适用于对未来的状态非常没有把握,或者难以承受决策失误损失的场合。最小的最大后悔值准则适用于不愿放过较大获利机会,同时对可能出现的损失有一定承受力的场合。折衷准则事实上是假定未来可能发生的状态只有两种:即最理想状态和最不理想状态。前者发生的概率是α,后者发生的概率是(1-α)。当α=1时,该准则等价于乐观准则,而当α=0时,该准则等价于悲观准则。第三节一般风险型决策一、自然状态概率分布的估计二、风险型决策的准则三、利用决策树进行风险型决策一、自然状态概率分布的估计一般风险型决策中,所利用的概率包括客观概率与主观概率。客观概率是一般意义上的概率可来源于频率估计,通常是由自然状态的历史资料推算或按照随机实验的结果计算出来的。主观概率是决策者基于自身的学识、经验作出的对某一事件发生的可能性的主观判断二、风险型决策的准则(一)期望值准则以各方案收益的期望值的大小为依据,来选择合适的方案。(二)变异系数准则在期望值达到一定数额的前提下,以变异系数较低的方案作为所要选择的方案。(三)最大可能准则以最可能状态下可实现最大收益值的方案为最佳方案。只有当最可能状态的发生概率明显大于其他状态时,应用该准则才能取得较好的效果。(四)满意准则首先给出一个满意水平。然后,将各种方案在不同状态下的收益值与目标值相比较,并以收益值不低于目标值的累积概率为最大的方案作为所要选择的方案。利用该准则的决策结果,与满意水平的高低有很大关系。【例11-8】试利用例11-1(见表11-2)中给出的收益矩阵表的资料,根据满意准则选择满意的投资方案,假定给出的满意水平有200万元和400万元两种。解:(1)P{Q(a1,θj)≥200}=0.5P{Q(a2,θj)≥200}=0.5+0.3=0.8P{Q(a3,θj)≥200}=0方案二达到满意水平的累积概率最大,所以选择方案二。(2)P{Q(a1,θj)≥400}=0.5P{Q(a2,θj)≥400}=0P{Q(a3,θj)≥400}=0方案一达到满意水平的累积概率最大,所以选择方案一。三、利用决策树进行风险型决策决策树是是一种将决策问题模型化的树形图。决策树由决策点、方案枝、机会点、概率枝和结果点组成。利用决策树对方案进行比较和选择,一般采用逆向分析法,即从树形结构的末端的条件结果开始,从后向前逐步分析。决策树图适用于求解复杂的多阶段决策问题。【例11-9】某厂拟安排明年生产。方案一是继续利用现有的设备,零部件的单位成本是0.6万元。方案二是进行更新改造,改造需要投资100万元,成功的概率是0.7。如果成功,零部件不含上述投资费用的单位成本可降至0.5万元;如果不成功,则仍用现有设备生产。另据预测,明年该厂某零部件的市场销售价格为1万元,其市场需求有两种可能:一是2000件,二是3000件,其概率分别为0.4和0.6。试问:(1)该厂应采用何种方法组织生产?(2)应选择何种批量组织生产?例11-9的决策树图800800800需求2000件(0.45)需求3000件(0.55)2001200需求2000件(0.45)需求3000件(0.55)7503生产3000件件生产2000件件8007007001001100700需求2000件(0.45)需求3000件(0.55)需求2000件(0.45)需求3000件(0.55)6505按方法I生产3000件按方法I生产2000件700900950900900需求2000件(0.45)需求3000件(0.55)4001400需求2000件(0.45)需求3000件(0.55)4生产3000件件生产2000件件95011038成功(0.7)失败(0.3)875生产方法I生产方法II267891011第四节贝叶斯决策一、什么是贝叶斯决策二、贝叶斯公式与后验概率的估计三、先验分析与后验分析四、完全信息价值五、补充信息价值六、后验预分析一、什么是贝叶斯决策贝叶斯决策是利用补充信息,根据贝叶斯公式估计后验概率,并进行评价的一种决策方法。二、贝叶斯公式与后验概率的估计设某种状态θj的先验概率为P(θj),通过调查获得的补充信息为ek,θj给定时ek的条件概率为,则在给定信息ek的条件下,θj的条件概率即后验概率可用以下公式计算:njjkjjkjkjePPePPeP1)/()()/()()/()/(jkeP【例11-10】东风厂拟向红光厂购买某种电子元器件,红光厂公布的其产品发生不同次品率的概率分布如表11-5第二栏所示。现东风厂从市场上红光厂出售的该元器件中,随机抽取10件,发现了2件次品。试根据该信息,对红光厂公布的次品率的概率分布进行修正。解:红光厂公布的概率分布可视为先验概率。在各种不同次品率给定条件下,抽查10件发生2件次品(发生0件为e1,发生2件为e3)的概率近似地服从于二项分布,其似然度可按下式计算:次品率为0.05状态的后验概率为:8221031)()/(jjjCeP=(j=1,2,,3,4)(11.15)8221013950050).().()/(CeP==0.0758221023900100).().()/(CeP==0.1948221033850150).().()/(CeP==0.2768221043800200).().()/(CeP==0.30212100302005520077500224007503031.)..../(..)/(=eP表11-5后验概率的计算次品率θj先验概率P(θj)似然度后验概率0.050.30.0750.02240.12100.100.40.1940.07750.41800.150.20.2760.05520.29800.200.10.3020.03020.16311.00.18531.000)/(3ePj)/()(jjePP3)/(jeP3三、先验分析与后验分析先验分析是利用先验概率进行决策,而后验分析则是利用后验概率作为选择与判断合适方案的依据。一般来说,只要补充信息是准确的,则后验分析的结论更为可靠。【例11-11】设在例11-10中,对于是否向红光厂购买电子元器件,东风厂有两种可供选择的方案即:方案一购买;方案二不购买。其收益矩阵表如表11-6所示。请利用表中资料,根据期望值准则,进行先验分析和后验分析。表11-6收益矩阵表状态:次品率0.050.100.150.20先验概率0.30.40.20.1后验概率0.1210.4180.2980.163方案购买a1不买a220050-100-3000000解:(1)先验分析E(Q(a1))=200×0.3+50×0.4-100×0.2-300×0.1=30E(Q(a2))=0根据先验概率和期望值准则,应选择方案一。(2)后验分析E(Q(a1))=200×0.121+50×0.418-100×0.298-300×0.163=-33.6E(Q(a2))=0根据后验概率和期望值准则,应选择方案二。四、完全信息价值完全信息,是指在进行决策时,对于所有可能出现的自然状态都可以提供完全确切的情报。完全信息的价值,可以由掌握完全信息前后,所采取的不同行动方案的收益值的差额来表示。其期望值的计算公式如下:EVPI=E[Q(ai,θj)-Q(a*,θj)]=[Q(ai,θj)-(a*,θj)(11.16)式中,EVPI是完全信息价值的期望值,Q(ai,θj)表示各方案在状态θj下的最大收益值,Q(a*,θj)表示先验分析中的最佳方案在状态θj下的收益值。EVPI越大表明通过收集补充信息使决策效益提高的余地越大。同时,它也代表了为取得该情报可付出的代价的上限。【例11-12】试利用例11-10和例11-11的资料和结果,计算完全信息价值的期望值。表11-7完全信息价值计算表状态:次品率0.050.100.150.20先验概率0.30.40.20.1最大收益值MaxQ(ai,θj)2005000先验分析最佳方案a1的收益Q(a*,θj)20050-100-300完全信息价值MaxQ(ai,θj)-Q(a*,θj)00100300利用表11-7中的资料,可求得完全信息价值的期望值。EVPI=
本文标题:统计决策演示(1)
链接地址:https://www.777doc.com/doc-622738 .html