您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 大型工程决策-第三章 随机性决策问题与效用函数
第三章随机性决策问题与效用函数王仁超天津大学本章内容§1先验信息与主观概率§2效用函数§3贝叶斯分析*§4随机优势法§1先验信息与主观概率先验信息:随机性决策问题特点:自然状态的不确定性引起后果的不确定性。为了进行科学决策,决策人在通过试验收集自然状态有关信息之前,根据自己的经验、主观估计自然状态的信息,称为先验信息,它是贝叶斯决策分析的基础。主观概率与客观概率决策人根据自己的经验所设定的自然状态发生的概率称为主观概率;通过随机试验所确定的自然状态发生概率称为客观概率。先验分布:借助先验信息确定的主观概率分布,称为先验分布主观设定先验分布的方法基础二元关系:比较两个对象某一方面属性的关系。主观概率估计中,比较两个事件发生的可能性二元关系假设:连通性:A、B两个事件发生的似然性是可以比较的,且只有以下一种关系成立,即等可能A~B;A比B更可能A≻B,B比A更可能A≺B。传递性:A、B、C三个事件,若A≼B、B≼C,则A≼C部分小于全体:设事件A⊂B,则事件B的发生似然性A≼B,如A为物价上涨8-10%,B为物价上涨8-12%,则事件B发生的可能性至少与A一样大。主观设定先验分布的方法概率盘——最为常用区间法相对似然法直方图法概率盘正面反面对应对应抽奖适用于对概率有了解的专家区间法1)把事件不确定量的区间划分为两部分,询问决策人事件发生在哪个区间可能性更大2)然后减少可能性大的区间,直至两个区间等可能;3)同样还可以对两个区间记一步划分,得到1/4和3/4的点对应的区间**由于该方法误差积累,一般不再进一步划分相对似然法在事件的不确定量区间中,要求决策者首先确定“最可能”和“最不可能”的量,然后询问“最可能”量的可能性是“最不可能”量的可能性的几倍-相对似然性,再对其他量进行相对似然性估计,由此得到非正常先验密度曲线(密度积分不等于1,故非正常)。例如,关于某产品明年的销售量,在1000~10000件之间,最可能是5000件,最不可能是9000件,最可能发生5000件的可能性是最不可能9000件的4倍,于是得到5000对9000的相对似然。继续问4000件与8000件的相对似然性。。。直方图法将某一事件的不确定量划分为若干区间,询问决策人各个区间发生的概率,0102030401234567系列1§2效用函数价值与效用:在经济学以及随机决策问题中,很多研究表明,决策人对后果的判定不完全取决于后果价值,而是价值的一个对应值,这个对应值反映决策的偏好(preference),即效用是决策人对后果值的偏好的量化。效用函数:当决策人的偏好满足一定的公理时,所有决策后果与效用的对应函数关系。展望、抽奖与抽奖的确定当量展望(prospect)或预期:决策的可能前景,它是各种后果与后果出现概率的组合,记为:P={p1,c1;p2,c2;p3,c3;…;pr,cr}抽奖:决策树中由机会点和该机会点发出的若干机会枝的概率及其后果构成的图形,称为抽奖,若决策人认为某个后果C与抽奖L={p1,c1;p2,c2;p3,c3;…;pr,cr}无差异,则称C为抽奖L的确定当量,抽奖和确定当量是确定效用函数的常用方法效用的存在性公理由VonNeumann和Morgenstern上世纪40年代提出。连通性:P上的优先关系是连通的;传递性替代性:若P1、P2、P3∈P,P1≻P2且0<α<1,αP1+(1-α)P3≻αP2+(1-α)P3,或0<β<α<1,αP1+(1-α)P3≻βP2+(1-β)P3连续性(偏好的有界性)若P1、P2、P3∈P,P1≻P2≻P3,则存在0<β<α<1使αP1+(1-α)P3≻βP2+(1-β)P3效用函数的数学定义集合P上的实值函数u,若它和P上的优先关系一致,即:若P1,P2∈P且P1≻P2,当且仅当u(P1)u(P2)。定理:若P上的优先关系满足公理1~4,则一定存在上述定义的效用函数。基数效用与序数效用基数是2、3.5、100.0等,定义在展望上的效用是基数效用,以上介绍的效用函数,为基数效用函数,基数效用的特点:既反映偏好的次序,也反映偏好强度。通常基数效用值在0-1之间序数,第一、第二、第三等,定义在后果集上,只反映偏好的次序,而不反映偏好强度,不涉及随机性。效用函数的构造方法-偏好诱导确定当量法:给定两个后果c1、c2,通常是最差和最好的结果,假定其均以50%概率出现,问决策人确定当量c为多少,c~c1×0.5+c2×0.5;设U(c1)=0,U(c2)=1,则得到C对应效用为0.5,在c1和c之间和c和c2之间继续询问决策人,则可以得到若干效用值,拟和成曲线即为该决策人的效用函数。后果效用效用函数效用与风险效用函数反映决策者对风险的态度,通常分为三种类型,风险中立、风险追求和风险厌恶。例如,如果u(0)=0,u(2500)=1,如果决策人在50%概率抽奖中,认为1250的效用为0.5,则该决策人是风险中立,如果认为900(或1250的效用值大于0.5)与抽奖相当,则该决策人是风险厌恶的,效用函数上凸,否则为风险追求,效用函数下凸。利用效用函数和先验信息进行决策决策准则期望效用最大利用效用进行决策的案例:例:某农场要决定一块地中选择什么作物,各种作物的收益如表1,若该人的收益与效用对应关系如表2,如何决策?200060003000棉花300050002000小麦700040001000蔬菜多雨0.1正常0.7旱0.2天气利润方案效用决策案例收益1000200030004000500060007000效用0.150.250.350.450.550.650.850.550.470.43x2,0.7x1,0.2x3,0.10.150.450.85x1,0.2x2,0.7x3,0.10.250.550.35x1,0.2x2,0.7x3,0.10.350.650.25a3a2a1决策点方案枝状态点概率枝后果期望效用§3贝叶斯分析前言:前面我们介绍了依据先验信息进行决策的方法。这些方法可能存在以下问题:先验信息难以获得;决策非常重要,要求提高决策质量对于随机决策问题要提高决策质量:最好通过试验或经验等获得新的信息,它们是对先验信息得到的主观概率的一个随机估计,由此得到关于自然状态的后验概率;决策者根据这个估计和决策规则采取行动-贝叶斯分析。贝叶斯定理条件概率:A、B为随机试验的两个事件,在事件B发生条件下A发生的概率称为A关于B的条件概率,记为:P(A|B),且P(A|B)=P(AB)/P(B)全概率公式:若Aj,j=1,2,。。。n是样本的一个划分,则贝叶斯定理njAjPAjBPBP1)()|()(njAjPAjBPAjPAjBPBPAjBPBAjP1)()|()()|()()()/(贝叶斯定理解释P(Aj)称为先验概率,P(Aj|B)称为后验(或验后)概率。在随机决策中,决策者对于自然状态x的出现概率主观估计是先验概率,通过试验等进一步获得自然状态估计是后验概率。损失函数统计决策理论习惯于用损失函数而非效用函数做决策分析,损失函数L(θ,a)表示出现自然状态θ情况下决策者采取行动a的损失。可以用负效用函数来表示损失函数。与期望效用最大作为决策规则,损失函数为期望损失最小也可以作为决策规则风险函数在贝叶斯分析中,决策者通过试验获得自然状态Ⓔ的一组观测值X,由于试验仍可能存在其他随机因素影响,因此,X和Ⓔ均为随机变量。决策人当获得X后,他根据X选择行动,因此,决策人的行动应为X的一个函数,记为δ(X)。当自然状态为θ∈Ⓔ,观察为x∈X,根据x选择行动a时记为δ(x),相应损失为L(θ,δ(x))。由于X和Ⓔ均为随机变量,因此L(θ,δ(X))也是随机变量,当给定θ,定义L(θ,δ(X))对X的期望值为风险函数记为R(θ,δ)=))(,(XlEX风险函数的具体型式当X为连续的随机变量时当X为离散的随机变量时其中,为条件概率密度函数或条件概率XxdxxfxlR)|())(,(),(XxxfxLR)|())(,(),()|(xf贝叶斯风险其实决策人决策时,并不知道真实的状态中哪一个θ会出现,他只能对θ出现的先验密度(概率)π(θ)做主观估计,决策分析中还需要把风险函数R(Ⓔ,δ)对Ⓔ取期望,记为r(π,δ)=ER(Ⓔ,δ)当Ⓔ连续随机变量当Ⓔ离散随机变量XxdxdxfLdRr)()|(),()(),(),(Xxxflr)()|(),(),(贝叶斯决策规则贝叶斯风险最小的策略(损失最小)正规型,扩展型XxdxdxfLdRr)()|(),()(),(),(Xxxflr)()|(),(),(dxLr)|(),(),()|())(,(),(xxLr扩展型贝叶斯决策问题分析步骤获得原始自然状态信息的主观概率估计获得关于原始自然状态的试验估计自然状态与行动方案的损失函数确定计算后验概率或密度确定最优行动:即预测自然状态不同时的行动规则-显然它是一种随机应变的。一个贝叶斯分析案例某油井公司拥有一块油田,当前该公司可以采取的措施为:a1:自己钻采;a2:无条件出租,租金45万;a3:有条件出租,租金依照产量而定,产油在20万桶或以上,每桶提成5元,产量不足20万桶不受租金。另外,自己开采钻井费用75万元,有油需要增加采用设备费25万元。油价每桶15元。油田产量分为无油、5万桶、20万桶和50万桶4种状态,主观概率为0.5、0.25、0.15、0.1。问决策人风险中立,决策人应采取什么行动。分析决策人风险中立,收益与效用成线性关系,可以认为收益就是效用损失函数可以取效益的负现在问题没有涉及后验信息,但仍可以用贝叶斯决策分析方法求解决策树a1a2a30.10.150.250.5-650-25-200-75-450.10.150.250.5-250-10000-51.25-40贝叶斯公式计算40)3,(45)2,(5.07525.02515.02001.0650)()1,()1,(41araraLarlll有后验信息的决策决策人如果通过地震试验可以获得该地区石油含量0,5,20,50万桶的相关信息,需要经费12万元,问进行该项试验后,决策人如何动?,p(xk|θj)如表所示。θX1=50X2=20X3=5X4=0507/121/31/120209/163/161/81/8511/241/61/41/803/1611/4813/485/16求全概率或预测密度与后验概率公式jjjkjjjkjjkkjxpxmxpxpx)()|()()()|()()|()|(全概率175.0)(215.0)(259.0)(351.05.016325.0241115.01691.0127)(4321xmxmxmxm后验概率θX1=50X2=20X3=5X4=0500.1660.1290.0390200.2400.1080.0870.10750.3270.2410.1460.23800.2670.5220.7280.655贝叶斯分析扩展型给定x1=50万桶,利用扩展型求得对应方案a1的期望损失同样求得对应a2和a3的期望损失为-33和-5,于是预测为x1取a1方案。同样对x2、x3、x4可以达到行动方案为a1、a2、a2)|())(,(),(xxLr5.115267.087327.03724.0188166.0638)|(),(),(111xaLar考虑12万元的试验费课堂指导作业绘制贝叶斯
本文标题:大型工程决策-第三章 随机性决策问题与效用函数
链接地址:https://www.777doc.com/doc-324071 .html