您好,欢迎访问三七文档
4-1贝叶斯分析BayeseanAnalysis§4.0引言一、决策问题的表格表示——损失矩阵对无观察(No-data)问题a=δ可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失):a1…aj…amπ(1)l11lj1lm1…π(i)li1lij…π(n)lm1lnm或π(1)…π(i)…π(n)a1l11li1ln1…ajlij…amlm1lmn损失矩阵直观、运算方便二、决策原则通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策原则。三、决策问题的分类:1.不确定型(非确定型)自然状态不确定,且各种状态的概率无法估计.2.风险型自然状态不确定,但各种状态的概率可以估计.四、按状态优于:lij≤likI,且至少对某个i严格不等式成立,则称行动aj按状态优于ak§4.1不确定型决策问题一、极小化极大(wald)原则(法则、准则)a1a2a4minjmaxil(i,aj)或maxjminiuij例:4-2a1a2a3a411087924192313161214469810各行动最大损失:13161214其中损失最小的损失对应于行动a3.采用该原则者极端保守,是悲观主义者,认为老天总跟自己作对.二、极小化极小minjminil(i,aj)或maxjmaxiuij例:a1a2a3a411087924192313161214469810各行动最小损失:4172其中损失最小的是行动a2.采用该原则者极端冒险,是乐观主义者,认为总能撞大运。三、Hurwitz准则上两法的折衷,取乐观系数入minj[λminil(i,aj)+(1-λ〕maxil(i,aj)]例如λ=0.5时λminilij:20.53.51(1-λ〕maxilij:6.5867两者之和:8.58.59.58其中损失最小的是:行动a4四、等概率准则(Laplace)用ilij来评价行动aj的优劣选minjilij上例:ilij:33343635其中行动a1的损失最小五、后梅值极小化极大准则(svage-Niehans)定义后梅值sij=lij-minklik其中minklik为自然状态为i时采取不同行动时的最小损失.构成后梅值(机会成本)矩阵S={sij}mn,使后梅值极小化极大,即:minmaxjisij4-3例:损失矩阵同上,后梅值矩阵为:3102308114020324各种行动的最大后梅值为:3484其中行动a1的最大后梅值最小,所以按后梅值极小化极大准则应采取行动1.六、Krelle准则:使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则.七、莫尔诺(Molnor)对理想决策准则的要求(1954)1.能把方案或行动排居完全序;2.优劣次序与行动及状态的编号无关;3.若行动ak按状态优于aj,则应有ak优于aj;4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。§4.2风险型决策问题的决策原则一、最大可能值准则令π(k)=maxπ(i)选ar使l(k,ar)=minjl(k,aj)例:π(i)a1a2a310.276.5620.534530.3410π(2)概率最大,各行动损失为345∴应选行动a1二、贝叶斯原则使期望损失极小:minj{il(i,aj)π(i)}上例中,各行动的期望损失分别为4.13.63.7,对应于a2的期望损失3.6最小∴应选a2.三、贝努利原则损失函数取后果效用的负值,再用Bayes原则求最优行动.四、E—V(均值—方差)准则若Elij≤Elik且jk则aj优于ak通常不存在这样的aj4-4上例中:a1a2a3E4.13.63.7V(2)2.293.795.967不存在符合E—V准则的行动,这时可采用f(μ,σ)的值来判断(μ为效益型后果的期望)μ-ασf(μ,σ)=μ-ασ2μ-α(μ2+σ2)f越大越优.五、不完全信息情况下的决策原则(Hodges-Lehmann原则)状态概率分布不可靠时,可采用:φ(aj)=λuijii+miniuiji=1,2,…,mj=1,2,…,nφ越大越优.§4.3贝叶斯定理一、条件概率1.A、B为随机试验E中的两个事件P(A|B)=P(AB)/P(B)由全概率公式:Ajj=1,2,…,n是样本空间的一个划分,P(B)=jP(B|Aj)P(Aj)得Bayes公式P(Ai|B)=P(B|Ai)·P(Ai)/P(B)=P(B|Ai)·P(Ai)/jP(B|Aj)P(Aj)2.对Θ,Χ两个随机变量·条件概率密度f(θ|x)=f(x|θ)f(θ)/f(x)·在主观概率论中π(θ|x)=f(x|θ)π(θ)/m(x)其中:π(θ)是θ的先验概率密度函数f(x|θ)是θ出现时,x的条件概率密度,又称似然函数.m(x)是x的边缘密度,或称预测密度.m(x)=f(x|θ)π(θ)dθ或ip(x|i)π(i)π(θ|x)是观察值为x的后验概率密度。例:A坛中白球30%黑球70%B坛中白球70%黑球30%两坛外形相同,从中任取一坛,作放回摸球12次,其中白球4次,黑球8次,求所取为A坛的概率.解:设观察值4白8黑事件为x,记取A坛为1,取B坛为2在未作观察时,先验概率p(1)=p(2)=0.54-5则在作观察后,后验概率P(1|x)=p(x|1)p(1)p(x|1)p(1)+p(x|2)p(2)=034.×078.×0.5(034.×078.×0.5+074.×038.×0.5)=074.(074.×034.)=0.24010.2482=0.967显然,通过试验、观察、可修正先验分布.§4.4贝叶斯分析的正规型与扩展型一、正规型分析由Baysean原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则,使贝叶斯风险r(π,)=infr(π,δ(x))其中:r(π,δ(x))=ER(θ,δ(x))=E[Exl(θ,δ(x))=xl(θ,δ(x))f(x|θ)dxπ(θ)dθ(1)据(1)式,选使r(π,δ)达到极小,这就是正规型的贝叶斯分析。在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。实际上可用下法:二、扩展型贝叶斯分析(ExtensiveFormAnalysis)在(1)式中因l(θ,δ)-∞,f(x|θ),π(θ)均为有限值。∴由Fubini定理,积分次序可换即r(π,δ(x))=xl(θ,δ(x))f(x|θ)dxπ(θ)dθ=xl(θ,δ(x))f(x|θ)π(θ)dθdx(2)显然,要使(2)式达到极小,应当对每个x∈X,选择δ,使l(θ,δ(x))f(x|θ)π(θ)dθ(2’)为极小∵δ(x)=a∴若对给定的x,选a,使l(θ,δ(x))f(x|θ)π(θ)dθ为极小亦即,使1mx()l(θ,a)f(x|θ)π(θ)dθ=l(i,a)π(i|x)dθ或il(i,a)p(i|x)(3)达极小,即可使(1)式为极小.·结论:对每个x,选择行动a,使之对给定x时θ的后验分布π(θ|x)的期望损失为极小,即可求得贝叶斯规则。这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formalBayeseanRule——RaiffaSehlaifer,1961年提出。·Note·使(3)式达极小的行动可能不只一个,即可能有多个贝叶斯规则;·扩展型比正规型更直观,也容易计算,故更常用;·许多分析人员只承认扩型,理由是:4-6i,π(θ|x)描述了试验后的θ的分布,比π(θ)更客观,因此,只要损失函数是由效用理论导出的(即考虑了DMer的价值判断、风险偏好),在评价行动a的优劣时就应当用后验期望损失。ii,r(π,δ)是根据π(θ)求出的,而用先验分布π(θ)来确定行动a并不一定适当。从根本上讲,这种观点是正确的。·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视具体问题,据计算方便而定。·已经证明,形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。使所有x上后验期望损失极小的贝叶斯规则也是随机性规则集Δ*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。三、例(先看无观察问题)农民选择作物问题,设某地旱年1占60%,正常年景2占40%;a1种植耐旱作物a2种不耐旱作物,后果矩阵为:a1a21200260100决策人的效用函数u(y)=10865.(1-ey002.)解:i令:l(y)=1-u(y)ii,作决策树:a1a2()1()1()260.81.19yul20.38.62001100104-7iii,在无观察时,R=l,r=11nl(i,a)π(i)r(π,a1)=l(1,a1)π(1)+l(2,a1)π(2)=0.62×0.6+0.19×0.4=0.448r(π,a2)=l(1,a2)π(1)+l(2,a2)π(2)=1.0×0.6+0×0.4=0.6风险r小者优,∴δ=a1,是贝叶斯规则,即贝叶斯行动.即应选择耐旱作物。四、例(续上)设气象预报的准确性是0.8,即p(x1|1)=0.8p(x2|2)=0.8其中,x1预报干旱x2预报正常年景则m(x1)=p(x1|1)π(1)+p(x1|2)π(2)=0.8×0.6+0.2×0.4=0.56m(x2)=0.44π(1|x1)=p(x1|1)π(1)m(x1)=0.8×0.6/0.56=0.86π(1|x2)=p(x2|1)π(1)m(x2)=0.2×0.6/0.44=0.27π(2|x1)=0.14π(2|x2)=0.731.正规型分析①策略1:a1=1(x1)a2=1(x2)r(π,1)=ijl(i,1(xj))p(xj|i)π(i)4-7=l(1,a1)p(x1|1)π(1)+l(1,a2)p(x2|1)π(1)+l(2,a1)p(x1|2)π(2)+l(2,a2)p(x2|2)π(2)=0.62×0.8×0.6+1.0×0.2×0.6+0.19×0.2×0.4+0.0×0.8×0.4=0.4328②策略2:a1=2(x2)a2=2(x1)r(π,2)=ijl(i,2(xj))p(xj|i)π(i)=l(1,a1)p(x2|1)π(1)+l(1,a2)p(x1|1)π(1)+l(2,a1)p(x2|2)π(2)+l(2,a2)p(x1|2)π(2)=0.62×0.2×0.6+1.0×0.8×0.6+0.19×0.8×0.4+0.0×0.8×0.4=0.6152③策略3:a1=3(x1)a1=3(x2)r(π,3)=0.45④策略4:a2=4(x1)a2=4(x2)r(π,4)=0.6∵r(π,1)<r(π,3)<r(π,4)<r(π,2)4-8∴13421是贝叶斯行动。x1a1x21a1a2a2(|)11x(|)21x(|)21x(|)22x(|)22x(|)11x(|)12x(|)11x(|)12x4-82.扩展型之一:据(2’):l(θ,δ(x))f(x|θ)π(θ)dθ记作r’①给定x1(预报干旱):采用a1r‘=il(i,a1)p(x1|i)π(i)=l(1,a1)p(x1|1)π(1)+l(2,a1)p(x1|2)
本文标题:贝叶斯分析决策
链接地址:https://www.777doc.com/doc-623441 .html