您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 模式识别 第四章 统计判决
第四章统计判决•最小误判概率准则判决•最小损失准则判决•最小最大损失准则•N-P(Neyman—Pearson)判决例子——癌症普查:•1癌症患者:11268•2正常者:2242282•总人数:n=2253550•对每一类的概率做一个估计(先验概率)11()0.005nPn22()0.995nPn4·1最小误判概率准则判决•对人们测量细胞的特征向量•代表的某个人属于第i类的后验概率:•决策规律:()iPx例子——癌症普查(续1):xx121122(|)(|)(|)(|)PωxPωxxPωxPωxx若则若则•若已知两类特征向量分布的类条件概率密度函数•贝叶斯公式、全概率公式()iPx(|)()(|)()iiipxPPxpx21(|)()(|)()iiiiipxPpxP例子——癌症普查(续2):将P(i|x)代入判别式,判别规则可表示为1122111222(|)()(|)()(|)()(|)()PxωPPxωPxPxωPPxωPx若则若则或改写为121212121121212221(|)()(|)()(|)()(|)()pxPlxpxPpxPlxpxP则则l12称为似然比(likelihoodratio),12称为似然比的判决阀值。例子——癌症普查(续3):概念和符号•---总概率•---后验概率•---类概密,表示在类i条件下的概率密度,即类i模式x的概率分布密度•---先验概率,表示类i出现的先验概率,简称类i的概率()Px()iPx()ipx()iP例:对一批人进行癌症普查,1:患癌症者;2:正常人。模式特征x=x(化验结果),x=1:阳性;x=0:阴性。已知:(统计结果)先验概率:P(1)=0.005P(2)=1-P(1)=0.995条件概率:p(x=阳|1)=0.95p(x=阴|1)=0.05p(x=阳|2)=0.01求:呈阳性反映的人是否患癌症?解:利用Bayes公式111111122(|)()(|)()(|)()(|)()(|)()0.950.0050.3230.950.0050.010.995pxPPxpxpxPpxPpxP阳阳阳阳阳阳因为,P(2|x=阳)=1-P(1|x=阳)=1-0.323=0.677P(1|x=阳)P(2|x=阳)故判决:(x=阳)2,即正常。写成似然比形式1122212112122(|)0.9595(|)0.01()0.995197()0.005,,pxlxpxPPlxx阳(阳)阳判决阀值(阳)即正常。最小误判概率准则判决域示意图12xp(x|1)P(1)p(x|2)P(2)12P(1)21P(2)2121()pxdx1212()pxdx该规则使得分类的错误率最小•两种错误•设和类出现的概率分别为和,则总的误判概率是•误判概率最小等价于使正确分类概率最大,即2121()pxdx1212()pxdx11()P112221()()()PePP211212()()()()PpxdxPpxdx121212()()()()()maxPcPpxdxPpxdx()Pc22()P()Pe多类问题,最小误判概率准则有如下几种等价的判决规则(1)if()(),thenijiPxPxjixif()max[()]thenijijPxPxxif(|)()(|)(),theniijjipxPpxPjixif(|)()max[(|)()]theniijjjipxPpxPx(2)多类问题,最小误判概率准则有如下几种等价的判决规则()(|)if(),(|)()thenjiijijjiiPpxlxpxPjixifln(|)ln()ln(|)ln(),theniijjipxPpxPjix(3)(4)12xp(x|1)P(1)p(x|2)P(2)p(x|3)P(3)334.1.2正态模式最小误判概率判决准则的具体形式在c类问题中,属于i类的n维模式的正态分布密度函数为式中,为均值矢量,为协方差x112211()exp()()2(2)iiiinipxxxiiEx()()iiiiExxi类的判决函数可以表为去掉与类别无关的项并不影响分类判决结果,故可简化为11()ln()ln(2)ln221()()2iiiiiindxPxx11()ln()ln21()()2iiiiiidxPxx决策-损失表4.2.1损失概念、损失函数与平均损失()jiij对一个实属i类的模式采用了决策j所造成损失记为……c(c/1)(c/2)…(c/c)c+1(c+1/1)(c+1/2)…(c+1/c)12…c1(1/1)(1/2)…(1/c)2(2/1)(2/2)…(2/c)条件平均风险令决策的数目a等于类数c,如果决策j定义为判属于j类,那么对于给定的模式在采取决策j的条件下损失的期望为条件期望损失刻划了在模式为、决策为j条件下的平均损失,故也称为条件平均损失或条件平均风险(Risk)。(做决策j的平均损失)x1()()()cjjijiijiiRxRxPxEx(1,2,,)jc()jRx()jRxxx•由贝叶斯公式,上式可以写为•平均损失或平均风险111()()()()()()()()cccjijiijiiiiiiiiRxpxPpxpxPpxP1()()()()jcjjjRRxpxdxRxpxdx11()()jccijiijipxPdx11(())()()jccjiiiijxpxPdx1()(())()ciiiiPxpxdx,(())iixEx平均风险该式表明,R是损失函数关于各类及的的数学期望,故称其为(总)平均损失或平均风险。()ijjix4.2.2最小损失准则判决•可以将最小条件平均损失判决规则表为如果则判定理使条件平均损失最小的判决也必然使总的平均损失最小。所以最小条件平均损失准则也称为最小平均损失准则或最小平均风险准则,简称为最小损失准则。()min()jiiRxRxjx对于两类问题两类问题的最小损失准则的似然比形式的判决规则为如果则判111121212()[()()()()]()RxpxPpxPpx212122212()[()()()()]()RxpxPpxPpx122122112112()()()()()()pxPpxP12x1212()()ifRxRxthenxelsex111212121222121211()()()()()()()()ifpxPpxPpxPpxPthenxelsex若记似然比阈值则两类问题的判决规则为如果则判0-1损失(ii=0,ij=1)条件下最小损失判决最小错误判决221221211211()()()()PP12()lx1212x例4.2.2:设,正常细胞1,异常细胞2,已知P(1)=0.9,P(2)=0.1;;11=0,12=1,21=6,22=0。试用最小误判概率准则和最小损失准则判断该细胞是正常的还是异常?解(1)由贝叶斯定理可以分别算出1和2的后验概率。因为,所以把归于正常细胞。11121()()0.20.9()0.8180.20.90.40.1()()iiipxPPxpxP21()1()0.182PxPx12(|)(|)PxPxx12(|)0.2,(|)0.4pxpx(2)当依据损失进行判决时,计算条件平均损失由于,因此判。之所以这两个判决结果相反,是因为21取得较大的缘故。2112121()()(|)1.092iiiRxPxPx2221211()()(|)0.818iiiRxPxPx12()()RxRx2x4.2.3含拒绝判决的最小损失判决拒绝判决可以作为最小损失判决中的一个可能判决。设c+1=“拒绝判决”。令表示模式实属类但拒绝作出判决所造成的损失,于是在模式条件下拒绝判决的平均损失为如果,j=1,2,…,c,则作出拒绝判决。1()cixi111()()()ccciiiRxPx1()()cjRxRxx设,,这时要使即亦即1(,)icr(,)iic(,)ije1()()cjRxRx()()reecjPx()11errcjececPxtrcectcre11()()()()()()()()ccjjiieieciiieeciRxPxPxPxPx一般有:1111()()()()cccciiririiRxPxPx含拒判决策的最小损失判决规则为如果,则对拒判;如果,则判。当即时恒成立,故此时不存在拒判。max()1jjPxtmax()()1jijPxPxtxix11tc1max()1jjPxtc11tc对于两类问题,存在拒判决策的条件是判决规则如下:如果,则判;如果,则判;如果,则对拒判。1212()()(1)()()pxPtpxPt1x1212()()()()(1)pxPtpxPt2x212112()()()(1)()(1)()()pxPtPtPtpxPtx102rcect4·3最小最大损失准则实际中,类先验概率P(i)往往不能精确知道或在分析过程中是变动的,从而导致判决域不是最佳的。所以应考虑如何解决在P(i)不确知或变动的情况下使平均损失变大的问题。第四章统计判决对于两类问题,设一种分类识别决策将特征空间分划为两个子空间1和2,记ij为将实属i类的模式判为j的损失函数,各种判决的平均损失为1212112122212111111212212112(()|)()(()|)()(()|)()(|)()(|)()()(|)()(|)()(|)iiiiiiiiRRxxpxdxRxxpxdxRxxpxdxpxPdxpxPdxPpxdxPpxdxPpxdx2222()(|)Ppxdx利用则平均损失可写为由于0P(1)1,所以平均损失值有aRa+b1221()1()(|)1(|)iiPPpxdxpxdx12122212221112212111222121()(|)()[()()](|)()(|)()defRpxdxPpxdxpxdxabP121222122211221211122212()(|)[()()](|)()(|)apxdxbpxdxpxdx
本文标题:模式识别 第四章 统计判决
链接地址:https://www.777doc.com/doc-4987994 .html