您好,欢迎访问三七文档
当前位置:首页 > 学术论文 > 大学论文 > 模式识别-第2章 线性判别函数_第三讲
第二章线性判别函数线性不可分情况tibaymin:tiibay0tiibay不等式组求解方程组求解2.4最小平方误差算法(LMSE)LMSE方法的基本思想是将求解线性不等式组的问题转化为求解线性方程组:1011101202121202ddnnnddnyyyabyyyabyyyab,Ya=b0b当时,方程为超定方程nd超定方程的最小误差平方解最小平方误差的准则函数(MSE)定义误差矢量e,用e长度的平方作为准则函数:eYab221ntSiiiJbaYabay权值矢量的求解(伪逆求解法)2tSJaYYab0ttYYaYb1ttYYYbaYb1ttYYYY称为Y的伪逆矩阵,有2SJaYabYYI伪逆矩阵的更一般形式:1limttYYYIY该极限总存在,且是的MSE解aYbYab解由b决定,有用,却不一定线性可分有两类模式的训练样本:ω1:{(1,2),(2,0)}ω2:{(3,1),(2,3)}用LMSE算法求取判别函数,将两类样本分开。令所有裕量均为1,求判决边界方程。1,通过向量增广得到y:112120131123Y2,计算Y的伪逆1ttYYYY3,b=(1,1,1,1)t,计算a=Y+b5/413/123/47/121/21/61/21/601/301/3(11/3,4/3,2/3)t权值矢量的求解(迭代求解)2tSJaYYab2SJaYab1ttYYYY计算量巨大。迭代求解法:梯度下降法11ntiiiikkkbaaayy最小均方算法(Least-mean-squared,LMS)1()()tkkkkkbkkaaayy1/kk1/kk权值矢量的求解(迭代求解法)1.begininitializea(0),b,θ,η(•),k0;2.dokk+1;3.4.until5.returna6.end11ntiiiikkkbaaayy1ntiiiikbayyLMSE算法的特点算法的收敛依靠η(k)的衰减,一般取η(k)=η(1)/k;算法对于线性不可分的训练样本也能够收敛于一个均方误差最小解;取b=1时,当样本数趋于无穷多时,算法的解以最小均方误差逼近贝叶斯判别函数;当训练样本线性可分的情况下,算法未必收敛于一个分类超平面。线性判别函数下降法(小结)名称固定增量法准则算法条件备注若线性可分,收敛到的解;总有界ttpJayay01kkkaay=0tayka线性判别函数下降法(小结)名称可变增量法准则算法条件备注若线性可分,收敛到的解;若有限收敛ttpJbayayb1()kkkkaay=0tay0k10,lim,mmkkk2211lim0mmmkkkk线性判别函数下降法(小结)名称松弛法准则算法条件备注若线性可分,收敛到的解;若有限收敛到的解22ttpJbayayybtbay0b0221()()tkkkkkkbkaaayyy0tay线性判别函数下降法(小结)名称伪逆法准则算法条件备注典型的MSE解。特别选择b,将获得Fisher线性判别和对贝叶斯判别的MSE逼近2SJaYab1ttaYYYbYbtYY非奇异线性判别函数下降法(小结)名称最小均方(LMS)法准则算法条件备注趋于极小化的解221ntSiiiJbaYabay1()()tkkkkkbkkaaayy0,0,kkSJ最优分类界面样本集与分类界面之间的间隔定义为样本与分类界面之间几何间隔的最小值。最优分类界面:给定线性可分样本集,能够将样本分开的最大间隔超平面。支持矢量距离最优分类界面最近的这些训练样本称为支持矢量;最优分类界面完全由支持矢量决定,然而支持矢量的寻找比较困难。5.5支持矢量机(SVM,SupportVectorMachine)函数间隔:样本xi到分类界面g(x)=0的函数间隔定义为:几何间隔:缩放权向量和阈值不改变分类函数γixig(x)=wtx+w0=0ib0tiiibgwxwxiibwSVM的准则函数给定两类问题的线性可分样本集合{(y1,z1),…,(yn,zn)},其中z为样本的类别标号:能够将样本线性分开的分类界面满足:亦即可以通过调整权值w和w0将样本集合的最小函数间隔调整为1。121,1,iiizyy01tiizwwySVM的准则函数样本集到分类界面的几何间隔:最大,亦即||w||最小,所以SVM可以变为如下优化问题:在满足的条件下,最小化准则函数:1w212SVMJw01tiizwwy把函数间隔固定为1,对离分类面最近的样本有:()1gy()gywKuhn-Tucker构造法Kuhn-Tucker定理1629Fermat定理——无约束条件下的函数极值1788Lagrange乘子法——等式约束下的函数极值1951Kuhn-Tucker定理:(凸)不等式约束下,最小化某一类型的(凸)目标函数01tiizwwy212SVMJwKuhn-Tucker定理凸集合:集合中任意两点的连线都属于该集合凸函数:对于任意两点x,y,Jensen不等式成立:(1)()(1)()fxfxfyX是一个线性空间,A是空间的一个凸子集,fk(x),k=0,1,…,m是凸函数凸优化:最小化泛函0()inffx约束条件为,()0,1,,kxAfxkm最小化泛函:0()inffx约束条件:,()0,1,,kxAfxkm011(,,)(),(,)mkkmkLLxfxλλ如果在满足约束条件下最小化,则存在不同时为0的使下列三条件成立:令x0()fx01,(,)mλ(a):最小值原理(b):非负性条件(c):Kuhn-Tucker条件00min(,,)(,,)xALxLxλλ0k()0,1,kkfxkmKuhn-Tucker定理1,构造Lagrange函数20011,,1,02ntiiiiiLwzwwαwwy01,,0niiiiLwzwαwyw010,,0niiiLwzwwα1niiiizwy(1)10niiiz(2)01,11,,2nntiijijijiijLwzzwαyy2,分别对参数w和w0求导:3,将(1),(2)代人0,,Lwwα二次规划问题10,niiiz0,iC1,,in约束条件:SVM解的讨论这是一个典型的不等式约束条件下的二次优化问题,其解法的基础是Kuhn-Tucker定理;首先求解的是n个Lagrange乘子,n为训练样本数。但根据Kuhn-Tucker定理,有:000,100,10tiiitiiizwzwwywy满足第2个条件的yi称为支持矢量。()0kkfx010tiiizwwySVM解的讨论根据找到的支持矢量yi以及相应的Lagrange乘子αi,计算权矢量w:1niiiizwy偏置w0可以用支持矢量满足的条件求得:01tiizwwy线性判别函数小结感知器算法松弛算法最小平方误差(伪逆、迭代)最优分类面(支持向量,K_T条件,二次规划)
本文标题:模式识别-第2章 线性判别函数_第三讲
链接地址:https://www.777doc.com/doc-3750750 .html