您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 求职简历 > 在Matlab中数据拟合的研究应用
在Matlab中数据拟合的研究应用而解决数据拟合问题最重要的方法变是最小二乘法,矛盾方程组和回归分析。而本论文主要研究的就是最小二乘法。在科学实验,统计研究以及一切日常应用中,人们常常需要从一组测定的数据(例如N个点((,)(0,1,,)iixyim)去求得自变量x和因变量y的一个近似解表达式()yx,这就是由给定的N个点(,)(0,1,,)iixyim求数据拟合的问题。插值法虽然是函数逼近的一种重要方法,但他还存在以下的缺陷:一是由于测量数据的往往不可避免地带有测试误差,而插值多项式又通过所有的点(,)iixy,这样就使插值多项式保留了这些误差,从而影响了逼近精度。此时显然插值效果是不理想的。二是如果由实验提供的数据较多,则必然得到次数较高的插值多项式,这样近似程度往往既不稳定又明显缺乏实用价值。因此,怎样从给定的一组实验数据出发,寻求已知函数的一个逼近函数()yx,使得逼近函数从总体上来说与已知函数的偏差按某种方法度量能达到最小而又不一定过全部的点(,)iixy,这就需要介绍本论文主要研究的最小二乘法曲线拟合法。一.数据拟合的原理及依据1.最小二乘法的基本原理从整体上考虑近似函数()px同所给数据点(,)iixy(,)(0,1,,)iixyim误差()(0,1,,)iiirpxyim的大小,常用的方法有以下三种:一是误差()(0,1,,)iiirpxyim绝对值的最大值0maxiimr,即误差向量01(,,,)tmrrrr的-的范数;二是误差绝对值的和0miir,即误差向量r的1-范数;前两种方法简单,自然,但不便于微分运算,后一种方法相当于考虑2-的范数的平方,因此在曲线拟合中常采用误差平方和20miir来度量误差01(,,,)mrrrr的整体大小。数据拟合的具体作法是:对给定的数据(,)(0,1,,)iixyim,在取定的函数类中,求()px,使误差()(0,1,,)iiirpxyim的平方和最小,即2200()minmmiiiiirpxy从几何意义上讲,就是寻求与给定点(,)(0,1,,)iixyim的距离平方和为最小的曲线()ypx。函数()px称为拟合函数或最小二乘解,求拟合函数()px的方法成为曲线拟合的最小二乘法。在曲线拟合中,函数类可有不同的选取方法。2.多项式拟合假设给定数据点(,)(0,1,,)iixyim,为所有次数不超过()nnm的多项式构成的函数类,现求一0()nknkkpxax,使得22000()minmmnkniikiiiikIpxyaxy(1)称为多项式拟合,满足上式的()npx称为最小二乘拟合多项式。特别地,当1n时,称为线性拟合或直线拟合。显然200mnkkiiikIaxy为01,,,naaa的多元函数,因此上述问题即为求01(,,,)nIIaaa的极值问题,由多元函数求极值的必要条件,得0020mnkjkiiiikjIaxyxa,0,1,,jn(2)即000nmmjkjikiikiixaxy,0,1,,jn(3)(3)式是关于01,,,naaa的线性方程组,用矩阵表示为000021100001200001mmmniiiiiimmmmniiiiiiiiinmmmmnnnniiiiiiiiimxxyaxxxaxyaxxxxy(4)(3)式或(4)式称为正规方程组或法方程组。可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从(4)式中解出,0,1,,kakn,从而可得多项式0()nknkkpxax(5)可以证明,(5)式中的()npx满足(1)式,即()npx为所求的拟合多项试。我们把20()mniiipxy称为最小二乘拟合多项式()npx的平方误差,记作2220()mniiirpxy由(2)式可得222000mnmkikiiikiryaxy(6)多项式拟合的一般方法可归纳为以下几步:(1)由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n:(2)列表计算00,1,,2mjiixjn和00,1,,2mjiiixyjn:(3)写出正规方程组,求出01,,,naaa:(4)写出拟合多项式0()nknkkpxax在实际应用中,nm或n《m:当nm时所得的拟合多项式就是拉格朗日或牛顿插值多项式。3.曲线拟合的最小二乘法在科学实验数据处理中,往往要根据一组给定的实验数据,求出自变量x与因变量y的函数关系,这是为待定参数,由于观测数据总有误差,且待定参数ai的数量比给定数据点的数量少(即n<m),因此它不同于插值问题.这类问题不要求通过点,而只要求在给定点上的误差的平方和最小.当时,即(5.8.1)这里是线性无关的函数族,假定在上给出一组数据,以及对应的一组权,这里为权系数,要求使最小,其中(5.8.2)这就是最小二乘逼近,得到的拟合曲线为y=s(x),这种方法称为曲线拟合的最小二乘法.(5.8.2)中实际上是关于的多元函数,求I的最小值就是求多元函数I的极值,由极值必要条件,可得(5.8.3)根据内积定义(见第三章)引入相应带权内积记号(5.8.4)则(5.8.3)可改写为这是关于参数的线性方程组,用矩阵表示为(5.8.5)(5.8.5)称为法方程.当线性无关,且在点集上至多只有n个不同零点,则称在X上满足Haar条件,此时(5.8.5)的解存在唯一(证明见[3]).记(5.8.5)的解为从而得到最小二乘拟合曲线(5.8.6)可以证明对,有故(5.8.6)得到的即为所求的最小二乘解.它的平方误差为(5.8.7)均方误差为在最小二乘逼近中,若取,则,表示为(5.8.8)此时关于系数的法方程(5.8.5)是病态方程,通常当n≥3时都不直接取作为基,其具体方法下节再讨论,下面只给出n=1的例子。4.用正交多项式作最小二乘拟合在最小二乘拟合中若,模型取为(5.8.8)时,由于法方程是病态方程,因此使用时应取为关于给定点的正交多项式,可避免求解病态方程组.类似定义9.3给出以下定义.设给定拟合数据及权可构造多项式,其中,且(5.9.16)则称是关于点集.带权的正交多项式族,为k次正交多项式.根据定义,若令.由递推关系得(5.9.17)利用正交性求得及为(5.9.18)令,由法方程(5.8.5)可求得解(5.9.19)从而得到最小二乘拟合曲线(5.9.20)它仍然是多项式函数,即.用计算机计算时求系数及与求系数可同时进行.当k=0,1,…,n时若有时,计算停止,此时即为所求.将向量空间中两向量正交(即垂直)的概念推广到连续函数空间,任两函数,内积就称它们为正交,函数序列两两正交,称为正交函数族,若为n次多项式,则当它满足(5.9.2)就称为正交多项式。正交多项式有很多重要性质,其中以正交性,递推关系和在区间[a,b]上有n个单实根的三个性质最重要。最常用也是最重要的正交多项式是Legendre多项式和Chebyshev多项式,它们是函数逼近的重要工具,在数值积分中也有重要应用,Legendre多项式是区间[-1,1]上权函数的正交多项式,其正交性由(5.9.7)式给出,递推关系式(5.9.8)都有具体应用是必须知道的。而Chebyshev多项式是区间[-1,1]上,权函数的正交多项式。它表示为由此表达式直接利用三角公式则可具体得到正交性(5.9.10)和递推关系(5.9.11)及其他重要性质。用正交多项式作最小二乘拟合,应根据给定数据及权定义关于离散点集带权的正交多项式它本质上与在区间[-1,1]上定义的正交多项式相似,只是把积分变成求和,再以所得到关于点集正交的多项式作基求最小二乘的拟合曲线,这就避免了用一般多项式拟合出现解法方程的病态问题,当然这种做法通常都在计算机上计算,不必记公式,只要能利用已有软件算出拟合曲线即可。5.最小二乘拟合多项式的存在唯一性定理1设节点01,,,nxxx互异,则方程组000021100001200001mmmniiiiiimmmmniiiiiiiiinmmmmnnnniiiiiiiiimxxyaxxxaxyaxxxxy(4)的解存在唯一。证:由克拉默法则,只需证明方程组(4)的系数矩阵非奇异即可。用反证法,设方程组(4)的系数矩阵奇异,则其所对应的齐次方程组000211000120001000mmniiiimmmniiiiiinmmmnnniiiiiimxxaxxxaaxxx(7)是非零解。(7)式可写为00()00,1,,nmjkikkixajn(8)将(8)式中第j个方程乘以(0,1,,)jajn,然后将新得到的1n个方程左右两端分别相加,得000[()]0nnmjkjikjkiaxa因为000[()]nnmjkjikjkiaxa000000()()mnnmnnjkjkkjijikiijkijkaaxaxax20[()]mniipx其中0()nknkkpxax所以()0(0,1,,)nipxim()npx是次数不超过n的多项式,他有1mn个相异零点,由代数基本定理,必须有010naaa。与齐次方程组有非零的假设矛盾。因此正规方程组(4)必有唯一解。定理2设01,,,naaa是正规方程组(4)的解,则0()nknkkpxax是满足(1)式的最小二乘拟合多项式。22000()minmmnkniikiiiikIpxyaxy(1)000021100001200001mmmniiiiiimmmmniiiiiiiiinmmmmnnnniiiiiiiiimxxyaxxxaxyaxxxxy(4)证明:只需证明。对任意一组数01,,,nbbb组成的多项式0()nknkkQxbx,恒有2200[()][()]mmniiniiiiQxypxy即可。2200200000000[()][()][()()]2[()()][()]02[()][]2()()mmniiniiiimmnininininiiiimnnjkjjikiiijknmnkjjjkiiijikQxypxyQxpxQxpxpxybaxaxybaaxyx因为(0,1,,)kakn是正规方程组(4)的解,所以满足(2)式,002()00,1,,mnkjkiiiikjIaxyxjna(2)因此有2200[()][()]0mmniiniiiiQxypxy故()npx为最小二乘拟合多项式。6.多项式拟合中克服正规方程组的病态在多项式拟合中,当拟合多项式的次数较高时,其正规方程组往往是病态的。而且(1)正规方程组系数矩阵的阶数越高,病态越严重;(2)拟合节点分布在区间0,mxx偏离原点越远,病态越严重;(3)(0,1,,)ixim的数量级相差越大,病态越严重。为了克服以上缺点,一般
本文标题:在Matlab中数据拟合的研究应用
链接地址:https://www.777doc.com/doc-5075745 .html