您好,欢迎访问三七文档
第一章数据拟合问题来源:实际问题中经常遇到以下情况:1、只知函数)(xf在一些点处的函数值或导数值,没有明确的解析式;2、知其解析式但很复杂。这样我们就要寻求某个较为简单的函数)(x来逼近)(xf,即用)(x作为)(xf的近似表达式.寻求简单函数)(x过程通常有两大类方法:1、插值法;2、数据拟合。本节我们仅介绍拟合的方法。第一节问题的提出以及线性拟合一、数据拟合与最小二乘法数据拟合:为了获得便于应用的经验公式()x(不必要求()iixy),往往采用拟合的方法。所谓拟合是根据一组数据,即平面上的若干点,要求确定函数y=f(x),使这些点与曲线总体来说尽量接近。这就是数据拟合成曲线的思想,简称为曲线拟合(fittingacurve)。数据拟合中最常用的方法就是最小二乘法,下面通过一个简单的例题进行说明.例1.1下面给出了悬挂不同重量的物体时弹簧的长度:x(g)51015202530y(cm)7.258.128.959.9010.9011.80讨论变量y与x之间的关系.为了研究弹簧的伸长量y和悬挂的物体质量x之间的关系,首先将表中各组数据),(iiyx)6,,2,1(i在坐标平面xOy内描出对应的点,得到的图通常被称为散点图.通过观察可以发现,这些点大致分布在一条直线上,因此就考虑利用直线bxay(2.1.1)去描述y与x之间的关系,但是怎样确定系数a、b,才能使近似函数)(xy尽量反映所给数据点的变化趋势呢?一般采用的方法是确定a、b使所有的计算值和实测值之差iiiyx)(,(2.1.2)(i又称为偏差或残差)的平方之和最小,即使2112)]([iniiniibxayS图2-1最小,这个方法称为最小二乘法.这时(2.1.1)称为最小二乘拟合一次多项式,S称为偏差平方和.由微分学中求极值的方法可知,只需求S关于a、b的一阶偏导数,并令其为零,可以得到a、b满足的方程组112()02()0niiiniiiiSyabxaSyabxxb,(2.1.3)求解可得284.6ˆa,183.0ˆb可以证明aˆ,bˆ可以使S取得最小值,这样直线方程xy183.0284.6ˆ就可以确定.注:问题:给定一批离散的数据点,需确定满足特定要求的曲线,从而获取整体的规律。即通过窥几斑来达到知全豹。解决方案:若不要求曲线通过所有数据点,而是要求它反映对象整体的变化趋势,这就是数据拟合,又称曲线拟合。从几何意义上看,拟合是给定了空间中的一些点,找到一个已知形式的连续曲线来最大限度地逼近这些点。二、最小二乘原理的一般理论设给定的数据为),(iiyx,),,2,1(mi,设拟合曲线方程为),,,,()(10niaaaxPx,令201011(,,,)[(,,,,)]mniniiSaaaPxaaay1nm,(2.2.1)最小二乘法就是求参量ia,),,2,1(ni,使01(,,,)nSaaa最小,即求*iiaa使***0101(,,,)(,,,)nnSaaaSaaa.这时),,,,()(10niaaaxPx称为函数)(xyy在点集miyxXii,,2,1),,(上的最小二乘逼近.解决方法:由多元函数求极值的方法可得0jSa,),,1,0(nj.(2.2.2)(这个方程称为法方程或正规方程.)即求得***01,,,naaa,满足***0101(,,,)(,,,)nnSaaaSaaa如何求得***01,,,naaa呢?我们采用下面的拟合函数,得到一般的求解公式:若拟合函数为)()()()(1100xaxaxaxnn其中)(0x,)(1x,…,)(xn线性无关,由公式(2.2.1)可得20110(,,,)[()]mnnkkiiikFaaaaxy(2.2.3)由公式(2.2.2)可得102[()]()0,mnkkiijiikjFaxyxa),,2,1(nj.(2.2.4)如果引入记号1(,)()()mkjkijiixx,1(,)()mkkiiifxy(2.2.5)则方程组可以表示为1(,)(,),(1,2,,)nkjkkkafjn(2.2.6)即),(),(),(),(),(),(),(),(),(),(),(),(10100000000000101000fffaaannnn(2.2.7)这是一个系数矩阵为对称矩阵的线性方程组.可以证明:当函数)(0x,)(1x,…,)(xn线性无关时,方程存在唯一解*iiaa,),,1,0(ni,并且相应拟合函数为)()()()(*1*10*0xaxaxaxnn这就是满足条件的最小二乘解.综上分析,求最小二乘法的步骤可以归纳为:先通过所给数据画出散点图,并根据散点图确定经验公式的函数类型(有时可以有多种选择);再建立法方程,并通过解法方程求得最小二乘解的对应参数*ia),,1,0(ni.第二节代数多项式拟合已知一组数据,用什么样的曲线拟合最好呢?可以根据散点图进行直观判断,在此基础上,选择几种曲线分别作拟合,然后比较哪条曲线的最小二乘指标S最小。一、代数多项式拟合作为数据拟合的一种常见情况,若讨论的是代数多项式,即nnxaxaax10)(这时只需取kkxx)(),,1,0(nk即可,由公式(2.2.7)++++++++++++++++++++++++++++++f=a1+a2x+a3x2f=a1+a2/xf=aebxf=ae-bxf=a1+a2xf=a1+a2x+a3x2),(),(),(),(),(),(),(),(),(),(),(),(10100000000000101000fffaaannnn可知相应的法方程为iniiiinninininiiiniiyxyxyaaaxxxxxxxxm102112(2.2.8)其中符号“”是“mi1”的简写.例2.2已知某种半成品在生产过程中的废品率y(%)与它的某种化学成分x(0.01%)有关,下表中记录了y与x的相应的实测值,试用最小二乘法建立y与x之间的经验公式.x/0.01%3436373839393940y/%1.301.000.730.900.810.700.600.50x/0.01%4041424343454748y/%0.440.560.300.420.350.400.410.60解根据前面的讨论,解题的过程如下:(1)确定拟合曲线的形式.根据散点图3-2可以考虑采用二次多项式进行拟合,设拟合曲线为2210xaxaay.(2)建立法方程组.利用公式(3.2.7)计算可得460993531105005267091105005267096512670965116432322iiiiiiiixxxxxxxxm44.1580304.39602.102iiiiiyxyxy所以法方程为210460993531105005267091105005267096512670965116aaa44.1580304.39602.10求解可得256.18ˆ0a,8093.0ˆ1a0092.0ˆ3a所以所求经验公式为20092.08093.0256.18ˆxxy.第三节可线性化的非线性一元函数的数据拟合在实际问题中,通常会遇到两个变量之间存在的相关关系为非线性关系,这时法方程往往是非线性多元方程组,不宜求解,这时就要采取其它的方法求解参数.对于这类问题来说,通常分为两种情况进行处图3-2理,一种是利用变量代换,将其转化为线性问题处理,这时前面的结果就可以直接应用;另一种是不能线性化的问题,处理起来比较麻烦.这里我们将通过一个例子介绍可以线性化的非线性一元函数的数据拟合问题.例3.2在某个化学反应中测得生成物的浓度y与时间t的数据如下:t/0.01%12345678y/%4.006.408.008.809.229.509.709.86t/0.01%910111213141516y/%10.0010.2010.3210.4210.5010.5510.5810.60试讨论生成物的浓度y与时间t的关系.解依据提供的测试数据作出散点图.(图2-3)根据散点分布形状,选配合适的曲线.假设回归曲线是指数型的,即变量y和x满足关系tbaey,(0a,0b).令yyln,tt1,aaln,bb则有tbay列表计算未知系数a、b的估计值.i123…141516iitt/11.00000.50000.3333…0.07140.06670.0625iiyyln1.38631.85632.0794…2.35612.70812.3609类似于例3.1的求解过程可得4807.4ˆa,0567.1ˆb于是,y关于t的线性回归方程为ty0567.14807.4由yyln,tt1,aaln,bb可以得到011325.0ˆaea,0567.1ˆˆbb所以生成物的浓度y与时间t的回归方程为tey0567.1011325.0.下面介绍一些常见的可线性化曲线及其相应的图图3-3形,以便于在实际计算中参照选用.1.双曲型曲线(1)xbay1(见图3-4)令yy1、xx1,则有xbay(0a,0b)(0a,0b)图3-4(2)xbay(见图3-5)令xx1,则有xbay(0a,0b)(0a,0b)图3-52.幂函数型曲线baxy(见图3-6)令yyln,xxln,aaln,则有xbay.图3-63.指数型曲线(1)bxaey(见图3-7)令yyln,aaln,则有bxay.(0a,0b)(0a,0b)(2)xbaey(见图3-8)令yyln,xx1,aaln,则有xbay.(0a,0b)(0a,0b)练习1.已知函数表如下x-2-1012y01210试用二次多项式2210xcxccy拟合这组数据.图3-7图3-8
本文标题:第一章-数据拟合
链接地址:https://www.777doc.com/doc-7022059 .html