您好,欢迎访问三七文档
曲线拟合插值与拟合的相同点•都需要根据已知数据构造函数。•可使用得到函数计算未知点的函数值。插值与拟合的不同点•插值:过点;(适合精确数据)•拟合:不过点,整体近似;(适合有经验公式或有误差的数据)•对实验数据进行拟合时,函数形式通常已知,仅需要拟合参数值。曲线拟合问题的提法已知一组(二维)数据,即平面上n个点(xi,yi)i=1,…,n,寻求一个函数(曲线)y=f(x),使f(x)在某种准则下与所有数据点最为接近,即曲线拟合得最好.这种构造近似函数的方法称为曲线拟合,f(x)称为拟合函数拟合的标准•(1)用各点误差绝对值的和表示•(2)用各点误差按绝对值的最大值表示•(3)用各点误差的平方和表示miiiyxfR11)(iimiyxfR)(max1212))((imiiyxfR最小二乘拟合•式中R2称为均方误差。由于计算均方误差的最小值的原则容易实现而被广泛采用。•按均方误差达到极小构造拟合曲线的方法称为最小二乘法。拟合与回归的比较•回归是关于离回归平方和最小(即最小二乘法)作为目标函数的模型系数求算方法。•而拟合可能有其他的目标函数如绝对差值之和最小等目标函数。•但绝大多数也是以离回归平方和最小为目标函数,此时两者没有任何差别,只是提法上的不同。线性最小二乘法的基本思路第一步:先选定一组函数r1(x),r2(x),…,rm(x),mn,令f(x)=a1r1(x)+a2r2(x)+…+amrm(x)(1)其中a1,a2,…,am为待定系数.第二步:确定a1,a2,…,am的准则(最小二乘准则):使n个点(xi,yi)与曲线y=f(x)的距离i的平方和最小.线性最小二乘法的基本思路记)2(])([])([),,(211211221iiknimkkininiiimyxrayxfaaaJ问题归结为,求a1,a2,…,am使J(a1,a2,…,am)最小.J(a1,a2,…,am)分别对a1,a2,…,am求偏导并令其为0,得方程组线性最小二乘法的基本思路RTRa=RTy当RTR可逆时,方程组的解为:a=(RTR)-1RTy其中线性最小二乘拟合f(x)=a1r1(x)+…+amrm(x)中函数{r1(x),…,rm(x)}的选取1.通过机理分析建立数学模型来确定f(x);++++++++++++++++++++++++++++++f=a1+a2xf=a1+a2x+a3x2f=a1+a2x+a3x2f=a1+a2/xf=aebxf=ae-bx2.将数据(xi,yi)i=1,…,n作图,通过直观判断确定f(x):用MATLAB作拟合•Matlab有一个功能强大的曲线拟合工具箱(CurveFittingToolbox)cftool,使用方便,能实现多种类型的线性、非线性曲线拟合。•调用语法–cftool–cftool(xdata,ydata)•界面如下所示“Data”按钮•点击“Data”按钮,弹出“Data”窗口;•利用Xdata和Ydata的下拉菜单读入数据x,y,可修改数据集名“Datasetname”,然后点击“Createdataset”按钮,退出“Data”窗口,返回工具箱界面,这时会自动画出数据集的曲线图;“Fitting”按钮•点击“Fitting”按钮,弹出“Fitting”窗口;•点击“Newfit”按钮,可修改拟合项目名称“Fitname”,通过“Dataset”下拉菜单选择数据集,然后通过下拉菜单“Typeoffit”选择拟合曲线的类型。CustomEquations用户自定义的函数类型•Linearequationsaredefinedasequationsthatarelinearintheparameters.(例如:y=a*(sin(x-pi))+c)Forexample,thepolynomiallibraryequationsarelinear.•Functionsthatdependonlyontheindependentvariableandconstants.Notethatifyouattempttodefineatermthatcontainsacoefficienttobefitted,anerrorisreturned.CustomEquations用户自定义的函数类型•General(nonlinear)equationsaredefinedasequationsthatarenonlinearintheparameters,orareacombinationoflinearandnonlinearintheparameters.Forexample,theexponentiallibraryequationsarenonlinear.•例如:Y=a*exp(-b*x)+cExponential指数函数•Aone-termortwo-termexponentialequation.•有2种类型–a*exp(b*x)–a*exp(b*x)+c*exp(d*x)Fourier傅立叶函数•Sumsofsinesandcosinesfromonesumuptoeightsums.•有8种类型,基础型是–a0+a1*cos(x*w)+b1*sin(x*w)Gaussian高斯函数•SumsofGaussiansuptoeightpeaks.•有8种类型,基础型是–a1*exp(-((x-b1)/c1)^2)Interpolant插值•有4种类型–Linear–nearestneighbor–cubicspline–shape-preservingPolynomial多项式函数•Polynomialequationsfromlineartoninthdegree.•有9种类型–linearPolynomial–quadraticPolynomial–cubicPolynomial–4-9thdegreePolynomialPower幂函数•有2种类型–a*x^b–a*x^b+cRational有理数函数•Ratiosofpolynomialsuptodegreefiveinbothnumerator(分子)anddenominator(分母).•分子、分母共有的类型是linearpolynomial、quadraticpolynomial、cubicpolynomial、4-5thdegreepolynomial;•此外,分子还包括constant型SmoothingSpline平滑样条•Apiecewisepolynomialthatvariesfromlineartocubic.Youadjustthelevelofsmoothingwiththesmoothingparameter.Thedefaultparametervaluedependsonthedataandoftenproducesthesmoothestfit.•平滑参数介于0~1,越大越平滑,取0时为一次多项式拟合。SumofSinFunctions正弦曲线•Sumsofsinesfromonefunctionuptoeightfunctions.•有8种类型,基础型是–a1*sin(b1*x+c1)Weibull韦伯曲线•Thetwo-parameterWeibulldistribution•只有一种–a*b*x^(b-1)*exp(-a*x^b)•Weibull分布的密度函数,k为形状参数,l为尺度参数Weibull分布的密度曲线Results复选框•Displaysdetailedresultsforthecurrentfitincludingthefittype(model,spline,orinterpolant),thefittedcoefficientsand95%confidenceboundsforparametricfits,andthesegoodnessoffitstatistics:•下面是个例子Results复选框•LinearmodelPoly2:–f(x)=p1*x^2+p2*x+p3•Coefficients(with95%confidencebounds):–p1=1.376(-0.1468,2.898)–p2=-0.4619(-2.126,1.202)–p3=0.5758(0.2052,0.9463)•Goodnessoffit:–SSE:2.308–R-square:0.5809–AdjustedR-square:0.5499–RMSE:0.2924SSE•Thesumofsquaresduetoerror.Thisstatisticmeasuresthedeviationoftheresponsesfromthefittedvaluesoftheresponses.Avaluecloserto0indicatesabetterfit.•偏差平方和,越接近0越好R-square•Thecoefficientofmultipledetermination.Thisstatisticmeasureshowsuccessfulthefitisinexplainingthevariationofthedata.Avaluecloserto1indicatesabetterfit.•复相关系数平方(决定系数),越接近1越好AdjustedR-square•ThedegreeoffreedomadjustedR-square.Avaluecloserto1indicatesabetterfit.Itisgenerallythebestindicatorofthefitqualitywhenyouaddadditionalcoefficientstoyourmodel.•修正的复相关系数平方,越接近1越好AdjustedR-square•下列公式中的m为拟合函数中待估参数个数,如:对一元一次多项式拟合,f(x)=a+bx,此时m=2,n为数据点个数。该修正类似修正的样本方差使其为总体方差的无偏估计。RMSE•Therootmeansquarederror.Avaluecloserto0indicatesabetterfit.•偏差平方的均值的算术平方根,越接近0越好曲线拟合好坏如何评价•首要指标是目标函数最小(拟合度最大);•其次是应考虑关键点的吻合,这些关键点包括:初始点(有时是原点)、拐点、峰值点、极值点、中间点、渐近点、终值点等,在这些关键点上,数据观察值点与函数值点应尽可能一致;•再次是拟合的模型应尽可能简单(模型的形式简单,参数数少)。拟合曲线在实验数据点之外偏离?•这主要与模型有关,一个合适的模型除了在实验数据点全距内高度吻合,也应作适当的外推,这类模型往往具有理性性质。•用多项式拟合是最简单的拟合,但高阶多项式的最大问题是外推将百分之百地偏离(甚至于中间插值也将大范围偏离),它不是一种理性的模型,在试验研究的数据分析中应用价值很小。•多项式拟合是lastchoice,notfirstchoice.实践中如何选择模型?•在数据拟合实践中,理性模型毕竟是少数,大多数的情形是根据数据的趋势寻找合适的模型,有时好几个模型对数据都有较好的拟合,但通过对关键点的比较总会找到一种最合适的模型。•在选择不同的模型时,合理性和可解释性是首要考虑的因素。然后,尽量寻找合适的模型,减少荒唐外推结果的发生。施肥问题•某研究所为了研究氮肥(N)的施肥量与土豆产量的影响,做了10次实验,实验数据见表1,其中ha代表公顷,t代表吨,kg代表千克。试分析氮肥的施肥量与土豆产量之间的关系。施肥量(kg/ha)03467101135产量(t/ha)15.221.425.732.334施肥量(kg/ha)202259336404471产量(t/ha)39.543.243.540.830.8施肥问题优化策略•施肥问题拟合函数:•利用微分模型最优策略方法求
本文标题:曲线拟合讲稿
链接地址:https://www.777doc.com/doc-2316514 .html