您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 求职简历 > 生物统计学课件--17曲线拟合(回归)
第五节曲线拟合(非线性回归分析)(可化为直线的曲线回归方程)一元线性回归方程是一种最简单的回归,但在实际工作中,遇到的却也很多。因为任何一种曲线回归,在一个很小的区间内,都可以认为是直线回归。尽管如此,直线回归并不能代替曲线回归。生物学中呈曲线关系的例子很多:细菌生长的数量与时间的关系年龄与身高的关系作物种植密度与作物产量的关系辐射强度或药物的浓度与致死率的关系为了将回归曲线直线化,首先要了解两个变量间所呈的函数关系。两个变量间的函数关系,可以根据专业知识去判定。例如:生长曲线一般呈S形曲线关系。细菌的生长量与时间的关系为指数函数关系等。此外还可以由散点图来判定两个变量的关系。我们将数据做适当的变换,将曲线化为直线,再按直线回归分析的方法处理,就可以求出相应的曲线回归方程,这一分析过程,就称为曲线拟合。一、对数函数曲线的拟合1、对数方程的一般表达式:xbaylgˆ2、对数曲线的图象xbaylgˆ3、直线化方法:若令,则有`lgxx`ˆbxay4、求a和b的值:,``xyxSSSSb`xbyaxbaylgˆ例:在水稻塑料薄膜青苗床内空气最高温度和室外空气最高温度资料列于下表,试求它们之间的相关关系。序号12345678910X7.27.911.816.912.018.718.920.221.822.7Y13.821.424.933.632.339.540.136.940.242.6X`0.85730.89761.07191.22791.07921.27181.27651.30541.33851.3560序号11121314151617181920X22.923.123.323.623.827.027.628.630.731.4Y44.636.635.144.444.143.948.348.546.350.4X`1.35981.36361.36741.37291.37651.43141.44091.45641.48711.4969X:室外气温Y:苗床内气温首先,根据上表的数据(x,y)绘制散点图。由散点图看x与y的关系符合曲线类型,很象b0时的对数函数曲线y=a+blgx,所以做x`=lgx的对数转换,并求x`=lgx。以(x`,y)作散点图,散点近似于线性分布。求一级和二级数据:,835.25`x,5.767y,5943.1022`yx``xyxSSSSbxylg6832.498058.25ˆ所以有:回归关系的检验可以进行回归系数或相关系数的检验。,2918.1`x6275.0`xSS,375.38y6175.1721ySS1762.31/```nyxyxSSyx`xbya6832.496275.01762.318058.252918.16832.49375.38苗床内最高气温y与空气最高气温x`(lgx)之间的线性关系二、指数曲线的拟合1、一般化方程:,xbaybxeay2、描述的现象:细菌的繁殖土壤中某些杀虫剂的分解曲线放射性同位素的衰变水果、蔬菜的腐败和温度的关系,xbay3、直线化的方法:方程的两边取常用对数,有lgy=lga+x·lgb另lgy=y`,lga=a`,lgb=b`,则有:y`=a`+b`x4、指数曲线的图象xabyˆ例:棉花红铃虫的产卵数与温度有关,试根据下表数据,建立棉花红铃虫产卵数与温度的回归方程。x温度21232527293235y产卵数711212466115325y`=lgy0.84511.04141.32221.38021.81922.06072.5119由(x,y)的散点图可见,x与y有曲线回归关系,散点分布近于指数函数曲线的分布将y`=lgy与x做散点图(x,lgy),x与lgy的分布近似于线性分布。X与lgy的分布近似于线性分布,做线性回归:xbay```,lglglgbxay解:4510.17`/`0925.2,5687.1`,981.10`7143.147,4286.27,192``nyxyxSSSSyySSxxxyyx1181.07143.1474510.17``xxySSSSbxy3125.10214.0ˆ6706.14286.271181.05687.1```xbya3125.110101181.0`bb0214.010106706.1`aa050100150200250300350152025303540回归关系的检验:可以利用b`或者r进行检验,主要是对线性关系的检验,线性回归或相关显著,则指数回归关系的拟合就显著。三、幂函数曲线的拟合1、一般化方程:bxay2、幂函数曲线的图象bxay3、直线化的方法:两边取常用对数,使之线性化,得:xbaylglglg令:lgy=y`,lgx=x`,lga=a`,则:y`=a`+bx`上式符合直线回归方程的一般形式。四、怎样知道利用对数转换最好的方法依然是绘制两个变量的散点图,如果散点不符合直线或狭长形的椭圆,则可在双边对数纸上,再将散点绘制出来,若散点的分布符合线性或狭长椭圆,则可以进行x与y的双对数转换。例题:在突变实验中,用不同剂量的射线,照射植物的种子,结果苗期高度与成活株之间有一定的关系。用X射线照射大麦的种子,记处理株第一叶平均高度占对照株高度的百分数为X,存活百分数为Y,得到以下结果,试对两者的关系进行分析。X283240506072808085Y812182830556185801、画两个变量的散点图:由不同数据变换的散点图可见,X与Y的关系是幂函数的关系。bxay按照幂函数的直线化方法,求二级数据:7361.1`6245.15`2658.0`xxSSx5022.1`5202.13`0824.1`yySSy5297.0`/`````nyxyxSSyx9928.12658.05297.0```xyxSSSSb9577.17361.19928.15022.1````xbyaY’对X’的回归方程为:`9928.19577.1`ˆxy因为:a’=lga,所以:a=10-1.9577=0.0110所以:9928.1011.0ˆxy五、曲线的检验有时将同一组数据,我们将其做指数函数或幂函数形式的变换,都能得到X与Y的拟合曲线,并且可能在做线性回归关系检验的时候,线性关系都显著。那么,究竟哪一条拟合曲线是最好的呢?一般情况下,以剩余平方和或称之为误差平方和的大小来判断,即SSe最小时的拟合曲线为最好的曲线。xxyyeSSSSSSSS/2niiieyySS12ˆ可以对一组数据尝试进行多种拟合,找出SSe最小,其为最好的拟合曲线。必须用来计算,不可以用来计算。四、概率对数变换在辐射育种和药理学实验中,经常遇到寻找半致死剂量的问题。致死率(y)与剂量(x)间的关系曲线往往呈S形。在半致死处,曲线的斜率最大,与死亡率的交点最清楚,因此在实际工作中,常常采用半致死剂量这一标准。确定半致死剂量,最常用的方法就是概率对数转换,当我们把死亡率做概率转换,辐射剂量做对数转换后,两者会呈很好的线性关系。1、概率转换:P(uup)=p,其中,p为死亡率,即为y值,up为y`的值。2、对数转换:x`=lgx,x为辐射剂量。则:y`=a+bx`,y`与x`间有很好的线性关系。3、半致死剂量:所谓的半致死剂量,即为Y=50%时的辐射或药物剂量X,用LD50来表示,当p=y=0.5时,P(uup)=0.5,则up=0。将up=y`=0代入y`=a+bx`,则有:0=a+bx`,则有:x`=-a/b,因为x`=lgx,所以bax10此时的x即为半致死剂量,用LD50表示。baLD1050例题:用不同剂量的射线照射小麦品种库斑克,调查死苗率,得到以下结果:剂量(Kr)x14161820222426死苗率(%)y6104070809395x`=lgx1.1461.2041.2551.3011.3421.3801.415y`=up-1.555-0.842-0.2530.5240.8421.4761.645利用原始数据绘制散点图,x与y为S形曲线形状,将y与x做概率转换和对数转换,则两者的散点图呈线性关系。因此,对转换后的数据(褐色)进行线性分析:``ˆbxay求二级数据:057.0,292.1`,043.9``xSSxx577.8,262.0`,837.1``ySSyy10526.12057.0690.0```xyxSSSSb690.0`/`````nyxyxSSyx378.15292.110526.12262.0``xbya`10526.12378.15`ˆxy`10526.12378.15`ˆxy62.18101050270.110625.12378.15LDa=-15.378,b=12.10526答:半致死剂量为18.6(Kr)五、曲线的检验有时将同一组数据,我们将其做指数函数或幂函数形式的变换,都能得到X与Y的拟合曲线,并且可能在做线性回归关系检验的时候,线性关系都显著,那么,究竟哪一条拟合曲线是最好的呢?一般情况下,以剩余平方和或称之为误差平方和的大小来判断,即SSe最小时的拟合曲线为最好的曲线。xxyyeSSSSSSSS/221ˆniiieyySS可以对一组数据尝试进行多种拟合,找出SSe最小,其为最好的拟合曲线。必须用来计算,不可以用来计算。
本文标题:生物统计学课件--17曲线拟合(回归)
链接地址:https://www.777doc.com/doc-3403330 .html