您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 实验三-非线性回归分析
1实验三非线性回归分析(2学时)一、实验目的(1)、掌握非线性回归分析的基本步骤;(2)、熟练用MATLAB软件实现可线性化的回归分析及曲线回归分析。二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现可线性化的回归分析及曲线回归分析;(2)掌握非线性回归分析的基本步骤。四、实验原理1、常见的可线性化模型(1)双对数模型10uyxe01lnlnlnyxu(2).半对数模型①对数-线性模型:01lnybbxu②线性-对数模型:01lnybbxu(3).倒数模型①011ybbux②0111bbuyx(4)逻辑(logistic)成长曲线模型,0,0,01ttatuKyKabbe(5)龚伯斯(Gompertz)成长曲线模型00,0,0,1bttaebtyKeKaKab(6)多项式模型①一元二次多项式模型:20111yxxu2②一元三次多项式模型:230111111yxxxu③二元二次多项式模型:22011221112221212yxxxxxxu2、不可线性化模型(即曲线回归模型):(,)yfxu其中f为非线性的,并且模型不可线性化。一般使用非线性最小二乘估计方法,并用Newton迭代求解其中的正规方程组。五、实验举例例1、对GDP(国内生产总值)的拟合。选取GDP指标为因变量,单位为亿元,拟合GDP关于时间t的趋势曲线。以1981年为基准年,取值为t=1,1998年t=18,1991-1998年的数据如下:年份tGDP年份tGDP14862.41018547.925294.71121617.835934.51226638.1471711334634.458964.41446759.4610202.21558478.1711962.51667884.6814928.31774462.6916909.21879395.7解:第一步:一元线性回归模型(一)程序如下:建立test3_1_1.m文件如下(具体注释见m文件):%%%%%%%%作时间t与GDP(y)的回归分析[data,head]=xlsread('test3_1.xlsx');%导入数据3t=data(:,1);%提取年份ty=data(:,2);%国内生产总值plot(t,y,'k.');%画y与t的散点图xlabel('年序号(t)')ylabel('GDP(y)')%调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(t,y)stats.p%%%%%%绘制残差与权重的散点图%%%%%%%%%%%%%%%figure;plot(stats.resid,stats.w,'o')%绘制残差与权重的散点图xlabel('残差')ylabel('权重')%%%%%%%画robustfit函数对应的回归直线%%%%%%%%%%%%%tdata=[ones(size(t,1),1),t];%在原始数据t的左边加一列1yhat=tdata*b;%求robustfit函数对应的y的估计值figure;plot(t,y,'ko')%画原始数据散点holdonplot(t,yhat,'r--','linewidth',2)%画robustfit函数对应的回归直线,红色虚线xlabel('年序号(t)')ylabel('GDP(y)')(二)实验结果与分析:(1)散点图图3.1年序号t与GDP(y)的散点图024681012141618012345678x104年序号(t)GDP(y)4从散点图可以看出t与y的线性趋势并不明显,但可以考虑进行一元线性回归。(2)调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats的P值‘系数的估计值’P值1.0e+04*-1.34100.02270.44140.0000稳健回归得出的回归方程为𝑦^=−13410+4414∗𝑡。常数项和回归系数的t检验的p值只有一个小于显著性水平0.0001,可知线性关系是不显著的。(3)下面作出残差向量和权重向量的散点图,从直观上了解残差和权重的关系。图3.2残差和权重的散点图从图3.2可以看出残差绝对值越大,其权重就越小,残差为零时,相应的权重为1,这就保证了拟合的稳健性。此处残差的数量级为104,从而残差绝对值太大,可知明显拟合效果不好。下面作出拟合效果图,如图3.3所示。-1.5-1-0.500.511.5x1040.880.90.920.940.960.981残差权重5图3.3原始数据散点与回归直线图从上图可知:拟合效果明显很不好。原始数据点偏离回归直线距离太大。下面进行复合函数模型的拟合,并进行拟合效果比较。第二步:作复合函数模型(1)散点图:图3.4年序号t与GDP(lny)的散点图024681012141618-1012345678x10402468101214161888.599.51010.51111.5年序号(t)GDP(lny)6从图3.4的散点图表明年序号t与lny的线性趋势比图3.1的线性趋势明显。(2)调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats的P值'系数的估计值''检验的P值'8.18961.0e-16*0.17560.00000.9250稳健回归得出的回归方程为𝑙𝑛𝑦^=8.1896+0.1756∗𝑡。常数项和回归系数的t检验的p值分别为0,0.925×10−16,均小于显著性水平0.0001,可知线性关系是极显著的。(2)绘制残差与权重的散点图图3.5残差与权重的散点图与图3.2相比较,从图3.5可知残差绝对值显著减小,残差的数量级为10−1,并且权重集中在1附近的点比之前多。这说明拟合的稳健性显著加强。(3)回归直线与总结-0.15-0.1-0.0500.050.10.150.20.550.60.650.70.750.80.850.90.951残差权重7图3.6原始数据散点与回归直线图(lny)从上图可知:此次拟合效果是显著的。总结:线性回归方程:𝑦^=−13410+4414∗𝑡p0.0001复合函数回归方程:𝑦^=3603.3∗(1.192)𝑡即𝑙𝑛𝑦^=8.1896+0.1756∗𝑡p0.0001所以由t检验的p值,再结合回归直线图知:复合函数模型比线性回归模型要好。例2、一位药物学家是用下面的非线性模型对药物反应拟合回归模型10021()iicicycuxc其中,自变量x为药剂量,用级别表示;因变量y为药物反应程度,用百分数表示。三个参数c0,c1,c2都是非负的,c0的上限是100%,三个参数的初始值取为c0=100,c1=5,c2=4.8.测得9个数据如下表:x123456789y(%)0.52.33.42454.782.194.896.296.402468101214161888.599.51010.51111.5年序号(t)GDP(lny)8解:(一)程序如下:x=[1:9];y=[0.52.33.42454.782.194.896.296.4];plot(x,y,'k.')xlabel('药剂量(x)')ylabel('药物反应程度(y)')options=statset;options.Robust='on';%%%%%调用nlinfit函数作非线性回归[beta,r,J,COVB,mse]=nlinfit(x,y,fun1,[100,5,4.8],options);beta%查看未知参数估计值mse%查看均方残差平方和(误差方差𝜎2的估计)mse%求参数估计值的95%置信区间ci1=nlparci(beta,r,'covar',COVB,'alpha',0.05)%%%%%绘制robustfit函数对应的回归直线plot(x,yhat,'linewidth',3)xlabel('药剂量(x)')ylabel('药物反应程度(y)')legend('原始数据散点','非线性回归曲线','location','northwest')(二)实验结果与分析:(1)散点图1234567890102030405060708090100药剂量(x)药物反应程度(y)9图3.7药剂量(x)与药物反应程度(y)的散点图(2)回归模型与误差方差𝝈𝟐的估计参数C0C1C2误差方差𝜎2的估计99.50546.77014.79873.8895由上述可得非线性回归模型为𝑦^=99.51−99.51/(1+(𝑥4.80)6.77。误差方差𝜎2的估计mse=3.8895,这个数还是非常小的,拟合效果还是很好的。(3)非线性回归曲线图3.8原始数据散点与非线性回归曲线从上图可以看出拟合效果还是很不错的。但非线性回归,不能像线性回归那样对回归方程作显著性检验。所以,非线性回归模型为𝑦^=99.51−99.51/(1+(𝑥4.80)6.77对该药物反应拟合回归模型是合理的。六、实验内容Logistic回归函数常用于拟合某种消费品的拥有率,下表是北京市每百户家庭平均拥有的照相机数,试针对以下两种拟合Logistic回归函数:1234567890102030405060708090100药剂量(x)药物反应程度(y)原始数据散点非线性回归曲线101011tybbu(1)已知u=100,用线性化方法拟合;(2)u未知,用非线性最小化方法拟合。年份ty年份ty197817.519881159.6197929.819891262.21980311.419901366.51981413.319911472.71982517.219921577.21983620.619931682.41984729.119941785.41985834.619951886.81986947.419961987.219871055.5七、思考练习某种商品的流通率y(%)与销售额x之间呈双曲线函数模型:10yux对9个商店该种商品的销售额与流通率的统计资料如下所示。商店编号123456789销售额(万元)1.54.57.510.515.516.519.522.525.5流通费率y(%)7.04.83.63.12.72.52.42.32.2八、参考文献[1].李宝仁.计量经济学[M].机械工业出版社,2007.12[2].何晓群.应用回归分析[M].中国人民大学出版,2002.9
本文标题:实验三-非线性回归分析
链接地址:https://www.777doc.com/doc-2458083 .html