您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > 实验13--回归分析
实验13回归分析【实验目的】1.了解回归分析的基本原理,掌握MATLAB实现的方法;2.练习用回归分析解决实际问题。【实验内容】【题目2】电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.02.1模型分析本题研究电视广告费用与报纸广告费用对电影收入的影响。我们首先尝试线性回归,由R2值判断回归模型是否合理。如果不合理,再采取其他方法进行回归分析。设电视广告费用为1x,报纸广告费用为2x,每周电影院收入为y。建立如下模型:22110xxy2.2matlab求解y=[9690959295959494];x1=[1.52.01.52.53.32.34.22.5];x2=[5.02.04.02.53.03.52.53.0];n=8;m=2;X=[ones(8,1),x1',x2'];[b,bint,r,rint,s]=regress(y',X);b,bint,srcoplot(r,rint)得到如下结果:b=83.21161.29852.3372bint=78.805887.61740.40072.19621.48603.1883s=0.908924.94080.00250.4897整理成表格如下:回归系数回归系数估计值回归系数置信区间β083.2116[78.805887.6174]β11.2985[0.40072.1962]β22.3372[1.48603.1883]R2=0.9089,F=24.9408,p=0.0025,s2=0.4897在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。2.3剔除点后重新计算删除第一个点后重新计算,将输出结果同样以表格表示。回归系数回归系数估计值回归系数置信区间β081.4881[78.787884.1883]β11.2877[0.79641.7790]β22.9766[2.32813.6250]R2=0.9768,F=84.3842,0.0005,s2=0.1257剔除第一个异常点后,R2=0.97685,相比之前有了增加,拟合的线性性有了提高;相比之前的模型,p值也有了明显的减少,远小于显著性水平α,这表示置信概率大大提高了;s2也有了减小,说明了偏差减小。综合以上几点,说明这个二元线性的模型比较合理,回归效果很好。拟合公式为y=81.4881+1.2877x1+2.9766x22.4小结本题是个较为直观的线性回归题,在它的计算中出现了异常点。剔除后计算可以得到一个回归效果相当好的模型。【题目8】汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料如表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售量(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)(1)对普通型和豪华型汽车分别建立如下模型:y1=β0(1)+β1(1)x1+β2(1)x2,y2=β0(2)+β1(2)x1+β2(2)x2给出β的估计值和置信区间,决定系数R2,F值及剩余方差等。(2)用x3=0,1表示汽车类型,建立统一模型y=β0+β1x1+β2x2+β3x3,给出给出β的估计值和置信区间,决定系数R2,F值及剩余方差等。以x3=0,1带入统一模型,将结果与(1)的两个模型的结果比较,解释二者的区别。(3)对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何缺陷?(4)对统一模型增加二次项和交互相,考察结果有什么改进。8.1根据模型分别求解由题意,对普通型和豪华型汽车分别建立如下模型:y1=β0(1)+β1(1)x1+β2(1)x2,y2=β0(2)+β1(2)x1+β2(2)x2此为二元线性回归,可用matlab编写程序如下:y1=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3];y2=[7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];n=18;m=2;X=[ones(n,1),x1',x2'];[b1,bint1,r1,rint1,s1]=regress(y1',X);[b2,bint2,r2,rint2,s2]=regress(y2',X);subplot(2,1,1)rcoplot(r1,rint1)subplot(2,1,2)rcoplot(r2,rint2)得到如下图:在残差及置信区间的图中,有三个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。8.2剔除点后的模型求解(1)对于y1=β0(1)+β1(1)x1+β2(1)x2剔除第14、18个点后继续自此基础上剔除第11个点(2)对于y2=β0(2)+β1(2)x1+β2(2)x2剔除第14个点后继续剔除第七个点,得到残差及置信区间图如下:将输出结果汇总成下表:普通型回归系数回归系数估值回归系数置信区间β0(1)107.5601[75.3160139.8042]β1(1)-37.9283[-57.2842-18.5723]β2(1)-3.0314[-3.7862-2.2767]R2=0.9334F=84.0758p0.0001s2=9.2746豪华型回归系数回归系数估值回归系数置信区间β0(2)29.7583[16.286443.2303]β1(2)-6.7738[-14.97741.4299]β2(2)-1.6367[-1.9680-1.3054]R2=0.9450F=103.1152p0.0001s2=1.5413可得模型如下:普通型:y=107.5601-37.9283x1-3.0314x2豪华型:y=29.7583-6.7738x1-1.6367x28.3建立统一模型建立统一模型y=β0+β1x1+β2x2+β3x3,用x3=0表示普通型,x3=1表示豪华型,此时为三元线性回归,可用matlab编写程序如下:y=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];x3=[zeros(1,18),ones(1,18)];n=36;m=3;X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,s]=regress(y',X);b,bint,srcoplot(r,rint)输出如下结果:b=64.5753-16.1436-2.3322-14.4222bint=33.500795.6499-35.11932.8320-3.0705-1.5939-17.6546-11.1898s=0.836654.61110.000022.6642回归系数回归系数估值回归系数置信区间β064.5753[33.500795.6499]β1-16.1436[-35.11932.8320]β2-2.3322[-3.0705-1.5939]β3-14.4222[-17.6546-11.1898]R2=0.8366F=54.6111p0.0001s2=22.6642可得模型为:y=64.5753−16.1436−2.3322x2−14.4222x3,x3=0表示普通型,x3=1表示豪华型。即:普通型:y=64.5753−16.1436−2.3322x2豪华型:y=50.1531−16.1436−2.3322x2可以看出:统一模型相当于将分立模型进行了统一:(1)统一模型的β值趋近于给分立模型的“平均”;(2)统一模型的残差较大;(3)统一模型的决定系数较小;(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。8.4就每种类型汽车分别作x1和x2与残差的散点图y=[22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6];x1=[1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68];x2=[6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3];x3=[zeros(1,18),ones(1,18)];n=36;m=3;X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,s]=regress(y',X);x11=x1(:,1:18);x22=x2(:,1:18);r1=r(1:18,:);r2=r(19:36,:);subplot(2,2,1)plot(x11,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx1µÄÉ¢µãͼ')subplot(2,2,2)plot(x22,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µãͼ')subplot(2,2,3)plot(x11,r2,'r+')title('ºÀ»ªÐÍÆû³µ
本文标题:实验13--回归分析
链接地址:https://www.777doc.com/doc-5846210 .html