您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 回归分析应用实例讲解
影响成品钢材量的多元回归分析故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。钢材的需求量设为y,作为被解释变量,而原油产量1x、生铁产量2x、原煤产量3x、发电量4x作为解释变量,通过建立这些经济变量的线性模型来研究影响成品钢材需求量的原因。能源转换技术等因素。在此,收集的数据选择与其相关的四个因素:原油产量、生铁产量、原煤产量、发电量,1980—1997的有关数据如下表。理论上成品钢材的需求量的影响因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、原始数据(中国统计年鉴)年份y1x2x3x4x19802716.2010595.003802.406.203006.2019812670.1010122.003416.606.203092.7019822902.0010212.003551.006.663277.0019833072.0010607.003738.007.153514.0019843372.0011461.304001.007.893770.0019853693.0012489.504384.008.724107.0019864058.0013068.805064.008.944495.0019874356.0013414.005503.009.284973.0019884689.0013704.605704.009.805452.0019894859.0013764.105820.0010.545848.0019905153.0013830.606238.0010.806212.0019915638.0014009.206765.0010.876775.0019926697.0014209.707589.0011.167539.0019937716.0014523.008739.0011.518395.0019948482.0014608.209741.0012.409281.0019958979.8015004.9410529.2713.6110070.3019969338.0215733.3910722.5013.9710813.1019979978.9316074.1411511.4113.7311355.53将中国成品一、模型的设定设因变量y与自变量1x、2x、3x、4x的一般线性回归模型为:y=0+11223344xxxx是随机变量,通常满足()0;Var()=2二参数估计系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.073a.因变量:成品钢材(万吨)再用spss做回归线性,根据系数表得出回归方程为:1234170.2870.0410.55417.8180.389yxxxx再做回归预测,得出如下截图:故当原油产量为16225.86万吨,生铁产量为12044.54万吨,原煤产量为13.87万吨以及发电量为12334.89亿千瓦时时,成品钢材量预测值为10727.33875万吨;当原油产量为17453万吨,生铁产量为12445.96万吨,原煤产量为14.54万吨以及发电量为13457亿千瓦时时,成品钢材量预测值为10727.33875万吨。三回归方程检验描述性统计量均值标准偏差N成品钢材(万吨)5465.00282460.3492618原油(万吨)13190.63721875.7887318生铁(万吨)6489.95442700.7967618原煤(万吨)9.96832.5401818发电量(亿千瓦时)6220.87942768.1119118相关性成品钢材(万吨)原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)Pearson相关性成品钢材(万吨)1.000.909.998.961.997原油(万吨).9091.000.912.973.920生铁(万吨).998.9121.000.962.997原煤(万吨).961.973.9621.000.971发电量(亿千瓦时).997.920.997.9711.000Sig.(单侧)成品钢材(万吨)..000.000.000.000原油(万吨).000..000.000.000生铁(万吨).000.000..000.000原煤(万吨).000.000.000..000发电量(亿千瓦时).000.000.000.000.N成品钢材(万吨)1818181818原油(万吨)1818181818生铁(万吨)1818181818原煤(万吨)1818181818发电量(亿千瓦时)1818181818由相关系数表看出,因变量与各个自变量的相关系数都很高,都在0.9以上,说明变量间的线性相关程度很高,适合做多元线性回归模型。模型汇总b模型RR方调整R方标准估计的误差1.999a.997.997140.71641a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。b.因变量:成品钢材(万吨)由2R=0.997以及调整之后的2R=0.997知,模型对样本观测数据的拟合度很好。Anovab模型平方和df均方FSig.1回归1.026E842.566E71296.001.000a残差257414.4041319801.108总计1.029E817a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。b.因变量:成品钢材(万吨)由F=1296.001P值=0.000=0.05,故拒绝原假设,认为自变量联合起来对因变量有显著影响,通过F检验。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.073a.因变量:成品钢材(万吨)因为3t=-0.154P值=0.880远远大于=0.05,故接受原假设,认为3x对因变量y没有显著影响,故应剔除3x。用后退法剔除变量后,再做回归线性,得如下表:系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655生铁(万吨).554.170.6083.267.006原煤(万吨)-17.818115.468-.018-.154.880发电量(亿千瓦时).389.199.4381.952.0732(常量)197.734445.099.444.664原油(万吨)-.053.045-.041-1.172.261生铁(万吨).564.150.6203.760.002发电量(亿千瓦时).371.153.4172.417.0303(常量)-309.403105.079-2.944.010生铁(万吨).591.150.6493.937.001发电量(亿千瓦时).311.147.3502.125.051a.因变量:成品钢材(万吨)Anovad模型平方和df均方FSig.1回归1.026E842.566E71296.001.000a残差257414.4041319801.108总计1.029E8172回归1.026E833.422E71857.513.000b残差257885.8841418420.420总计1.029E8173回归1.026E825.131E72718.023.000c残差283174.3241518878.288总计1.029E817a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。b.预测变量:(常量),发电量(亿千瓦时),原油(万吨),生铁(万吨)。c.预测变量:(常量),发电量(亿千瓦时),生铁(万吨)。d.因变量:成品钢材(万吨)最后剔除1x、3x两个自变量,得出新的回归方程为:24309.4030.5910.311yxxF=2718.023P值=0.000故拒绝原假设,通过F检验。四基本假定检验1、异方差检验等级相关系数检验做abs(e)与x的等级相关系数,得出表如下由表中P值全大于0.01,故接受原假设,模型中不存在异方差。2、自相关检验模型汇总b模型RR方调整R方标准估计的误差Durbin-Watson1.999a.997.997140.71641.922相关系数原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)abseSpearman的rho原油(万吨)相关系数1.000.998**.994**.994**.263Sig.(双侧)..000.000.000.291N1818181818生铁(万吨)相关系数.998**1.000.989**.988**.294Sig.(双侧).000..000.000.236N1818181818原煤(万吨)相关系数.994**.989**1.000.997**.227Sig.(双侧).000.000..000.365N1818181818发电量(亿千瓦时)相关系数.994**.988**.997**1.000.212Sig.(双侧).000.000.000..399N1818181818abse相关系数.263.294.227.2121.000Sig.(双侧).291.236.365.399.N1818181818**.在置信度(双测)为0.01时,相关性是显著的。a.预测变量:(常量),发电量(亿千瓦时),原油(万吨),原煤(万吨),生铁(万吨)。b.因变量:成品钢材(万吨)DW=0.992n=18k=5,查表得出0.82,1.87ludd,故DW落入无法确定的领域。自相关性不明显,由此也看出DW检验的局限性。3、多重共线性系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)170.287494.572.344.736原油(万吨)-.041.090-.031-.457.655.04124.672生铁(万吨).554.170.6083.267.006.006180.105原煤(万吨)-17.818115.468-.018-.154.880.01473.861发电量(亿千瓦时).389.199.4381.952.073.004261.480a.因变量:成品钢材(万吨)因为VIF中有两个远远的大于10,故模型存在严重的多重共线性。由共线性诊断表中数据得出,2x、3x、4x之间存在多重共线性。故先剔除变量4x,再做线性回归,得出表如下:共线性诊断a模型维数特征值条件索引方差比例(常量)原油(万吨)生铁(万吨)原煤(万吨)发电量(亿千瓦时)114.8781.000.00.00.00.00.002.1186.435.02.00.00.00.003.00437.106.36.03.03.09.004.00188.718.57.46.28.21.165.000137.100.05.51.68.70.84a.因变量:成品钢材(万吨)系数a模型非标准化系数标准系数tSig.共线性统计量B标准误差试用版容差VIF1(常量)59.520538.378.111.914原油(万吨)-.108.092-.082-1.178.258.04
本文标题:回归分析应用实例讲解
链接地址:https://www.777doc.com/doc-2339419 .html