您好,欢迎访问三七文档
浙江大学城市学院实验报告纸1学生姓名:董媛学号:31405667一、实验项目名称:实验报告(三)二、实验目的和要求(一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验;(二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测;(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归;三、实验内容1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)14013078416524215081001703501559116167455140101251805651501113017567815412140185(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。浙江大学城市学院实验报告纸2(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。相关性产量(台)生产费用(万元)产量(台)Pearson相关性1.920**显著性(双侧).000N1212生产费用(万元)Pearson相关性.920**1显著性(双侧).000N1212在.01水平(双侧)上显著相关。2.下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京224607326辽宁112264490上海3454711546江西48512396河南54442208贵州26621608陕西45492035(1)绘制散点图,并计算相关系数,说明二者之间的关系。相关性浙江大学城市学院实验报告纸3人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998**显著性(双侧).000N77人均消费水平(元)Pearson相关性.998**1显著性(双侧).000N77在.01水平(双侧)上显著相关。(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。设人均GDP作自变量X,人均消费水平作因变量Y,建立一元线性回归模型。Y=X10模型汇总模型RR方调整R方标准估计的误差10.998a0.9960.996247.303a.预测变量:(常量),人均GDP(元)。Anovab模型平方和df均方FSig.1回归81444968.680181444968.6801331.692.000a残差305795.034561159.007总计81750763.7146a.预测变量:(常量),人均GDP(元)。b.因变量:人均消费水平(元)系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)734.693139.5405.265.003浙江大学城市学院实验报告纸4人均GDP(元)0.3090.0080.99836.492.000a.因变量:人均消费水平(元)所以Y=734.693+0.309X,回归系数代表自变量对因变量的影响大小。(3)计算判定系数和估计标准误差,并解释其意义。回归系数是0.996,估计标准误差是247.303,回归系数代表了观测点靠近回归曲线的程度,而估计标准误差显示了误差的大小程度。(4)检验回归方程线性关系的显著性()统计量F的值是1331.692,显著性概率是0.000,因此,线性关系显著(5)如果某地区的人均GDP为5000元,预测其人均消费水平。Y=5000*0.309+734.693=2279.693(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。3.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:航空公司编号航班正点率(%)投诉次数(次)181.821276.658376.685475.768573.874672.293771.272870.8122991.4181068.5125(1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。模型汇总模型RR方调整R方标准估计的误差10.869a0.7550.72418.887a.预测变量:(常量),航班正点率(%)。Anovab模型平方和df均方FSig.浙江大学城市学院实验报告纸51回归8772.58418772.58424.592.001a残差2853.8168356.727总计11626.4009a.预测变量:(常量),航班正点率(%)。b.因变量:投诉次数(次)系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)430.18972.1555.962.000航班正点率(%)-4.7010.948-.869-4.959.001a.因变量:投诉次数(次)用航班正点率作自变量X,顾客投诉次数作因变量YY=430.189-4.701X(2)检验回归系数的显著性()。回归系数的显著性检验t值为-4.959.概率为0.001,说明航班正点率对顾客投诉次数影响显著。(3)如果航班正点率为80%,估计顾客的投诉次数。Y=430.189-4.701*80%=426.42824.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归2.17E-09残差40158.07——总计111642866.67———参数估计表Coefficients标准误差tStatP-valueIntercept363.689162.455295.8231910.000168XVariable11.4202110.07109119.977492.17E-09(1)完成上面的方差分析表。变差来源dfSSMSFSignificanceF回归11602708.61602708.63992.17E-09残差1040158.074015.807——总计111642866.67———浙江大学城市学院实验报告纸6(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?有95.76%是由于广告费用的变动引起的(3)销售量与广告费用之间的相关系数是多少?回归系数等于1.420211(4)写出估计的回归方程并解释回归系数的实际意义。Y=363.6891+1.420211X(5)检验线性关系的显著性(a=0.05)。显著5.随机抽取7家超市,得到其广告费支出和销售额数据如下超市广告费支出/万元销售额/万元A119B232C444D640E1052F1453G2054(1)用广告费支出作自变量,销售额为因变量,求出估计的回归方程。模型汇总模型RR方调整R方标准估计的误差10.831a0.6900.6287.878a.预测变量:(常量),广告费支出/万元。Anovab模型平方和df均方FSig.1回归691.7231691.72311.147.021a残差310.277562.055总计1002.0006a.预测变量:(常量),广告费支出/万元。b.因变量:销售额/万元浙江大学城市学院实验报告纸7系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)29.3994.8076.116.002广告费支出/万元1.547.463.8313.339.021a.因变量:销售额/万元用广告费支出作自变量,销售额为因变量,求出估计的回方程。Y=29.399+1.547X(2)检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。F检验的P值为0.021,小于0.025,则可说明关系显著(3)绘制关于的残差图,你觉得关于误差项的假定被满足了吗?满足(4)你是选用这个模型,还是另寻找一个该更好的模型?选用这个模型6.一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据月销售收入y(万元)电视广告费用(万元)报纸广告费用(万元)965.01.5902.02.0954.01.5922.52.5953.03.3浙江大学城市学院实验报告纸8943.52.3942.54.2943.02.5(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。模型汇总模型RR方调整R方标准估计的误差10.808a0.6530.5951.21518a.预测变量:(常量),VAR00002。Anovab模型平方和df均方FSig.1回归16.640116.64011.269.015a残差8.86061.477总计25.5007a.预测变量:(常量),VAR00002。b.因变量:VAR00001系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)88.6381.58256.016.000VAR000021.6040.4780.8083.357.015a.因变量:VAR00001Y=88.638+1.604X1(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。模型汇总模型RR方调整R方标准估计的误差10.959a0.9190.887.64259a.预测变量:(常量),VAR00003,VAR00002。Anovab浙江大学城市学院实验报告纸9模型平方和df均方FSig.1回归23.435211.71828.378.002a残差2.0655.413总计25.5007a.预测变量:(常量),VAR00003,VAR00002。b.因变量:VAR00001系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)83.2301.57452.882.000VAR000022.290.3041.1537.532.001VAR000031.301.321.6214.057.010a.因变量:VAR00001Y=82.23+2.29X1+1.301X2(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。不相同(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。R方代表了回归平方占据总平方和的比例,R方越大代表回归曲线越准确。7.某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下收获量y(kg)降雨量x1(mm)温度x2()2250256345033845004510675010513720011014750011516825012017建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=0.05),你认为模型中是否存在多重共线性?模型汇总模型RR方调整R方标准估计的误差1.996a.991.987261.43103浙江大学城市学院实验报告纸10模型汇总模型RR方调整R方标准估计的误差1.996a.991.987261.43103a.预测变量:(常量),VAR00003,VAR00002。Anovab模型平方和df均方FSig.1回归31226615.257215613307.629228.444.000a残差273384.743468346.186总计31500000.0006a.预测变量:(常量),VAR00003,VAR00002。b.因变量:VAR00001系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-.591505.004-.001.999VAR0000222.3869.601.4152.332.080VAR00003327.67298.798.5903.317.029a.因变量:VAR00001Y=-0.591+22.386X1+327.672有显著线性关系,其中降雨量对收获量影响不显著,但是温度却显著。8.一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合
本文标题:实验报告(三)-2
链接地址:https://www.777doc.com/doc-5289324 .html