您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第11章相关分析与回归分析
11.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:(1)x运送距离(km)12501000750500250y运送时间(天)54321__可能存在线性关系。(2)相关性x运送距离(km)y运送时间(天)x运送距离(km)Pearson相关性1.949(**)显著性(双侧)0.000N1010y运送时间(天)Pearson相关性.949(**)1显著性(双侧)0.000N1010**.在.01水平(双侧)上显著相关。有很强的线性关系。(3)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)0.0040.0000.9498.5090.000a.因变量:y运送时间(天)回归系数的含义:每公里增加0.004天。11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京辽宁上海江西河南贵州陕西224601122634547485154442662454973264490115462396220816082035要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a=0.05)。(6)如果某地区的人均GDP为5000元,预测其人均消费水平。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:(1)人均GDP(元)400003000020000100000人均消费水平(元)120001000080006000400020000__可能存在线性关系。(2)相关系数:相关性人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998(**)显著性(双侧)0.000N77人均消费水平(元)Pearson相关性.998(**)1显著性(双侧)0.000N77**.在.01水平(双侧)上显著相关。有很强的线性关系。(3)回归方程:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。(4)模型摘要模型RR方调整的R方估计的标准差1.998(a)0.9960.996247.303a.预测变量:(常量),人均GDP(元)。人均GDP对人均消费的影响达到99.6%。(5)F检验:ANOVA(b)模型平方和df均方F显著性1回归81,444,968.680181,444,968.6801,331.692.000(a)残差305,795.034561,159.007合计81,750,763.7146a.预测变量:(常量),人均GDP(元)。b.因变量:人均消费水平(元)回归系数的检验:t检验系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)(6)某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。11.9某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归11602708.61602708.6399.10000652.17E—09残差1040158.074015.807——总计111642866.67———参数估计表Coefficients标准误差tStatP—valueIntercept363.689162.455295.8231910.000168XVariable11.4202110.07109119.977492.17E—09要求:(1)完成上面的方差分析表。(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。(5)检验线性关系的显著性(a=0.05)。解:(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。(3)r=0.9877。(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。(5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。回归直线的检验:p=2.17E—09<α,回归直线显著。11.11从20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:01:0H。(1)线性关系检验的统计量F值是多少?(2)给定显著性水平a=0.05,Fa是多少?(3)是拒绝原假设还是不拒绝原假设?(4)假定x与y之间是负相关,计算相关系数r。(5)检验x与y之间的线性关系是否显著?解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;因此:F=1SSRkSSEnk=6014018=27(2)1,18F=0.051,18F=4.41(3)拒绝原假设,线性关系显著。(4)r=SSRSSRSSE=0.6=0.7746,由于是负相关,因此r=-0.7746(5)从F检验看线性关系显著。11.15随机抽取7家超市,得到其广告费支出和销售额数据如下:超市广告费支出(万元)销售额(万元)ABCDEFGl24610142019324440525354要求:(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。(3)绘制关于x的残差图,你觉得关于误差项的假定被满足了吗?(4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)(2)回归直线的F检验:ANOVA(b)模型平方和df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006a.预测变量:(常量),广告费支出(万元)。b.因变量:销售额(万元)显著。回归系数的t检验:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a.因变量:销售额(万元)显著。(3)未标准化残差图:广告费支出(万元)20151050UnstandardizedResidual10.000005.000000.00000-5.00000-10.00000-15.00000__标准化残差图:广告费支出(万元)20151050StandardizedResidual1.000000.00000-1.00000-2.00000学生氏标准化残差图:广告费支出(万元)20151050StudentizedResidual2.000001.000000.00000-1.00000-2.00000看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)。
本文标题:第11章相关分析与回归分析
链接地址:https://www.777doc.com/doc-2242331 .html