您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学一元线性回归课后习题答案
一元线性回归课后习题讲解--------第九组11.1从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用14013024215035015545514056515067815478416581001709116167101251801113017512140185产量与生产费用020406080100120140160180200020406080100120140160产量费用系列1产量和费用存在正的线性相关系数(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。r=0.92022222yynxxnyxxynr222222212(40*13042*150...140*185)(4042...140)*(130150...185)12*(4042...140)20162212*(130150...185)(130150...185)r2)计算产量与生产费用之间的线性相关系数。1、提出假设:H0:;H1:02、计算检验的统计量)2(~122ntrnrt根据显著性水平=0.05,查t分布表得t(n-2)=2.2281由于t=7.435453t(12-2)=2.2281,拒绝H0,产量与生产费用之间存在着显著的正线性相关关系21220.92027.43545310.9202t(3)对相关系数的显著性进行检验(=0.05),并说明二者之间的关系强度。t(12-2)=2.228111.2学生在期末考试之前用于复习的时间(单位:小时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,取得的数据如下:复习时间X2016342327321822考试分数Y646184708892727701020304050607080901000510152025303540复习时间分数系列1复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。r=0.86212222yynxxnyxxynr(2)计算相关系数,说明两个变量之间的关系强度。222222228(20*6416*61...22*77)(2016...22)*(6461...77)8*(2016...22)2016...228*(6461...77)(6461...77)r11.3、根据一组数据建立的线性回归方程要求:1)解释截距的意义。1)解释斜率的意义。2)当=6时的E(y)1)表示在没有自变量X的影响时其他各种因素对因变量Y的影响为102)斜率的意义在于:自变量X变化对Y影响程度。回归方程中,当x增加一个单位时,y将减少0.5个单位。3)x=6时,代入方程,则,y=10-0.56=7ˆˆ100.5yx1ˆ0ˆ11.4设SSR=36,SSE=4,n=18要求:1)计算判定系数R^2并解释其意义回归直线对观测值的拟合程度为0.9,说明变量Y的变异性中有90%是由自变量x引起的。2)计算估计标准误差并解释其意义es21ˆ40.5218216niiieyySSEsn2360.940SSRSSRRSSTSSTSSE表示实际值与估计值之间的差异程度是0.511.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车的运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下表:运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。根据图表显示,二者可能存在正线性相关关系0.01.02.03.04.05.06.002004006008001000120014001600运送距离(公里)运送时间(天)(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态x与y的简单相关系数是0.9489,两变量之间呈现高度正相关关系运送距离x运送时间y运送距离x1运送时间y0.948941(2)计算线性相关系数,说明两个变量之间的关系强度最小二乘估计:y=0+1x将表中数据代入公式得:{=0.118129=0.003585∴y=0.118129+0.003585x(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。^^^y关于x的回归方程为y=0.118129+0.003585x表示运输距离每增加1公里,运送时间平均增加0.003585天。•11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京辽宁上海江西河南贵州陕西224601122634547485154442662454973264490115462396220816082035要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。02000400060008000100001200014000010000200003000040000人均GDP人均消费水平系列1产量和生产费用之间存在着正的线性相关关系(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。2222yynxxnyxxynr227*65100742127101240510.9981237*1904918867857397*134690076631609说明两个变量之间高度相关(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。0ˆ4515.5714290.308683*12248.428127*6510074212710124051ˆ=0.3086837*190491886785739=734.6928y=734.6928+0.308683x回归系数的含义:人均GDP每增加1元,人均消费增加0.309元。(4)计算判定系数,并解释其意义。人均GDP对人均消费的影响达到99.6%。81444968.68==0.996381750763.71(5)检验回归方程线性关系的显著性(a=0.05)。181444968.6811331.6921(2)305795.03(72)SSRFSSEn提出假设H0:1=0人均消费水平与人均GDP之间的线性关系不显著计算检验统计量F确定显著性水平=0.05,并根据分子自由度1和分母自由度7-2找出临界值F=6.61作出决策:若FF,拒绝H0,线性关系显著y=734.6928+0.308683xy=734.6928+0.308683*5000=2278.1078(6)如果某地区的人均GDP为5000元,预测其人均消费水平。某地区的人均GDP为5000元,预测其人均消费水平为2278.1078元。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:已知n=7,t(7-2)=2.5706置信区间为21ˆ305795.034361159.007225niiieyySSEsnnniiexxxxnsnty1220201)2(ˆ250004515.571412278.10782.5706*61159.007713625127.29人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399]1990.74915E(y)2565.46399解:根据前面的计算结果,已知n=7,t(7-2)=2.5706预测区间为21ˆ305795.034361159.007225niiieyySSEsnn250004515.571412278.10782.5706*61159.0071+713625127.29人均GDP为5000元时,人均消费水平95%的预测区间为[1580.46315,2975.74999]。01580.46315()2975.74999Ey航空公司编号航班正点率顾客投诉次数181.121276.658376.685475.768573.874672.293771.272870.8122991.4181068.512511.7随机抽取10家航空公司,对其近一年的航班正点率和顾客投诉次数进行调查,所得数据如下020406080100120140020406080100航班正点率顾客投诉次数系列1二者之间为负的线性相关关系1)绘制散点图,说明二者之间的股息形态Coefficients标准误差tStatP-valueIntercept429.898635274.973373315.7340180.000437航班正点率-4.70112990.985891202-4.768410.001411回归系数=-4.7表示航班正点率每增加1%顾客投诉次数平均下降4.7次。1ˆˆ=429.897-4.7*yx2)用航班正点率作自变量,建立估计的回归方程,并解释回归系数的意义21ˆ3035.96519.449228niiieyySSEsnn1ˆ2221119.4490.985891157830.39*757.910enniiiissxxn11ˆˆ4.74.76840.98589tst=4.7684t=2.201,拒绝H0,回归系数显著11ˆˆ~(8)tts提出假设H0:b1=0H1:b10计算检验的统计量3)检验回归系数的显著性(a=0.05)=2.201解:已知n=10,t(10-2)=2.306置信区间为21ˆ3035.96519.449228niiieyySSEsnn20802211ˆ(8)10eniixxytsxx037.66()70.619Ey计算得4)如果航班正点率为80%,估计顾客投诉次数80ˆ=429.897-4.7*80=54.2y5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间已知n=10,t(10-2)=2.306预测区间为21ˆ3035.96519.449228niiieyySSEsnn20802211ˆ(8)110eniixxytsxx07.572()100.707Ey计算得11.8下面是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。地区编号出租率(%)每平方米月租金(元)170.699269.874373.483467.170570.184668.765763.467873.5105971.4951080.71071171.2861262861378.71061469.5701568.7811669.5751767.7821868.4941972922067.976回归统计MultipleR0.79508RSquare0.632151AdjustedRSquare0.611715标准误差8.568399观测值20方差析dfSSMSFSignificanceF回归分析12271.0362271.03630.933182.8E-05残差181321.51473.41
本文标题:统计学一元线性回归课后习题答案
链接地址:https://www.777doc.com/doc-5069348 .html