您好,欢迎访问三七文档
-1-§1回归分析-2-1.1回归分析1.2相关系数目标导航1.了解回归分析的概念和最小二乘法的作用.2.理解相关系数的含义及求法.3.了解回归分析的基本思想,会建立回归模型,并能利用回归分析进行有效的预测.知识梳理一二一、回归分析1.变量间的关系往往会表现出某种不确定性,回归分析就是研究这种变量之间的关系的一种方法,通过对变量之间关系的研究,从而发现蕴涵在事物或现象中的某些规律.2.假设样本点为(x1,y1),(x2,y2),…,(xn,yn),我们可用最小二乘法求变量之间的线性回归方程y=a+bx,即求a,b,使这n个点与直线y=a+bx的“距离”平方之和最小,即使得Q(a,b)=(y1-a-bx1)2+(𝑦2-𝑎-𝑏𝑥2)2+⋯+(𝑦𝑛−𝑎−𝑏𝑥𝑛)2达到最小.知识梳理一二3.Q(a,b)=lyy+n[𝑦−(𝑎+𝑏𝑥)]2+𝑙𝑥𝑥𝑏-𝑙𝑥𝑦𝑙𝑥𝑥2−𝑙𝑥𝑦2𝑙𝑥𝑥.其中𝑥=𝑥1+𝑥2+…+𝑥𝑛𝑛=1𝑛∑𝑖=1𝑛𝑥𝑖,y=y1+y2+…+ynn=1n∑i=1n𝑦𝑖,lxx=∑𝑖=1𝑛(𝑥𝑖−𝑥)2=∑𝑖=1𝑛𝑥𝑖2−𝑛𝑥2,lxy=∑𝑖=1𝑛(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)=∑𝑖=1𝑛𝑥𝑖𝑦𝑖−𝑛𝑥𝑦,lyy=∑𝑖=1𝑛(𝑦𝑖−𝑦)2=∑𝑖=1𝑛𝑦𝑖2−𝑛𝑦2.当Q(a,b)取最小值时,b=𝑙𝑥𝑦𝑙𝑥𝑥=∑𝑖=1𝑛(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)∑𝑖=1𝑛(𝑥𝑖-𝑥)2=∑𝑖=1𝑛𝑥𝑖𝑦𝑖-𝑛𝑥𝑦∑𝑖=1𝑛𝑥𝑖2-𝑛𝑥2,𝑎=𝑦−𝑏𝑥.y对x的线性回归方程为y=a+bx,此直线一定过点(𝑥,𝑦).知识梳理一二名师点拨b=∑𝑖=1𝑛xiyi-𝑛xy∑i=1n𝑥𝑖2-𝑛𝑥2,其统计学意义是:x每增加(或减少)一个单位,y平均改变b个单位.知识梳理一二【做一做1】设有一个线性回归方程为y=3-5x,则当变量x每增加1个单位时()A.y平均增加3个单位B.y平均减少5个单位C.y平均增加5个单位D.y平均减少3个单位解析:因为线性回归直线的斜率是-5,所以说x每增加1个单位时,y平均减少5个单位.答案:B知识梳理一二二、相关关系与相关系数1.判断两个变量之间的线性相关关系的方法有(1)画散点图;(2)计算线性相关系数r.2.相关系数的计算公式r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2∑i=1nyi2-ny2性质(1)范围:|r|≤1;(2)|r|越接近1,x,y之间的线性相关程度越高;(3)|r|越接近0,x,y之间的线性相关程度越低知识梳理一二3.正相关、负相关与线性不相关(1)正相关:当r0时,lxy0,从而b=𝑙𝑥𝑦𝑙𝑥𝑥0,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关.(2)负相关:当r0时,b0,一个变量增加,另一个变量有减少的趋势,称两个变量负相关.(3)线性不相关:当r=0时,称两个变量线性不相关.知识梳理一二【做一做2】判断:(正确的打“√”,错误的打“×”)(1)若两个变量的相关系数r0,则两个变量正相关.()(2)两个变量的相关系数越大,它们的相关程度越高.()(3)若两个变量负相关,则其回归直线的斜率为负.()√×√知识梳理一二【做一做3】根据如下样本数据:得到的回归方程为y=a+bx,则()A.a0,b0B.a0,b0C.a0,b0D.a0,b0解析:由样本数据可知y值总体上是随x值的增大而减少的.故b0,由样本数据作出散点图,如图,当x=0时,y=a0,故a0.故选B.答案:Bx345678y4.02.5-0.50.5-2.0-3.0典例透析题型一题型二题型三题型四求线性回归方程【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下表所示:零件数x/个102030405060708090100加工时间y/min626875818995102108115122(1)求y对x的线性回归方程;(2)据此估计加工200个零件所用的时间是多少.典例透析题型一题型二题型三题型四解:(1)由题意得下表,并用科学计算器进行计算.i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200x=55,y=91.7,∑i=110xi2=38500,∑i=110𝑥𝑖𝑦𝑖=55950b=∑𝑖=110xiyi-10xy∑i=110𝑥𝑖2-10𝑥2=55950-10×55×91.738500-10×552≈0.668,a=𝑦−𝑏𝑥≈91.7-0.668×55=54.96,设所求的线性回归方程为y=a+bx.同时,利用上表可得故所求的线性回归方程为y=54.96+0.668x.典例透析题型一题型二题型三题型四点评求线性回归方程的步骤:第一步:列表表示xi,yi,xiyi.第二步:计算𝑥,𝑦,∑𝑖=1𝑛xi2,∑i=1n𝑥𝑖𝑦𝑖.第三步:代入求值,计算a,b.b=∑𝑖=1𝑛𝑥𝑖𝑦𝑖-𝑛𝑥𝑦∑𝑖=1𝑛𝑥𝑖2-𝑛𝑥2,𝑎=𝑦−𝑏𝑥.第四步:写出线性回归方程,即y=a+bx.(2)当x=200时,所用时间的估计值为54.96+0.668×200=188.56≈189(min).故加工200个零件所用的时间约为189min.典例透析题型一题型二题型三题型四【变式训练1】某商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x/℃171382月销售量y/件24334055由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温约为6℃,据此估计该商场下个月毛衣销售量约为()件.A.46B.40C.38D.58典例透析题型一题型二题型三题型四解析:由题设中数表提供的数据可得:𝑥=14×(17+13+8+2)=10,𝑦=14×(24+33+40+55)=38.将b=-2,𝑥=10,𝑦=38代入y=bx+a,得a=58,即y对x的线性回归方程为y=-2x+58.将x=6代入y=-2x+58,得y=46.故选A.答案:A典例透析题型一题型二题型三题型四使用年限x/年2345678维修费用y/万元2.23.55.26.77.88.19.8请用相关系数判断维修费用y与使用年限x之间是否具有线性相关关系?如果具有,请求出y对x的线性回归方程.分析:本题为探索两个变量之间是否具有线性相关关系的题型,通过计算线性相关系数来加以判断,由于数据比较多,可列表分项计算.计算线性相关系数【例2】某工厂有一大型机器设备,其使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下的统计资料:典例透析题型一题型二题型三题型四解:列表:ixiyixi2yi2xiyi122.244.844.4233.5912.2510.5345.21627.0420.8456.72544.8933.5567.83660.8446.8678.14965.6156.7789.86496.0478.4∑3543.3203311.51251.1典例透析题型一题型二题型三题型四由此可得:𝑥=5,𝑦≈6.1857,∑𝑖=17𝑥𝑖𝑦𝑖=251.1,∑i=17𝑥𝑖2=203,∑𝑖=17𝑦𝑖2=311.51.于是线性相关系数r=∑𝑖=17𝑥𝑖𝑦𝑖-7𝑥𝑦∑𝑖=17𝑥𝑖2-7𝑥2∑𝑖=17𝑦𝑖2-7𝑦2≈251.1-7×5×6.1857203-7×52×311.51-7×6.18572≈0.9895.从而可知维修费用与使用年限之间存在线性相关关系.因为b=∑𝑖=17𝑥𝑖𝑦𝑖-7𝑥𝑦∑𝑖=17𝑥𝑖2-7𝑥2≈251.1-7×5×6.1857203-7×52≈1.2357,a=𝑦−𝑏𝑥≈6.1857-1.2357×5=0.0072,所以线性回归方程为y=0.0072+1.2357x.典例透析题型一题型二题型三题型四反思对于两个变量的数据比较多的时候判断它们之间是否线性相关,可通过计算线性相关系数来判断.典例透析题型一题型二题型三题型四【变式训练2】关于两个变量x和y的一组数据如下表所示:x21232527293235y711212466115325试用相关系数判断x与y之间是否有线性相关关系?ixiyixi2yi2xiyi12174414914722311529121253325216254415254272472957664852966841435619146321151024132253680735325122510562511375∑192569541412439318542解:列表:典例透析题型一题型二题型三题型四由此可得𝑥≈27.4,𝑦≈81.3,∑𝑖=17xi2=5414,∑i=17𝑦𝑖2=124393,∑𝑖=17𝑥𝑖𝑦𝑖=18542.所以r=∑𝑖=17𝑥𝑖𝑦𝑖-7𝑥𝑦∑𝑖=17𝑥𝑖2-7𝑥2∑𝑖=17𝑦𝑖2-7𝑦2≈18542-7×27.4×81.35414-7×27.42×124393-7×81.32≈0.8375.由于r≈0.8375与1比较接近,故x与y具有线性相关关系.典例透析题型一题型二题型三题型四利用回归分析进行有效预测【例3】为了了解某地区母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:母亲身高x/cm159160160163159154159158159157女儿身高y/cm158159160161161155162157162156(1)试对x与y进行线性回归分析,并预测当母亲身高为161cm时,女儿的身高为多少?(2)求相关系数r,并分析模型的拟合效果.分析:通过观察两个变量对应的数据,可判断x与y之间存在线性相关关系,通过列表计算,求出回归方程,并通过计算线性相关系数来判断两个变量间的线性相关程度.典例透析题型一题型二题型三题型四解:列表:ixiyixi2yi2xiyi11591582528124964251222160159256002528125440316016025600256002560041631612656925921262435159161252812592125599615415523716240252387071591622528126244257588158157249642464924806915916225281262442575810157156246492433624492∑15881591252222253185252688典例透析题型一题型二题型三题型四(1)由此可得:𝑥=158.8,𝑦=159.1,∑𝑖=110xi2=252222,∑i=110𝑦𝑖2=253185,∑𝑖=110𝑥𝑖𝑦𝑖=252688.进而可以求得b=∑𝑖=110𝑥𝑖𝑦𝑖-10𝑥𝑦∑𝑖=110𝑥𝑖2-10𝑥2=252688-10×158.8×159.1252222-10×158.82≈0.78,a=𝑦−𝑏𝑥≈159.1-0.78×158.8=35.236,于是,y对x的线性回归方程为y=35.236+0.78x.当x=161时,y≈161,即女儿的身高约为161cm.典例透析题型一题型二题型三题型四(2)r=∑𝑖=110𝑥𝑖𝑦𝑖-10𝑥𝑦∑𝑖=110𝑥𝑖2-10
本文标题:2019-2020学年高中数学 第一章 统计案例 1 回归分析 1.1 回归分析 1.2 相关系数课
链接地址:https://www.777doc.com/doc-8116646 .html