您好,欢迎访问三七文档
第一章统计案例§1回归分析1.1回归分析1.2相关系数1.3可线性化的回归分析学习目标核心素养1.了解回归分析的思想和方法.(重点)2.掌握相关系数的计算和判断线性相关的方法.(重点)3.了解常见的非线性回归模型转化为线性回归模型的方法.(难点)1.借助收集的数据求相关系数和判断是否线性相关问题,培养学生数据分析和数学运算的核心素养.2.通过将非线性回归模型转化为线性回归模型,提升学生数学建模和数据分析的核心素养.自主预习探新知1.回归分析设变量y对x的线性回归方程为y=a+bx,由最小二乘法知系数的计算公式为:b=lxylxx=________________=_______________,a=________.i=1nxi-xyi-yi=1nxi-x2i=1nxiyi-nxyi=1nx2i-nx2y-bx2.相关系数(1)相关系数r的计算假设两个随机变量的数据分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r=lxylxxlyy=__________________________=_____________________________.i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny2(2)相关系数r与线性相关程度的关系①r的取值范围为;②|r|值越大,误差Q越小,变量之间的线性相关程度越;③|r|值越接近0,误差Q越大,变量之间的线性相关程度越.3.相关性的分类(1)当时,两个变量正相关;(2)当时,两个变量负相关;(3)当时,两个变量线性不相关.[-1,1]高低r0r0r=0思考:所有的两个相关变量都可以来求回归方程吗?[提示]不一定.如果两个相关变量的相关性很强,可以求出回归方程,当几乎没有相关性时就不可以求出回归方程.4.可线性化的回归分析(1)非线性回归分析对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型.(2)非线性回归方程曲线方程曲线图形变换公式变换后的线性函数y=axb(a=1,b>0)(a=1,b<0)c=lnav=lnxu=lny_________u=c+bvy=aebx(a>0,b>0)(a>0,b<0)c=lnau=lny_____________y=aebx(a>0,b>0)(a>0,b<0)c=lnav=1xu=lnyu=____________u=c+bxc+bvy=a+blnx(b>0)(b<0=v=lnxu=y_____________u=a+bv1.变量y与x之间的回归方程()A.表示y与x之间的函数关系B.表示y与x之间的不确定性关系C.反映y与x之间真实关系的形式D.反映y与x之间的最大限度的真实关系的形式[答案]D2.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时,销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元B[x=4+2+3+54=3.5,y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B.]D[分别将x的值代入解析式判断知满足y=2+lnx.]3.下列数据x,y符合哪一种函数模型()x12345678910y22.6933.383.63.844.084.24.3A.y=2+13xB.y=2exC.y=2e1xD.y=2+lnx合作探究提素养【例1】(1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关变量间的相关关系及判定(2)两个变量x,y与其线性相关系数r有下列说法:①若r>0,则x增大时,y也随之相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上,其中正确的有()A.①②B.②③C.①③D.①②③(3)有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和其身体健康情况;④正方形的边长和面积;⑤汽车的重量和百公里耗油量.其中两个变量成正相关的是()A.①③B.②④C.②⑤D.④⑤思路点拨:可借助于线性相关概念及性质作出判断.(1)C(2)C(3)C[(1)由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.(2)根据两个变量的相关性与其相关系数r之间的关系知,①③正确,②错误,故选C.(3)其中①③成负相关关系,②⑤成正相关关系,④成函数关系,故选C.]线性相关系数的理解1.线性相关系数是从数值上来判断变量间的线性相关程度,是定量的方法.与散点图相比较,线性相关系数要精细得多,需要注意的是线性相关系数r的绝对值小,只是说明线性相关程度低,但不一定不相关,可能是非线性相关.2.利用相关系数r来检验线性相关显著性水平时,通常与0.75作比较,若r0.75,则线性相关较为显著,否则为不显著.1.下列两变量中具有相关关系的是()A.正方体的体积与边长B.人的身高与体重C.匀速行驶车辆的行驶距离与时间D.球的半径与体积B[选项A中正方体的体积为边长的立方,有固定的函数关系;选项C中匀速行驶车辆的行驶距离与时间成正比,也是函数关系;选项D中球的体积是43π与半径的立方相乘,有固定函数关系.只有选项B中人的身高与体重具有相关关系.]【例2】(1)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4)(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10B.0r2r1C.r20r1D.r2=r1求线性回归方程(2)某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x(℃)171382月销售量y(件)24334055①算出线性回归方程y=bx+a(a,b精确到0.1);②气象部门预测下个月的平均气温约为6℃,据此估计该商场下个月毛衣的销售量.思路点拨:(1)可利用公式求解;(2)把月平均气温代入回归方程求解.(1)C[对变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r10;对变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r20.故r20r1.](2)解:①由散点图易判断y与x具有线性相关关系.x=(17+13+8+2)÷4=10,y=(24+33+40+55)÷4=38,∑4i=1xiyi=17×24+13×33+8×40+2×55=1267,∑4i=1x2i=526,b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=1267-4×10×38526-4×102≈-2.0,a=y-bx≈38-(-2.0)×10=58.0,所以线性回归方程为y=-2.0x+58.0.②气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量为y=-2.0x+58.0=-2.0×6+58.0=46(件).回归分析的理解1.回归分析是定义在具有相关关系的两个变量基础上的,因此,在做回归分析时,要先判断这两个变量是否相关,利用散点图可直观地判断两个变量是否相关.2.利用回归直线,我们可以进行预测.若回归直线方程y=a+bx,则x=x0处的估计值为y0=a+bx0.3.线性回归方程中的截距a和斜率b都是通过样本估计而得到的,存在着误差,这种误差可能导致预报结果的偏差,所以由线性回归方程给出的是一个预报值而非精确值.4.回归直线必过样本点的中心点.2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得到下表数据:x681012y2356(1)请画出上表数据的散点图(要求:点要描粗);(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.[解](1)如图:(2)∑ni=1xiyi=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,∑ni=1x2i=62+82+102+122=344,b=158-4×9×4344-4×92=1420=0.7,a=y-bx=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.(3)由(2)中线性回归方程知当x=9时,y=0.7×9-2.3=4,预测记忆力为9的同学的判断力约为4.[探究问题]1.如何解答非线性回归问题?可线性化的回归分析[提示]非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:2.已知x和y之间的一组数据,则下列四个函数中,模拟效果最好的为哪一个?x123y35.9912.01①y=3×2x-1;②y=log2x;③y=4x;④y=x2.[提示]观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.所以模拟效果最好的为①.【例3】某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05(1)试建立y与x之间的回归方程;(2)如果一名在校男生身高为168cm,预测他的体重约为多少?思路点拨:先由散点图确定相应的拟合模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.[解](1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=lny,列表如下:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.443.663.864.01作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为z=0.693+0.020x,则有y=e0.693+0.020x.(2)由(1)知,当x=168时,y=e0.693+0.020×168≈57.57,所以在校男生身高为168cm,预测他的体重约为57.57kg.两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=lny,则变换后样本点应该分布在直线z=bx+aa=lnc1,b=c2的周围.3.在一次抽样调查中测得样本的5个样本点,数据如下表:x0.250.5124y1612521试建立y与x之间的回归方程.[解]作出变量y与x之间的散点图如图所示.由图可知变量y与x近似地呈反比例函数关系.设y=kx,令t=1x,则y=kt.由y与x的数据表可得y与t的数据表:t4210.50.25y1612521作出y与t的散点图如图所示.由图可知y与t呈近似的线性相关关系.又t=1.55,y=7.2,i=15tiyi=94.25,i=
本文标题:2019-2020学年高中数学 第1章 统计案例 1 1.1 回归分析 1.2 相关系数 1.3 可
链接地址:https://www.777doc.com/doc-8291974 .html