您好,欢迎访问三七文档
-1-第一章统计案例1.1回归分析的基本思想及其初步应用(二)课时作业新人教A版选修1-2明目标、知重点1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度.1.如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.2.两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.3.比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.探究点一非线性回归模型思考1有些变量间的关系并不是线性相关,怎样确定回归模型?答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.思考2如果两个变量呈现非线性相关关系,怎样求出回归方程?答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程.例1某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60708090100110体重y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05试建立y与x之间的回归方程.解根据表中数据画出散点图如图所示.-2-由图看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,于是令z=lny.x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01画出散点图如图所示.由表中数据可得z与x之间的线性回归方程:=0.663+0.020x,则有=e0.663+0.020x.反思与感悟根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线y=c1ec2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系.跟踪训练1在彩色显影中,由经验知:形成染料光学密度y与析出银的光学密度x由公式y=A错误!未找到引用源。(b0)表示.现测得试验数据如下:xi0.050.060.250.310.070.10yi0.100.141.001.120.230.37xi0.380.430.140.200.47yi1.191.250.590.791.29试求y对x的回归方程.解由题给的公式y=A错误!未找到引用源。,两边取自然对数,便得lny=lnA+bx,与线性回归方程相对照,只要取u=1x,v=lny,a=lnA.就有v=a+bu.题给数据经变量置换u=1x,v=lny变成如下表所示的数据:ui20.00016.6674.0003.22614.28610.000vi-2.303-1.96600.113-1.470-0.994ui2.6322.3267.1435.0002.128vi0.1740.223-0.528-0.2360.255-3-可得ln=0.548-0.146x,即=错误!未找到引用源。e=e0.548·错误!未找到引用源。≈1.73错误!未找到引用源。,这就是y对x的回归方程.探究点二非线性回归分析思考1对于两个变量间的相关关系,是否只有唯一一种回归模型来拟合它们间的相关关系?答不一定.我们可以根据已知数据的散点图,把它与幂函数、指数函数、对数函数、二次函数图象进行比较,挑选一种拟合比较好的函数,作为回归模型.思考2对同一个问题建立的两种不同回归模型,怎样比较它们的拟合效果?答有两种比较方法:(1)计算残差平方和,残差平方和小的模型拟合效果好;(2)计算相关指数R2,R2越接近于1的模型拟合效果越好.例2为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数.解(1)所作散点图如图所示.(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则x123456z1.792.483.223.894.555.25由计算器得:=0.69x+1.115,则有=e0.69x+1.115.(3)6.0812.1224.1748.1896.06191.52y612254995190∑ni=12i=∑ni=1(yi-i)2=4.8161,∑ni=1(yi-y)2=24642.8,-4-R2=1-4.816124642.8≈0.9998,即解释变量天数对预报变量繁殖细菌个数解释了99.98%.反思与感悟研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后通过图形来分析残差特性,用残差1,2,…,n来判断原始数据中是否存在可疑数据,用R2来刻画模型拟合的效果.跟踪训练2对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:甲y=0.1x+1,乙y=-0.05x2+0.35x+0.7,丙y=-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.解对甲模型:残差平方和∑4i=1(yi-i)2=0.0109;对乙模型:残差平方和∑4i=1(yi-i)2=0.0049;对丙模型:残差平方和∑4i=1(yi-i)2=0.0004.显然丙的残差平方和最小,故丙模型更接近于客观实际.1.散点图在回归分析中的作用是()A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否相关答案D2.变量x与y之间的回归方程表示()A.x与y之间的函数关系B.x与y之间的不确定性关系C.x与y之间的真实关系形式D.x与y之间的真实关系达到最大限度的吻合答案D3.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为()A.1B.-0.5C.0D.0.5答案C-5-4.非线性回归分析的解题思路是________.答案通过变量置换转化为线性回归分析[呈重点、现规律]非线性回归问题的处理方法(1)指数函数型y=ebx+a①函数y=ebx+a的图象:②处理方法:两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出b,a.(2)对数曲线型y=blnx+a①函数y=blnx+a的图象:②处理方法:设x′=lnx,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.(3)y=bx2+a型处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.一、基础过关1.下列说法正确的是()①线性回归方程适用于一切样本和总体;②线性回归方程一般都有时间性;③样本的取值范围会影响线性回归方程的适用范围;④根据线性回归方程得到的预测值是预测变量的精确值.A.①③④B.②③C.①②D.③④答案B2.某地财政收入x与支出y满足回归方程y=x++e(单位:亿元),其中=0.8,=2,|e|0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()-6-A.10亿B.9亿C.10.5亿D.9.5亿答案C解析代入数据=10+e,因为|e|0.5,所以||10.5,故不会超过10.5亿.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.12D.1答案D4.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出下列拟合曲线,其中拟合程度最好的是()A.y=2x-2B.y=(12)xC.y=log2xD.y=12(x2-1)答案D解析可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的.5.如果散点图的所有点都在一条直线上,则残差均为________,残差平方和为________,相关指数为________.答案0016.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=lny,求得线性回归方程为=0.25x-2.58,则该模型的回归方程为________.答案=e0.25x-2.58解析∵=0.25x-2.58,z=lny,∴=e0.25x-2.58.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345-7-(1)求年推销金额y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.解(1)设所求的线性回归方程为=x+,则=i=15(xi-x)(yi-y)i=15(xi-x)2=1020=0.5,=y-x=0.4.∴年推销金额y关于工作年限x的线性回归方程为=0.5x+0.4.(2)当x=11时,=0.5x+0.4=0.5×11+0.4=5.9(万元).∴可以估计第6名推销员的年推销金额为5.9万元.二、能力提升8.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;②相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是()A.0B.1C.2D.3答案D解析①选用的模型是否合适与残差点的分布有关;对于②③,R2的值越大,说明残差平方和越小,随机误差越小,则模型的拟合效果越好.9.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合答案A解析由于回归直线一定过(x,y),∴直线l1和l2都过(s,t)点.-8-10.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系,现取了8对观测值,计算得:∑8i=1xi=52,∑8i=1yi=228,∑8i=1x2i=478,∑8i=1xiyi=1849,则y与x的线性回归方程是________.答案=11.47+2.62x11.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求y关于x的线性回归方程.解(1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算.i12345xi(百万元)24568yi(百万元)3040605070xiyi60160300300560x=5;y=50;∑5i=1x2i=145;∑5i=1xiyi=1380于是可得=∑5i=1xiyi-5xy∑5i=1x2i-5x2=1380-5×5×50145-5×52=6.5,=y-x=50-6.5×5=17.5.于是所求的线性回归方程是=6.5x+17.5.12.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程=x+;-9-(2)利用(1)
本文标题:2015-2016学年高中数学第一章统计案例11回归分析的基本思想及其初步应用(二)课时作业
链接地址:https://www.777doc.com/doc-3016131 .html