您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 高考数学总复习 第十章第3课时 变量间的相关关系、统计案例课件
第3课时变量间的相关关系、统计案例教材回扣夯实双基基础梳理1.两个变量的线性相关(1)正相关在散点图中,点散布在从________到________的区域.对于两个变量的这种相关关系,我们将它称为正相关.左下角右上角(2)负相关在散点图中,点散布在从________到________的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在______________,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.左上角右下角一条直线附近思考探究相关关系与函数关系有什么异同点?提示:相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.回归方程(1)最小二乘法求回归直线使得样本数据的点到回归直线的______________最小的方法叫做最小二乘法距离的平方和(2)回归方程方程y^=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a,b是待定参数.b=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2a=y-bx3.回归分析(1)定义对具有____________的两个变量进行统计分析的一种常用方法.(2)样本点的中心在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,(x,y)称为样本点的中心.相关关系(3)相关系数当r0时,表明两个变量________;当r0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性相关性______.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于______时,认为两个变量有很强的线性相关性.正相关负相关越强0.754.独立性检验(1)分类变量的定义如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)2×2列联表一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=_______________________,用它的大小可以决定是否拒绝原来的统计假设H0,如果K2值较大,就拒绝H0,即拒绝______________.事件A与B无关nad-bc2a+bc+da+cb+d课前热身1.下列说法中正确的是()A.任何两个变量都具有相关关系B.球的体积和球的半径具有相关关系C.农作物的产量和施肥量之间是一种确定关系D.某商品的产量和该商品的价格之间是一种非确定关系解析:选D.A的说法是错误的;球的体积和球的半径具有函数关系,故B错误;C中农作物的产量和施肥量之间是一种相关关系,故C错误;D是正确的.2.(2010·高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.y^=-10x+200B.y^=10x+200C.y^=-10x-200D.y^=10x-200解析:选A.由于销售量y与销售价格x成负相关,故排除B、D.C中y^值恒为负,不符合题意,故选A.3.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出)y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.答案:0.2544.为了判断高中学生选文理科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科文科总计男131023女72027总计203050解析:因为K2≈4.8443.841,故判断出错的可能性为5%.已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2=50×13×20-10×7223×27×20×30≈4.844.则认为选文理科与性别有关系出错的可能性为________.答案:5%考点探究讲练互动考点突破两个变量的相关关系例15个学生的数学和物理成绩如下表:画出散点图,并判断它们是否有相关关系.学生学科ABCDE数学8075706560物理7066686462【解】以x轴表示数学成绩,y轴表示物理成绩,可得到相应的散点图如图所示.由散点图可知,两者之间具有相关关系,且为正相关.【题后感悟】判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图,根据散点图很容易看出两个变量之间是否具有相关关系,是不是线性相关关系,是正相关还是负相关,相关关系强还是弱.备选例题对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断()例A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关【解析】由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关.【答案】C线性回归分析(2011·高考广东卷)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:例2时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为________.【解析】小李这5天的平均投篮命中率y=0.4+0.5+0.6+0.6+0.45=0.5;可求得小李这5天的平均打篮球时间x=3.根据表中数据可求得b^=0.01,a^=0.47,故回归直线方程为y^=0.47+0.01x,将x=6代入得6号打6小时篮球的投篮命中率约为0.53.【答案】0.50.53【题后感悟】利用回归方程可以估计总体,它是回归直线方程所反映的规律的延伸,可使我们对有线性相关关系的两个变量进行分析和控制.备选例题下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.例x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解】(1)由题设所给数据,可得散点图如下:(2)由对照数据,计算得i=14x2i=86,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,已知i=14xiyi=66.5,所以,由最小二乘法确定的回归直线方程的系数为:b^=i=14xiyi-4xyi=14x2i-4x2=66.5-4×4.5×3.586-4×4.52=0.7,a^=y-b^x=3.5-0.7×4.5=0.35.因此,所求的线性回归方程为y^=0.7x+0.35.(3)由(2)求出的线性回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×100+0.35)=19.65(吨标准煤).变式训练1.第二十届世界石油大会于2011年12月4日-8日在卡塔尔首都多哈举行,能源问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为________吨.解析:由题知,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,故样本数据的中心点为A(4.5,3.5).设回归直线方程为y=0.7x+b,将中心点坐标代入得:3.5=0.7×4.5+b,解得b=0.35,故回归直线方程为y=0.7x+0.35,所以当x=10时,y=0.7×10+0.35=7.35,即该工厂每年大约消耗的汽油为7.35吨.答案:7.35某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:独立性检验例3试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650【解】由K2=50×18×19-6×7224×26×25×25≈11.54.∵K26.635,故可以有99%的把握认为学生的学习积极性与对待班级工作的态度有关系.【题后感悟】独立性检验的步骤:(1)根据样本数据制成2×2列联表.(2)根据公式K2=nad-bc2a+ba+cb+dc+d计算K2的观测值.(3)比较K2与临界值的大小关系作统计推断.互动探究2.在本例条件下,如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?解:随机抽查一名学生有50种不同的抽法,积极参加班级工作的学生有18+6=24人,故P1=2450=1225.不太主动参加班级工作且学习积极性一般的学生有19人,∴P2=1950.备选例题某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)内的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:例分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06)[30.06,30.10)[30.10,30.14)频数92614乙厂:分组[29.8629.90),[29.90,29.94)[29.94,29.98)[29.98,30.02)频数297185159分组[30.02,30.06)[30.06,30.10)[30.10,30.14)频数766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面的2×2列联表,并问是否能在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?甲厂乙厂总计优质品非优质品总计附K2=nad-bc2a+bc+da+cb+d,P(K2≥k0)0.050.01k03.8416.635【解】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)甲厂乙厂总计优质品360320680非优质品140180320总计5005001000因为K2的观测值k=1000×360×180-320×1402500×500×680×320≈7.356.635,所以在犯错误的概率不超过0.01的前提下能认为“两个分厂生产的零件的质量有差异”.方法技巧1.求线性回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归直线方程中一次项系数为b,常数项为a,这与一次函数的习惯表示不同)方法感悟2.回归分
本文标题:高考数学总复习 第十章第3课时 变量间的相关关系、统计案例课件
链接地址:https://www.777doc.com/doc-3156780 .html