您好,欢迎访问三七文档
数学第十一章统计与统计案例第3讲变量间的相关关系、统计案例01基础知识自主回顾02核心考点深度剖析03高效演练分层突破一、知识梳理1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是__________;与函数关系不同,__________是一种非确定性关系.相关关系相关关系2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有______________,这条直线叫__________.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为__________,点分布在左上角到右下角的区域内,两个变量的相关关系为__________.(3)回归方程为y^=b^x+a^,其中b^=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=__________.线性相关关系回归直线正相关负相关y--b^x-(4)相关系数当r0时,表明两个变量__________;当r0时,表明两个变量__________.r的绝对值越接近于1,表明两个变量的线性相关性__________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于__________时,认为两个变量有很强的线性相关性.正相关负相关越强0.753.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1ab__________x2cdc+d总计a+c__________a+b+c+d(2)K2统计量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).a+bb+d常用结论1.求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点(x-,y-).2.根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.3.根据回归方程计算的y^值,仅是一个预报值,不是真实发生的值.二、习题改编1.(必修3P90例题改编)已知x与y之间的一组数据如表:x0123ym35.57已求得y关于x的线性回归方程为y^=2.1x+0.85,则m的值为__________.答案:0.52.(选修12P16习题1.2T2改编)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为__________.解析:K2的观测值k≈4.8443.841,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.答案:5%一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)事件X,Y的关系越密切,由观测数据计算得到的K2的观测值越大.()(5)通过回归方程y^=b^x+a^可以估计和观测变量的取值和变化趋势.()×√√√√二、易错纠偏常见误区(1)混淆相关关系与函数关系;(2)对独立性检验K2值的意义不清楚;(3)不知道回归直线必过样本点中心.1.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③B.②③①C.②①③D.①③②解析:选D.第一个散点图中,散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中,散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中,散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.2.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.()附:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%解析:选C.因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.3.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y^=0.95x+a^,则a^=__________.x0134y2.24.34.86.7解析:由已知得x-=2,y-=4.5,因为回归方程经过点(x-,y-),所以a^=4.5-0.95×2=2.6.答案:2.6【解析】因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.相关关系的判断(师生共研)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关【答案】C判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关;r0时,负相关.(3)线性回归方程中:b^0时,正相关;b^0时,负相关.1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.2.对变量x,y有观测数据(xi,yi)(i=1,2,3,4,5),得表1;对变量u,v有观测数据(ui,vi)(i=1,2,3,4,5),得表2.由这两个表可以判断()表1:x12345y2.93.33.64.45.1表2:u12345v2520211513A.变量x与y正相关,u与v正相关B.变量x与y负相关,u与v正相关C.变量x与y负相关,u与v负相关D.变量x与y正相关,u与v负相关解析:选D.由题可知,随着x的增大,对应的y值增大,其散点图呈上升趋势,故x与y正相关;随着u的增大,v减小,其散点图呈下降趋势,故u与v负相关.线性回归方程及其应用(师生共研)(2020·福州市第一学期抽测)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:日期2日7日15日22日30日温度x/℃101113128产卵数y/个2325302616科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.(1)若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?附:回归直线的斜率和截距的最小二乘估计公式分别为b^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2,a^=y--b^x-.【解】(1)由已知数据得x-=12,y-=27,∑3i=1(xi-x-)(yi-y-)=5,∑3i=1(xi-x-)2=2.所以b^=∑3i=1(xi-x-)(yi-y-)∑3i=1(xi-x-)2=52,a^=y--52x-=27-52×12=-3.所以y关于x的线性回归方程为y^=52x-3.(2)由(1)知,y关于x的线性回归方程为y^=52x-3.当x=10时,y^=52×10-3=22,|22-23|2,当x=8时,y^=52×8-3=17,|17-16|2.所以(1)中所得的线性回归方程y^=52x-3是可靠的.线性回归分析问题的类型及解题方法(1)求线性回归方程①利用公式,求出回归系数b^,a^;②待定系数法:利用回归直线过样本点的中心求系数.(2)样本数据的相关系数r=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2,反映样本数据的相关程度,|r|越大,则相关性越强.1.对两个变量x,y进行线性回归分析,计算得到相关系数r=-0.9962,则下列说法中正确的是()A.x与y正相关B.x与y具有较强的线性相关关系C.x与y几乎不具有线性相关关系D.x与y的线性相关关系还需进一步确定解析:选B.因为相关系数r=-0.9962,所以x与y负相关,因为|r|=0.9962,非常接近1,所以相关性很强,故选B.2.(2020·成都第一次诊断性检测)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:等级代码数值x384858687888销售单价y/元16.818.820.822.82425.8(1)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性回归方程(系数精确到0.1);(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y^=b^x+a^的斜率和截距的最小二乘估计分别为b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.参考数据:∑6i=1xiyi=8440,∑6i=1x2i=25564.解:(1)由题意,得x-=38+48+58+68+78+886=63,y-=16.8+18.8+20.8+22.8+24+25.86=21.5,b^=∑6i=1xiyi-6x-y-∑6i=1x2i-6x-2=8440-6×63×21.525564-6×63×63≈0.2,a^=y--b^x-=21.5-0.2×63=8.9.故所求线性回归方程为y^=0.2x+8.9.(2)由(1),知当x=98时,y=0.2×98+8.9=28.5.所以估计该等级的中国小龙虾销售单价为28.5元.独立性检验(师生共研)(2019·高考全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).【解】(1)由调查数据知,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商
本文标题:2021版高考数学一轮复习 第十一章 统计与统计案例 第3讲 变量间的相关关系、统计案例课件 文 新
链接地址:https://www.777doc.com/doc-8220465 .html