您好,欢迎访问三七文档
第3讲变量间的相关关系、统计案例第十一章统计、统计案例1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是______________;与函数关系不同,____________是一种非确定性关系.相关关系相关关系2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有_____________,这条直线叫____________.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为____________,点分布在左上角到右下角的区域内,两个变量的相关关系为____________.线性相关关系回归直线正相关负相关(3)回归方程为y^=b^x+a^,其中b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=____________.(4)相关系数当r0时,表明两个变量____________;当r0时,表明两个变量____________.r的绝对值越接近于1,表明两个变量的线性相关性____________.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于____________时,认为两个变量有很强的线性相关性.正相关负相关越强0.75y--b^x-3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1ab_________x2cdc+d总计a+c_________a+b+c+d(2)K2统计量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).a+bb+d判断正误(正确的打“√”,错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)事件X,Y的关系越密切,由观测数据计算得到的K2的观测值越大.()(5)通过回归方程y^=b^x+a^可以估计和观测变量的取值和变化趋势.()答案:(1)×(2)√(3)√(4)√(5)√某商品销售量y(件)与销售价格x(元/件)负相关,则其回归直线方程可能是()A.y^=-10x+200B.y^=10x+200C.y^=-10x-200D.y^=10x-200解析:选A.因为商品销售量y(件)与销售价格x(元/件)负相关,所以b^0,排除B,D.又因为x=0时,y0,所以应选A.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有多少的把握认为“学生性别与支持该活动有关系”.()附:P(K2≥k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%解析:选C.因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有1-0.010=0.99=99%的把握认为“学生性别与支持该活动有关系”.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46则表中a、b处的值分别为________.解析:因为a+21=73,所以a=52.又因为a+2=b,所以b=54.答案:52、54已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为y^=0.95x+a^,则a^=________.x0134y2.24.34.86.7解析:由已知得x-=2,y-=4.5,因为回归方程经过点(x-,y-),所以a^=4.5-0.95×2=2.6.答案:2.6已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关相关关系的判断(师生共研)【解析】因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=b^y+a^,b^0,则z=b^y+a^=-0.1b^x+b^+a^,故x与z负相关.【答案】C判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关;r0时,负相关.(3)线性回归方程中:b^0时,正相关;b^0时,负相关.1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:选C.由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.2.对变量x,y有观测数据(xi,yi)(i=1,2,3,4,5),得表1;对变量u,v有观测数据(ui,vi)(i=1,2,3,4,5),得表2.由这两个表可以判断()表1:x12345y2.93.33.64.45.1表2:u12345v2520211513A.变量x与y正相关,u与v正相关B.变量x与y负相关,u与v正相关C.变量x与y负相关,u与v负相关D.变量x与y正相关,u与v负相关解析:选D.由题可知,随着x的增大,对应的y值增大,其散点图呈上升趋势,故x与y正相关;随着u的增大,v减小,其散点图呈下降趋势,故u与v负相关.(2019·石家庄质量检测(二))随着网络的发展,网上购物越来越受到人们的喜爱,各大购物网站为增加收入,促销策略越来越多样化,促销费用也不断增加.下表是某购物网站2017年1~8月促销费用x(万元)和产品销量y(万件)的具体数据.月份12345678促销费用x2361013211518产品销量y11233.5544.5线性回归方程及其应用(师生共研)(1)根据数据绘制的散点图能够看出可用线性回归模型拟合y与x的关系,请用相关系数r加以说明;(系数精确到0.001)(2)建立y关于x的回归方程y^=b^x+a^(系数精确到0.01),如果该公司计划在9月份实现产品销量超6万件,预测至少需投入促销费用多少万元.(结果精确到0.01)参考数据:i=18(xi-11)(yi-3)=74.5,i=18(xi-11)2=340,i=18(yi-3)2=16.5,340≈18.44,16.5≈4.06,其中xi,yi分别为第i个月的促销费用和产品销量,i=1,2,3,…,8.参考公式:(i)样本(xi,yi)(i=1,2,…,n)的相关系数r=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2i=1n(yi-y-)2.(ii)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程y^=b^x+a^的斜率和截距的最小二乘估计分别为b^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2,a^=y--b^x-.【解】(1)由题可知x-=11,y-=3,将数据代入r=i=1n(xi-x-)(yi-y-)i=1n(xi-x-)2i=1n(yi-y-)2,得r≈74.518.44×4.06=74.574.8664≈0.995.因为y与x的相关系数近似为0.995,说明y与x的线性相关性很强,从而可以用线性回归模型拟合y与x的关系.(需要突出“很强”,“一般”或“较弱”不给分)(2)将数据代入b^=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2,得b^=74.5340≈0.219,则a^=y--b^x-≈3-0.219×11≈0.59.因为0.219≈0.22,所以y关于x的回归方程为y^=0.22x+0.59.由y^=0.22x+0.59>6,解得x>24.59,即至少需要投入促销费用24.59万元.线性回归分析问题的类型及解题方法(1)求线性回归方程①利用公式,求出回归系数b^,a^;②待定系数法:利用回归直线过样本点的中心求系数.(2)样本数据的相关系数r=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2,反映样本数据的相关程度,|r|越大,则相关性越强.(2019·湘东五校联考)已知具有相关关系的两个变量x,y的几组数据如下表所示:x246810y3671012(1)请根据上表数据在网络纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^,并估计当x=20时y的值.参考公式:b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a^=y--b^x-.解:(1)散点图如图所示:(2)依题意x-=15×(2+4+6+8+10)=6,y-=15×(3+6+7+10+12)=7.6,i=15xi2=4+16+36+64+100=220,i=15xiyi=6+24+42+80+120=272,b^=∑5i=1xiyi-5x-y-∑5i=1x2i-5x-2=272-5×6×7.6220-5×62=4440=1.1,所以a^=7.6-1.1×6=1.所以线性回归方程y^=1.1x+1,故当x=20时,y=23.(2018·高考全国卷Ⅲ节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:独立性检验(师生共研)(1)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(2)根据(1)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),【解】(1)由茎叶图知m=79+812=80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(2)由于K2=40(15×15-5×5)220×20×20×20=106.635,所以有99%的把握认为两种生产方式的效率有差异.(1)独立性检验的一般步骤①根据样本数据制成2×2列联表;②根据公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)计算K2的值;③查表比较K2与临界值的大小关系,作出统计判断.(2)解独立性检验的应用问题的关注点①两个明确:(ⅰ)明确两类主体;(ⅱ)明确研究的两个问题;②两个准确:(ⅰ)准确画出2×2列联表;(ⅱ)准确理解K2.(2019·广东七校联考)某淘宝店经过对“十一”七天假期的消费情况进行统计,发现在金额不超过1000元的消费者中男女之比约为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表.女性消费情况:消费金额/元(0,200)[200,400)[400,600)[600,800)[800,1000]人数51015473男性消费情况:消费金额/元(0,200)[200,400)[400,600)[600,800)[800,1000]人数231032若消费金额不低于600元的消费者称为“网购达人”、低于600元的消费者称为“非网购达人”.(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?(2)根据以上统计数据填写如下2×2列联表,并回答能否在犯错误的概率不超过0.005的前提下认为“是否
本文标题:2020版高考数学大一轮复习 第十一章 统计、统计案例 3 第3讲 变量间的相关关系、统计案例课件
链接地址:https://www.777doc.com/doc-8236122 .html