您好,欢迎访问三七文档
§11.3变量间的相关关系、统计案例1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方法及其初步应用.4.了解回归分析的基本思想、方法及其简单应用.最新考纲回归分析,独立性检验是高考考查的重点,以解答题为主,常与概率结合考查.难度中高档.考情考向分析INDEX回扣基础知识训练基础题目基础落实1.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.知识梳理(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的的方法叫做最小二乘法.回归直线距离的平方和最小②回归方程方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数.b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=.y^-b^x(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中称为样本点的中心.③相关系数当r0时,表明两个变量;当r0时,表明两个变量.r的绝对值越接近于1,表明两个变量的线性相关性.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于时,认为两个变量有很强的线性相关性.(x,y)正相关负相关越强0.752.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=,其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量来判断“两个分类变量有关系”的方法称为独立性检验.nad-bc2a+bc+da+cb+dK21.变量的相关关系与变量的函数关系有什么区别?提示相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.概念方法微思考2.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?提示(1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)散点图是判断两个变量是否相关的一种重要方法和手段.()(2)线性回归方程至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.()(3)若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.()(4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.()基础自测题组一思考辨析√××√y^=b^x+a^2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力A.回归分析B.均值与方差C.独立性检验D.概率题组二教材改编解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.√3.下面是2×2列联表:y1y2总计x1a2173x2222547总计b46120则表中a,b的值分别为A.94,72B.52,50C.52,74D.74,52√解析∵a+21=73,∴a=52.又a+22=b,∴b=74.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.设表中的“模糊数字”为a,则62+a+75+81+89=75×5,∴a=68.y^零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为____.68解析由x=30,得y=0.67×30+54.9=75.5.某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2=4.453,经查阅临界值表知P(K2≥3.841)≈0.05,现给出四个结论,其中正确的是A.在100个吸烟的人中约有95个人患肺病B.若某人吸烟,那么他有95%的可能性患肺病C.有95%的把握认为“患肺病与吸烟有关”D.只有5%的把握认为“患肺病与吸烟有关”题组三易错自纠√解析由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.6.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是_____.(填序号).①y与x具有正的线性相关关系;②回归直线过样本点的中心(x,y);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.④对于④,当x=170cm时,y^=0.85×170-85.71=58.79,但这是预测值,不可断定其体重为58.79kg.故不正确.解析①正确;②正确;③正确.典题深度剖析重点多维探究题型突破相关关系的判断题型一自主演练1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%√解析观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.2.(2020·云南昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系√解析由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:当r0时,两个变量正相关;当r0时,两个变量负相关.思维升华SIWEISHENGHUA(3)线性回归方程:当b^0时,两个变量正相关;当b^0时,两个变量负相关.回归分析题型二多维探究命题点1线性回归分析例1(2020·湖北部分重点中学联考)“精准扶贫”的重要思想最早在2013年11月提出,习近平到湘西考察时首次作出“实事求是,因地制宜,分类指导,精准扶贫”的重要指导.2015年习总书记在贵州调研时强调要科学谋划好“十三五”时期精准扶贫开发工作,确保贫困人口到2020年如期脱贫.某农科所实地考察,研究发现某贫困村适合种植A、B两种药材,可以通过种植这两种药材脱贫,通过大量考察研究得到如下统计数据:药材A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:编号12345年份20152016201720182019单价(元/公斤)1820232529药材B的收购价格始终为20元/公斤,其亩产量的频率分布直方图如下:(1)若药材A的单价y(单位:元/公斤)与年份编号x具有线性相关关系,请求出y关于x的线性回归方程,并估计2020年药材A的单价;附:b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.解x=1+2+3+4+55=3,y=18+20+23+25+295=23,所以b^=-2×-5+-1×-3+0×0+1×2+2×6-22+-12+0+12+22=2.7,又因为y=b^x+a^,即23=2.7×3+a^,解得a^=14.9,所以y^=2.7x+14.9;当x=6时,y^=31.1.(2)用上述频率分布直方图估计药材B的平均亩产量,若不考虑其他因素,试判断2020年该村应种植药材A还是药材B?并说明理由.解360×0.1+380×0.2+400×0.35+420×0.25+440×0.1=401,若种植A种药材每亩地的收入约为31.1×300=9330,若种植B种药材每亩地的收入约为401×20=80209330,所以应该种植A种药材.命题点2非线性回归例2某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)·(yi-y)i=18(wi-w)·(yi-y)46.65636.8289.81.61469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)解由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^u的斜率和截距的最小二乘估计分别为β^=i=1nui-uvi-vi=1nui-u2,α^=v-β^u.解令w=x,先建立y关于w的线性回归方程,由于d^=i=18wi-w·yi-yi=18wi-w2=108.81.6=68,c^=y-d^w=563-68×6.8=100.6,所以y关于w的线性回归方程为y^=100.6+68w,因此y关于x的回归方程为y^=100.6+68x.(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?解由(2)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,年利润z的预报值z^=576.6×0.2-49=66.32.②年宣传费x为何值时,年利润的预报值最大?z^=0.2(100.6+68x)-x=-x+13.6x+20.12.解根据(2)的结果知,年利润z的预报值所以当x=13.62=6.8,即x=46.24时,z^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.回归分析
本文标题:2021高考数学一轮复习 第十一章 算法、统计与统计案例 11.3 变量间的相关关系、统计案例课件
链接地址:https://www.777doc.com/doc-8096113 .html