您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 第2部分 专题4 第1讲 统计与统计案例 课件(共66张PPT)
专题四概率与统计第1讲统计与统计案例第二部分核心专题师生共研考点1统计图表和样本数字特征01高考串讲·找规律考题变迁·提素养1.(2020·新高考卷Ⅱ改编)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()①这11天复工指数和复产指数均逐日增加;②这11天期间,复产指数增量大于复工指数的增量;③第3天至第11天复工复产指数均超过80%;④第9天至第11天复产指数增量大于复工指数的增量.A.①②B.②③C.③④D.②④C[由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故①错误;由图可知,第1天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;由图可知,第3天至第11天复工复产指数均超过80%,故③正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故④正确,故选C.]2.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差A[记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.]3.(2021·全国卷乙)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).[解](1)由表格中的数据易得:x=-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.310+10.0=10.0,y=0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.510+10.0=10.3,s21=110×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s22=110×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.(2)由(1)中数据可得y-x=10.3-10.0=0.3,而2s21+s2210=25s21+s22=0.0304,显然有y-x>2s21+s2210成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.命题规律:样本的数字特征、统计图表主要以选择题、填空题形式出现,难度较小.通性通法:总体估计的方法(1)统计量法:①若数据已知,常借助x,s2等量对样本总体做出估计,其中x=x1+x2+…+xnn,s2=1n∑ni=1(xi-x)2.②若数据未知,如以频率分布直方图形式给出,则应明确直方图中各统计量的求法.(2)图表分析法:若根据图表比较样本数据的大小,可根据数据分布情况直观分析,大致判断平均数的范围,并依据数据的波动情况比较方差(标准差)的大小.1.[数字特征的计算](2021·广东模拟)已知数据x1,x2,x3,x4,x5,x6的平均数是5,方差是9,则x21+x22+x23+x24+x25+x26=()A.159B.204C.231D.636B[根据题意,数据x1,x2,x3,x4,x5,x6的平均数x=5,方差s2=9,则s2=16(x21+x22+x23+x24+x25+x26)-x2=9,变形可得:x21+x22+x23+x24+x25+x26=204,故选B.]2.[以频率分布直方图为载体](2021·辽宁模拟)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图,以样本估计总体,则下列结论中正确的是()A.该公司职工的测试成绩不低于60分的人数约占总人数的80%B.该公司职工测试成绩的中位数约为75分C.该公司职工测试成绩的平均值约为68分D.该公司职工测试成绩的众数约为60分C[由频率分布直方图,得:对于A,该公司职工的测试成绩不低于60分的频率为:(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,∴该公司职工测试成绩的中位数约为:60+0.5-0.30.4×20=70分,故B错误;对于C,该公司职工测试成绩的平均值约为:x=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68分,故C正确;对于D,该公司职工测试成绩的众数约为:60+802=70分,故D错误.故选C.]3.[以饼形图为载体]据了解,到本世纪中叶中国人口老龄化问题将日趋严重,如图是专家预测中国2050年人口比例图,若从2050年开始退休年龄将延迟到65岁,则下列叙述正确的是()人口比例图A.到2050年已经退休的人数将超过40%B.2050年中国46~55岁的人数比16~25岁的人数多30%C.2050年中国25岁以上未退休的人口数大约是已退休人口数的2倍D.按照分层抽样的方法从16~55岁之间的人群中抽取一个容量为n的样本,若样本中46~55岁比26~35岁多6人,则n=104D[由饼形图知2050年中国将有约32%的人已经退休,所以选项A错误;设46~55岁的人数为16x人,16~25岁的人数为13x人,则46~55岁的人数比16~25岁的人数多16x-13x13x=313≈23%,所以选项B错误;25岁以上未退休的人口数占48%,已退休人口数占32%,所以25岁以上未退休的人口数大约是已退休人口数的1.5倍,所以选项C错误;由题意知16n52-13n52=6,解得n=104,所以选项D正确,故选D.]考点2回归分析02高考串讲·找规律考题变迁·提素养1.(2020·全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnxD[根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图并结合选项可排除A,B,C,故选D.]2.(2020·全国卷Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得∑20i=1xi=60,∑20i=1yi=1200,∑20i=1(xi-x)2=80,∑20i=1(yi-y)2=9000,∑20i=1(xi-x)(yi-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=∑20i=1xi-xyi-y∑20i=1xi-x2∑20i=1yi-y2,2≈1.414.[解](1)由已知得样本平均数y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(xi,yi)(i=1,2,…,20)的相关系数r=i=120xi-xyi-yi=120xi-x2i=120yi-y2=80080×9000=223≈0.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.命题规律:高考对该点的考查主要立足两点:一是考查学生的数据提取,数据分析能力;二是考查学生的数学建模能力,难度适中.通性通法:进行回归分析的一般思路(1)定关系:依据样本数据散点图或相关系数r,确定两个变量是否具有较强的相关关系.(2)算各值:分别计算x,y,∑ni=1x2i,∑ni=1xiyi的值.(3)求系数:求出回归系数b^,a^.其中b^=∑ni=1xi-xyi-y∑ni=1xi-x2=∑ni=1xiyi-nxy∑ni=1x2i-nx2.(4)写方程:y^=b^x+a^.(5)作预测:依据回归方程给出预测值.提醒:非线性回归分析可借助代数变换转化为线性回归分析.1.[回归方程的性质]蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的线性回归方程y^=0.25x+k,则下列说法不正确的是()x(次数/分钟)2030405060y(℃)2527.52932.536A.k的值是20B.变量x,y呈正相关关系C.若x的值增加1,则y的值约增加0.25D.当蟋蟀52次/分鸣叫时,该地当时的气温预报值为33.5℃D[由题意,得x=15(20+30+40+50+60)=40,y=15(25+27.5+29+32.5+36)=30,则k=y-0.25x=30-0.25×40=20,故A正确;由线性回归方程可知,b^=0.25>0,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.25,故C正确;当x=52时,y^=0.25×52+20=33,故D错误.故选D.]2.[回归分析]近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如图的散点图:现根据散点图利用y=a+bx或y=c+dx建立y关于x的回归方程,令s=x,t=1x得到如下数据:xyst10.15109.943.040.16∑13i=1siyi-13s-y-∑13i=1tiyi-13t-y-∑13i=1s2i-13s2∑13i=1t2i-13t2∑13i=1y2i-13y213.94-2.111.670.2121.22且(si,yi)与(ti,yi)(i=1,2,3,…,13)的相关系数分别为r1,r2且r2=-0.9953
本文标题:第2部分 专题4 第1讲 统计与统计案例 课件(共66张PPT)
链接地址:https://www.777doc.com/doc-12779125 .html