您好,欢迎访问三七文档
第2讲用样本估计总体第十一章统计、统计案例1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中_________与__________的差);②决定_______与_______;③将数据_______;④列______________;⑤画_____________________.最大值最小值组距组数分组频率分布表频率分布直方图(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的_______,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时______________增加,_______减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.中点所分组数组距2.样本的数字特征(1)众数:一组数据中_____________________的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于__________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把_________________称为a1,a2,…,an这n个数的平均数.出现次数最多最中间a1+a2+…+ann(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x-,则这组数据的标准差和方差分别是s=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2],s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].常用知识拓展1.若x1,x2,…,xn的平均数为x-,那么mx1+a,mx2+a,…,mxn+a的平均数为mx-+a.2.数据x1,x2,…,xn与数据x′1=x1+a,x′2=x2+a,…,x′n=xn+a的方差相等,即数据经过平移后方差不变.3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.4.s2=1ni=1n(xi-x-)2=1ni=1nx2i-x-2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.()(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)√(3)×(4)√(5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误.贵阳地铁1号线12月28日开通运营,某辆机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70、60、60、50、60、40、40、30、30、10,则这组数据的众数、中位数、平均数的和为()A.170B.165C.160D.150解析:选D.将这组数据从小到大排列:10、30、30、40、40、50、60、60、60、70,易知其众数为60,中位数为45,平均数为45,故众数、中位数、平均数的和为150.故选D.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为________.解析:由茎叶图知,最低分为87分,最高分为99分.依题意得,15×(87+93+90+9×10+x+91)=91,解得x=4.则剩余5个得分的方差s2=15×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=15×(16+4+1+9)=6.答案:6(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()样本的数字特征(典例迁移)A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)(2019·盐城模拟)已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________.【解析】(1)x-甲=15×(4+5+6+7+8)=6,x-乙=15×(5×3+6+9)=6,甲的成绩的方差为15×(22×2+12×2)=2,乙的成绩的方差为15×(12×3+32×1)=2.4.故选C.(2)由s2=1ni=1n(xi-x-)2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准为22.【答案】(1)C(2)22[迁移探究](变条件)本例(2)增加条件“x1,x2,x3,x4,x5的平均数为2”,求数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数和方差.解:数据2x1+3,2x2+3,2x3+3,2x4+3,2x5+3的平均数为2×2+3=7,方差为22×2=8.(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述;②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)在计算平均数、方差时可利用平均数、方差的有关结论.1.(2019·江西八所重点中学联考)某地区某村的前3年的经济收入(单位:万元)分别为100,200,300,其统计数据的中位数为x,平均数为y.今年经过政府新农村建设后,该村经济收入(单位:万元)在上年基础上翻番,则在这4年里经济收入的统计数据中,下列说法正确的是()A.中位数为x,平均数为1.5yB.中位数为1.25x,平均数为yC.中位数为1.25x,平均数为1.5yD.中位数为1.5x,平均数为2y解析:选C.由数据100,200,300可得,前3年统计数据的中位数x=200,平均数y=100+200+3003=200.根据题意得第4年该村的经济收入的统计数据为600,则由数据100,200,300,600可得,这4年统计数据的中位数为200+3002=250=1.25x,平均数为100+200+300+6004=300=1.5y,故选C.2.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x,5,10,则2+x2=3,解得x=4,所以这组数据的平均数为x-=16×(1+2+2+4+5+10)=4,方差为s2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9茎叶图(师生共研)(2017·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7D.5,7【解析】根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以56+62+65+74+(70+x)5=59+61+67+(60+y)+785,解得x=3.故选A.【答案】A茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.1.(2019·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.某省为了抽选运动员参加“国际马拉松比赛”,将35名运动员的一次马拉松比赛成绩(单位:分钟)制成茎叶图,如图所示.若将运动员按成绩由好到差编号,再用系统抽样的方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为()A.6B.5C.4D.3解析:选C.对35名运动员进行编号:00,01,02,…,34,分成七组:00~04,05~09,10~14,15~19,20~24,25~29,30~34,用系统抽样的方法抽7人,则第三组到第六组中占4人,即抽取的成绩在区间[139,151]上的运动员的人数为4,故选C.角度一求样本的频率、频数(2017·高考北京卷节选)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:频率分布直方图(多维探究)(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数.【解】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×5100=20.角度二求样本的数字特征(2019·高考全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:74≈8.602.【解】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y-=1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30
本文标题:2020版高考数学大一轮复习 第十一章 统计、统计案例 2 第2讲 用样本估计总体课件 文 新人教A
链接地址:https://www.777doc.com/doc-8236124 .html