您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 高三寒假复习讲义第11章 第2讲 统计与统计案例
高三寒假复习讲义第2讲统计与统计案例考点一抽样方法与总体分布的估计1抽样方法(1)简单随机抽样的概念设一个总体含有N个个体,从中逐个不放回地抽取n(n≤N)个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)特点与方法(3)系统抽样的概念当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样或等距抽样).(4)系统抽样的特点①适用于元素个数很多且均衡的总体.②各个个体被抽到的机会均等.③总体分组后,在起始部分采用的是简单随机抽样.④如果总体容量N能被样本容量n整除,则抽样间隔为k=Nn,如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样.(5)分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法就叫做分层抽样.(6)分层抽样的步骤①分层:按某种特征将总体分成若干部分.②按比例确定每层抽取个体的个数.③各层分别按简单随机抽样或系统抽样的方法抽取个体.④综合每层抽样,组成样本.2用样本估计总体(1)频率分布表与频率分布直方图频率分布表与频率分布直方图的绘制步骤如下:①求极差,即求一组数据中最大值与最小值的差.②决定组距与组数.③将数据分组.④列频率分布表.落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.计算各小组的频率,列出频率分布表.⑤画频率分布直方图.依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率组距=频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数也在增加,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.(4)众数、中位数、平均数定义特点众数在一组数据中出现次数最多的数据体现了样本数据的最大集中点,不受极端值的影响,而且不唯一中位数将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个平均数样本数据的算术平均数与每一个样本数据有关,只有一个(5)极差、标准差与方差定义特点极差一组数据中最大值与最小值的差反映一组数据的波动情况,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小,但极差只考虑两个极端值,可靠性较差标准差标准差是样本数据到平均数的一种平均距离,即s=1n[x1-x2+x2-x2+…+xn-x2]反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的两边越分散方差标准差的平方,即s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]同标准差一样用来衡量样本数据的离散程度,但是平方后夸大了偏差程度注意点众数、平均数、中位数的关系(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(2)平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.(3)实际问题中求得的平均数、众数和中位数应带上单位.1.思维辨析(1)系统抽样在第1段抽样时采用简单随机抽样.()(2)若为了适合分段或分层而剔除几个个体后再抽样,则对剔除的个体来说是不公平的.()(3)一组数据的平均数—定大于这组数据中的每个数据.()(4)一组数据的方差越大,说明这组数据的波动越大.()(5)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()(6)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()答案(1)√(2)×(3)×(4)√(5)√(6)×2.如图是容量为150的样本的频率分布直方图,则样本数据落在[6,10)内的频数为()A.12B.48C.60D.80答案B解析落在[6,10)内的频率为0.08×4=0.32,故频数为0.32×150=48.3.为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是()A.5,10,15,20,25B.2,4,8,16,32C.1,2,3,4,5D.7,17,27,37,47答案D解析利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10.[考法综述]高考对随机抽样的考查常以实际应用为背景考查样本的抽取,特别是分层抽样与系统抽样的理解与计算.利用样本频率分布估计总体分布是高考热点,会列频率分布表,会画频率分布直方图,小题一般较容易,大题往往结合概率考查,难度中等.命题法1抽样方法典例1(1)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.若第1组抽出的号码为2,则所有被抽出职工的号码为________.(2)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.[解析](1)由系统抽样知识知,第一组1~8号;第二组为9~16号;第三组为17~24号;第四组为25~32号;第五组为33~40号.第一组抽出号码为2,则依次为10,18,26,34.(2)抽取比例为280560+420=280980=27,所以样本中男生人数为560×27=160.[答案](1)2,10,18,26,34(2)160【解题法】三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等从总体中逐个抽取—总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成命题法2用样本估计总体典例2(1)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].①求图中a的值;②根据频率分布直方图,估计这100名学生语文成绩的平均分;③若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.分数段[50,60)[60,70)[70,80)[80,90)x∶y1∶12∶13∶44∶5(2)为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5①分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?②根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?[解](1)①由频率分布直方图可知:(2a+0.04+0.03+0.02)×10=1,所以a=0.005.②根据频率分布直方图,估计这100名学生语文成绩的平均分为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=2.75+26+22.5+17+4.75=73(分).③根据频率分布直方图及表中数据得:分数段xy[50,60)55[60,70)4020[70,80)3040[80,90)2025∴数学成绩在[50,90)之外的人数为100-5-20-40-25=10.(2)①设A药观测数据的平均数为x-,B药观测数据的平均数为y-,由观测结果可得x-=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,y-=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可知:x-y-,由此可看出A药的疗效更好.②由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在“2.”,“3.”上,而B药疗效的试验结果有710的叶集中在“0.”,“1.”上,由此可看出A药的疗效更好.ziyuanku.com【解题法】用样本估计总体的解题策略(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.1.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D解析根据柱形图可观察两个变量的相关性,易知A、B、C正确,2006年以来我国二氧化硫年排放量与年份负相关,选项D错误.故选D.2.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.32答案C解析由标准差的性质知,2x1-1,2x2-1,…2x10-1的标准差为2×8=16,故选C.3.重庆市2013年各月的平均气温(℃)数据的茎叶图如下:则这组数据的中位数是()A.19B.20C.21.5D.23答案B解析根据茎叶图及中位数的概念,由茎叶图知,该组数据的中位数为20+202=20.故选B.4.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石答案B解析根据样本估计总体,可得这批米内夹谷约为28254×1534≈169石.故选B.5.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B解析初中部女教师的人数为110×70%=77,高中部女教师的人数为150×(1-60%)=60,则该校女教师的人数为7
本文标题:高三寒假复习讲义第11章 第2讲 统计与统计案例
链接地址:https://www.777doc.com/doc-3450503 .html