您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 第26讲 统计(解析版)
第26讲统计【知识点总结】一、抽样方法三种抽样方式的对比类型共同点各自特点相互关系使用范围简单随机抽样抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率nPN从总体中随机逐个抽取总体容量较小系统抽样总体均分几段,每段T个,第一段取a1,第二段取a1+T,第三段取a1+2T,……第一段简单随机抽样总体中的个体个数较多分层抽样将总体分成n层,每层按比例抽取每层按简单随机抽样或系统抽样总体由差异明显的几部分组成二、样本分析(1)样本平均值:11niixxn。(2)样本众数:样本数据中出现次数最多的那个数据。(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。(4)样本方差:()2211niisxxn。众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。三、频率分布直方图的解读(1)频率分布直方图的绘制①由频率分布表求出每组频数ni;②求出每组频率iinPN(n为样本容量);③列出样本频率分布表;④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。(2)样本估计总体步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。公式:aXbaxb,s2(aX+b)=a2s2(X)。【典型例题】例1.(2021·云南师大附中高三阶段练习(文))某公司利用随机数表对生产的900支乙肝疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第5个数的编号是()167662276656502671073290797853135538585988975414101256859926969668273105037293155712101421882649817655595635643854824622316243099006184432532383013030A.827B.310C.503D.729【答案】C【详解】从表中第4行第4列开始向右读取分别为685,992(舍),696,966(舍),827,310,503,第5个数为503,故选:C.例2.(2022·全国·高三专题练习)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A.33,34,33B.25,56,19C.20,40,30D.30,50,20【答案】B【详解】因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.故选:B例3.(2021·四川省内江市第六中学高三阶段练习(文))某市场新购进某品牌电视机30台,为检测这批品牌电视机的安全系数,现采用系统抽样的方法从中抽取5台进行检测,若第一组抽出的号码是2,则第4组抽出的号码是________.【答案】20【详解】因为某品牌电视机30台,抽取5台进行检测,所以分5组,每组6台,因为第一组抽出的号码是2,则第4组抽出的号码是2(41)620,故答案为:20例4.(2022·全国·高三专题练习(理))机床生产一批参考尺寸为的零件,从中随机抽取10个,量得其尺寸如下表(单位:mm):序号12345678910尺寸6.35.86.25.96.26.05.85.85.96.1参考数据:取3.21.79.(1)求样本零件尺寸的平均值x与标准差s;(2)估计这批零件尺寸位于,xsxs的百分比.【解析】(1)由表格数据得:6.335.825.926.26.16.0106x,222220.330.150.210100.032s,则3.20.0320.17910s,所以样本零件尺寸的平均值6x,标准差0.179s.(2)由(1)知:5.821xs,6.179xs,这10件样本中,尺寸在5.821,6.179内的共有4件,以样本估计总体,则这批零件尺寸位于5.821,6.179的百分比约为100%41040%.例5.(2019·河北·衡水第一中学高考模拟(理))在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从A,B两道题目中任选一题作答.某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名考生的选做题成绩中随机抽取一个容量为10的样本,为此将900名考生选做题的成绩按照随机顺序依次编号为001一900.(1)若采用随机数表法抽样,并按照以下随机数表,以方框内的数字5为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端.写出样本编号的中位数;(2)若采用系统抽样法抽样,且样本中最小编号为08,求样本中所有编号之和:(3)若采用分层轴样,按照学生选择A题目或B题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4:样本中B题目的成绩有2个,平均数为8,方差为1.用样本估计900名考生选做题得分的平均数与方差.【详解】解:(1)根据题意,读出的编号依次是:512,916(超界),935(超界),805,770,951(超界),512(重复),687,858,554,876,647,547,332.将有效的编号从小到大排列,得332,512,547,554,647,687,770,805,858,876,故中位数为6476876672.(2)由题易知,按照系统抽样法,抽出的编号可组成以8为首项,以90为公差的等差数列,故样本编号之和即为该数列的前10项之和101091089041302S.(3)记样本中8个A题目成绩分别为1x,2x,…8x,2个B题目成绩分别为1y,2y,由题意可知818756iix,82178432iix,2116iiy,2218212iiy,故样本平均数为881156167.28282iiiixy.样本方差为8222117.27.282iiiixy22821170.280.882iiiixy88222222111170.4780.281.6820.882iiiiiiiixxyy3200.32201.2835.63.561010.故估计该校900名考生该选做题得分的平均数为7.2,方差为3.56.【点睛】采用随机数表法抽样时需先将样本编号,且要注意号码位数相同,然后由随机数表读数,在样本号码范围内的取出,不在的舍掉.系统抽样法需先将样本编号,然后分组,抽取的号码数构成等差数列.例6.(2020·河北·模拟预测(文))为抗击新型冠状病毒肺炎疫情,某口罩生产企业职工在做好自身安全防护的同时,加班加点生产口罩发往疫区.该企业为保证口罩的质量,从某种型号的口罩中随机抽取100个,测量这些口罩的某项质量指标值,其频率分布直方图如图所示,其中该项质量指标值在区间115,125内的口罩恰有8个.(1)求图中a,b的值;(2)用样本估计总体的思想,估计这种型号的口罩该项质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据质量指标标准,该项质量指标值不低于85,则为合格产品,试估计该企业生产这种型号口罩的质量合格率为多少?【详解】解:(1)因为该项质量指标值在区间115,125内的口罩恰有8个,所以810.00810010b,又0.10.0060.0380.0220.034ab,所以0.0340.0080.026a;(2)这种型号的口罩该项质量指标值的样本平均数为800.06900.261000.381100.221200.08100x,该项质量指标值的样本方差为22222200.06100.2600.38100.22200.08104s,利用样本估计总体的思想,可以认为这种型号的口罩项质量指标值的样本平均数为100,方差为104;(3)从样本可知质量指标值不低于85的产品所占比例的估计值为0.260.380.220.080.94,故样本的合格率为94%,所以可以认为该企业生产这种型号口罩的质量合格率为94%.【技能提升训练】一、单选题1.(2022·全国·高三专题练习)下列说法正确的是()A.投掷一枚硬币1000次,一定有500次“正面朝上”B.若甲组数据的方差是0.03,乙组数据的方差是0.1,则甲组数据比乙组数据稳定C.为了解我国中学生的视力情况,应采取全面调查的方式D.一组数据1、2、5、5、5、3、3的中位数和众数都是5【答案】B【分析】根据统计量,对各项分析判断即可得解.【详解】对于A,因为每次抛掷硬币都是随机事件,所以不一定有500次“正面朝上”,故A错误;对于B,因为方差越小越稳定,故B正确;对于C,为了解我国中学生的视力情况,应采取抽样调查的方式,故C错误;对于D,数据1、2、5、5、5、3、3按从小到大排列后为1、2、3、3、5、5、5,则其中位数为3,故D错误,故选:B.2.(2022·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题;“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒内有谷二十八颗,凡粒米率每勺三百,今欲知米内杂谷多少”,其大意是,粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.153石B.154石C.169石D.170石【答案】C【分析】这批米内夹谷约为x石,则282541534x,由此能求出这批米内夹谷数量.【详解】这批米内夹谷约为x石,根据题意可得282541534x解得281534169254x故选:C3.(2022·全国·高三专题练习)现要完成下列3项抽样调查:①从15种疫苗中抽取5种检测是否合格.②某科研院所共有480名科研人员,其中具有高级职称的有48名,具有中级职称的有360名,具有初级职称的有72名.为了解该科研院所科研人员的创新能力,拟抽取一个样本容量为20的样本.③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.较为合理的抽样方法是()A.①③简单随机抽样,②分层抽样B.①②简单随机抽样,③分层抽样C.②③简单随机抽样,①分层抽样D.①简单随机抽样,②③分层抽样【答案】A【分析】根据简单随机抽样和分层抽样的概念判断.【详解】①③中总体容量较少,且个体没有明显差别,适合用简单随机抽样;②中总体是由有明显差异的几部分组成的,适合用分层抽样.故选:A.4.(2022·全国·高三专题练习)下面抽样中是简单随机抽样的个数是()①从无数个个体中抽取30个个体作为样本②从100部手机中一次抽取5部进行检测③某班有45名同学,指定个子最高的5名同学参加学校组织的篮球比赛④一彩民买彩票选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽取6个号签A.1B.2C.3D.4【答案】A【分析】根据简单随机抽样的概念和特点分别判断即可.【详解】①总体个数无限,不是简单的随机抽样;②不是逐个抽取,不是简单的随机抽样;③指定了5名同学参赛,不满足每个个体被抽到的可能性相同,不是简单的随机抽样;④满足简单的随机抽样的定义.故选:A.5.(2022·全国·高
本文标题:第26讲 统计(解析版)
链接地址:https://www.777doc.com/doc-12797057 .html