您好,欢迎访问三七文档
知识梳理典例变式基础训练能力提升第20讲抽样方法与总体分布的估计知识梳理典例变式基础训练能力提升知识梳理1.随机抽样(1)简单随机抽样①定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.②常用方法:抽签法和随机数法.(2)系统抽样①步骤:a.先将总体的N个个体编号;b.根据样本容量n,当𝑁𝑛是整数时,取分段间隔k=𝑁𝑛;c.在第1段用简单随机抽样确定第一个个体编号l(l≤k);d.按照一定的规则抽取样本.②适用范围:适用于总体中的个体数较多时.知识梳理典例变式基础训练能力提升知识梳理(3)分层抽样①定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.②适用范围:适用于总体由差异比较明显的几个部分组成时.知识梳理典例变式基础训练能力提升知识梳理2.用样本估计总体(1)统计图表①频率分布直方图的画法步骤a.求极差(即一组数据中最大值与最小值的差);b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.②频率分布折线图和总体密度曲线a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.b.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.知识梳理典例变式基础训练能力提升知识梳理③茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.知识梳理典例变式基础训练能力提升知识梳理(2)样本的数字特征①众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.②中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.③平均数:把𝑎1+𝑎2+…+𝑎𝑛𝑛称为a1,a2,…,an这n个数的平均数.④标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x,则这组数据的标准差和方差分别是s=1𝑛[(x1-x)2+(x2-x)2+…+(x𝑛-x)2].s2=1𝑛[(x1-x)2+(x2-x)2+…+(xn-x)2].⑤平均数、方差的有关性质若x1,x2,…,xn,的平均数为x,则mx1+a,mx2+a,…,mxn+a的平均数为mx+a.若x1,x2,…,xn,的方差是s2,则mx1+a,mx2+a,…,mxn+a的方差为m2s2.知识梳理典例变式基础训练能力提升知识梳理3.两变量间的相关关系与统计案例(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)回归方程为y^=b^x+a^,其中b^=∑𝑖=1𝑛xiyi-𝑛xy∑i=1nx𝑖2-𝑛x2,a^=𝑦−b^x.知识梳理典例变式基础训练能力提升知识梳理(4)相关系数r=∑𝑖=1𝑛(x𝑖-x)(𝑦𝑖-𝑦)∑𝑖=1𝑛(x𝑖-x)2∑𝑖=1𝑛(𝑦𝑖-𝑦)2当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.知识梳理典例变式基础训练能力提升知识梳理4.非线性回归分析如果在样本数据的散点图中,样本点并没有分布在某一条直线附近,而是分布在某一条曲线(如二次函数、指数函数、对数函数等)的周围,我们就称这两个变量之间不具有线性相关关系,而是非线性相关关系.对这样的两个变量进行回归分析,称为非线性回归分析.5.独立性检验(1)假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为,如下表所示:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d知识梳理典例变式基础训练能力提升知识梳理K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑎+𝑐)(𝑏+𝑑)(𝑐+𝑑)(其中n=a+b+c+d为样本容量).(2)两个分类变量A和B是否有关系的判断方法①当K2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B没有关联;②当K22.706时,有90%的把握判定变量A,B有关联;③当K23.841时,有95%的把握判定变量A,B有关联;④当K26.635时,有99%的把握判定变量A,B有关联;⑤当K210.828时,有99.9%的把握判定变量A,B有关联.知识梳理典例变式基础训练能力提升典例变式题型一简单随机抽样【例1】下列抽取样本的方式不属于简单随机抽样的有.①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.【解析】①不是简单随机抽样.由于被抽取的样本总体的个数是无限的,而不是有限的。②不是简单随机抽样.由于它是放回抽样.③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.④不是简单随机抽样.因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样.【答案】①②③④知识梳理典例变式基础训练能力提升典例变式【规律方法】抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.知识梳理典例变式基础训练能力提升典例变式变式训练一1.某校高三(1)班共有48人,学号依次为1,2,3,…,48,现用系统抽样的办法抽取一个容量为6的样本.已知学号为3,11,19,35,43的同学在样本中,那么还有一个同学的学号应为()A.27B.26C.25D.24A【解析】根据系统抽样的规则——“等距离”抽取,也就抽取的号码差相等,根据抽出的序号可知学号之间的差为8,所以在19与35之间还有27.2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1365石B【解析】由题意,这批米内夹谷约为1534×28254≈169(石).知识梳理典例变式基础训练能力提升典例变式3.某年级有1000名学生,随机编号为0001,0002,…,1000,现用系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是()A.0116B.0927C.0834D.0726B【解析】样本间隔为1000÷200=5,因为122÷5=24余2,故抽取的余数应该是2的号码,116÷5=23余1,927÷5=185余2,834÷5=166余4,726÷5=145余1.知识梳理典例变式基础训练能力提升典例变式4.2015年11月11日的“双十一”又掀购物狂潮,某网站对购物情况做了一项调查,收回的有效问卷共500000份,其中购买下列四种商品的人数统计如下:服饰鞋帽198000人;家居用品94000人;化妆品116000人;家用电器92000人.为了解消费者对商品的满意度,此网站用分层抽样的方法从中选出部分问卷进行调查,已知在购买“化妆品”这一类中抽取了116人,则在购买“家居用品”这一类中应抽取的问卷份数为()A.92B.94C.116D.118B【解析】在购买“化妆品”这一类中抽取了116人,则在购买“家居用品”这一类中应抽取的问卷份数为x,则116116000=𝑥94000,解得x=94.知识梳理典例变式基础训练能力提升典例变式题型二系统抽样【例2】某班级有50名学生,现用系统抽样的方法从这50名学生中抽出10名学生,将这50名学生随机编号为1~5号,并按编号顺序平均分成10组(1~5号,6~10号,…,46~50号),若在第三组抽到的编号是13,则在第七组抽到的编号是.【解析】∵是从50名学生中抽出10名学生,组距是5,∵第三组抽取的是13号,∴第七组抽取的为13+4×5=33.【答案】33【规律方法】应用系统抽样应注意的问题(1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号可用简单随机抽样来确定,一旦起始编号确定,其他编号便随之确定.知识梳理典例变式基础训练能力提升典例变式变式训练二1.某校为了解本校高三学生学习的心理状态,采用系统抽样方法从800人中抽取40人参加某种测试,为此将他们随机编号为1,2,…,800,分组后在第一组采用简单随机抽样的方法抽到的号码为18,抽到的40人中,编号落在区间[1,200]的人做试卷A,编号落在[201,560]的人做试卷B,其余的人做试卷C,则做试卷C的人数为()A.10B.12C.18D.28B【解析】80040=20,[561,800]长度为240,故应抽取24020=12(人).知识梳理典例变式基础训练能力提升典例变式2.某学校高一、高二、高三年级分别有720、720、800人,现从全校随机抽取56人参加防火防灾问卷调查.先采用分层抽样确定各年级参加调查的人数,再在各年级内采用系统抽样确定参加调查的同学,若将高三年级的同学依次编号为001,002,…,800,则高三年级抽取的同学的编号不可能为()A.001,041,…,761B.031,071,…,791C.027,067,…,787D.055,095,…,795D【解析】由根据分层抽样可得高三年级抽取出20人,利用系统抽样可分成40组得到的数据特征应成等差数列,经计算答案中的数据795-55=740不是40的整数倍,因此这组数据不是系统抽样得到的,故应选D.知识梳理典例变式基础训练能力提升典例变式3.用0,1,…,199给200个零件编号,并用系统抽样的方法从中抽取10件作为样本进行质量检测,若第一段中编号为5的零件被取出,则第二段中被取出的零件编号为()A.25B.10C.15D.20A【解析】将编号0,1,…,199分为10段,分别为0~19,20~39,40~59,…,180~199,若第一段中编号为5,则第二段中同等位置上应取25,故选A.知识梳理典例变式基础训练能力提升典例变式题型三分层抽样【例3】(1)(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.(2)一支田径队有男运动员56人,女运动员m人,用分层抽样抽出一个容量为n的样本,在这个样本中随机取一个当队长的概率为,且样本中的男队员比女队员多4人,则m=.128【解析】(1)应从丙种型号的产品中抽取60×300200+400+300+100=18(件).(2)由题意知n=28,设其中有男队员x人,女队员有y人.则x+𝑦=28,x-𝑦=4,56𝑚=x𝑦.解得x=16,y=12,m=42.知识梳理典例变式基础训练能力提升典例变式【答案】(1)18(2)42【规律方法】分层抽样问题的解题策略(1)确定抽样比.可依据各层总数与样本数
本文标题:2020高考数学 艺考生冲刺 第七章 概率与统计 第20讲 抽样方法与总体分布的估计课件
链接地址:https://www.777doc.com/doc-8098439 .html