您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 其它文档 > 知识讲解-《统计》全章复习与巩固
《统计》全章复习与巩固【学习目标】1.理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法,会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.6.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【知识络】【要点梳理】要点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编(码可从1到N),并把码写在形状、大小相同的签上(签可用小球、卡片、纸条等制作),然后将这些签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编;第二步,选定开始的数字;第三步,获取样本码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编,为简便起见,有时可直接采用个体所带有的码,如考生的准考证、街道上各户的门牌等等.②为将整个的编分段(即分成几个部分),要确定分段的间隔k.当Nn是整数时(N为总体中的个体的个数,n为样本容量),Nkn;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N能被n整除,这时'Nkn.③在第一段用简单随机抽样确定起始的个体编l.④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编lk,第3个编2lk,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:类别共同点不同点联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取是后两种方法的基础总体个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成5.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样.要点二:用样本估计总体1.统计图表包括条形图、折线图、饼图、茎叶图.2.刻画一组数据集中趋势的统计量有平均数、中位数、众数.平均数:12...nxxxxn刻画一组数据离散程度的统计量有极差、方差2s、标准差s.方差:222212()()...()nxxxxxxsn.3.总体分布(1)总体:在数理统计中,通常把被研究的对象的全体叫做总体.(2)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.(3)频率分布直方图中每个小矩形的宽度为ix(分组的宽度),小矩形的面积为相应的频率if,高为iifx.(4)频率分布折线图:在频率分布直方图中,按照分组原则,再在左、右两边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线称为频率折线图.(5)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.(6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.要点诠释:①总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,总体在某一区间取值的百分比就是该区间与该曲线所成的曲边梯形的面积.②总体密度曲线一般的分布规律是中间高、两边低的“山峰”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内.③并非所有的总体都存在密度曲线,如一些离散型的总体不存在密度曲线.(7)茎叶图除了上面几种图表能帮助我们理解样本数据外,统计中还有一种被用来表示数据的图叫做茎叶图.它是一种将样本数据有条理地列出来,从中观察样本分布情况的图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少时,用茎叶图表示数据的效果较好,但当样本数据较多时,茎叶图就显得不太方便了.4.几种频率分布的优缺点及用频率分布估计总体分布(1)几种表示频率分布的方法的优缺点①频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便.②直方图能够很容易地表示大量数据,非常直观地表示分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.③频率分布折线图的优点是它反映了数据的变化趋势.如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线.④用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况.但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.(2)用样本的频率分布估计总体的分布用样本估计总体,是研究统计问题的一个基本思想放法,对于不易知道的总体分布,总是用样本的频率分布对它进行估计.一般地,样本容量越大,估计就越精确.要点三:变量的相关性1.散点图:将两个变量所对应的点描在直角坐标系中,这些点组成了变量之间的一个图,称为变量之间的散点图.散点图形象地反映了各对数据的密切程度.粗略地看,散点分布具有一定的规律.如果变量之间存在某种关系,这些点会有一个集中趋势,这种趋势通常可以用一条光滑的曲线来近似表示,这样近似的过程称为曲线拟合.2.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系.3.线性相关:若两个变量的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的.若所有点看上去都在某条曲线(不是直线)附近波动,则称此相关为非线性相关的;如果所有的点在散点图中没有任何关系,则称变量间是不相关的.4.相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.5.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析.通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性.对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法.两个变量具有相关关系是回归分析的前提.(2)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(3)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.6.回归直线设所求的直线方程为ybxa,其中a、b是待定系数.1122211()()()nniiiiiinniiiixxyyxynxybxxxnxaybx,niixnx11,niiyny11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析.【典型例题】类型一:随机抽样例1.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为②.则完成①、②这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法【思路点拨】此题为抽样方法的选取问题.当总体中个体较多而且差异又不大时宜采用系统抽样,采用系统抽样在每小组内抽取时应按规则进行;当总体中的个体差异较大时,宜采用分层抽样;当总体中个体较少时,宜采用随机抽样.【解析】依据题意,第①项调查应采用分层抽样法、第②项调查应采用简单随机抽样法.故选B.【总结升华】采用什么样的抽样方法要依据研究的总体中的个体情况来定.举一反三:【变式1】甲校有3600名学生,乙校有5400名学生,丙校有1800名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个样本容量为90人的样本,应在这三校分别抽取学生()A.30人,30人,30人B.30人,45人,15人C.20人,30人,10人D.30人,50人,10人【答案】B.【解析】根据样本容量和总体容量确定抽样比,最终得到每层中学生人数.【变式2】一个总体中有100个个体,随机编为0,1,2,…,99,依编顺序平均分成10个小组,组依次为l,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的码为m,那么在第k小组中抽取的码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的码是.【答案】63【解析】∵6m,7k,∴13mk∴在第7小组中抽取的码是63.【变式3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的41,且该
本文标题:知识讲解-《统计》全章复习与巩固
链接地址:https://www.777doc.com/doc-5974184 .html