您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 必修三第二章统计复习教案
1必修三第二章《统计》复习专题一、基础知识回顾1:简单随机抽样(1)总体和样本①在统计学中,把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样:就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本个体被抽中的可能性相同(概率相等),样本的每个个体完全独立,彼此间无一定的关联性和排斥性且为逐个不放回抽取,简单随机抽样是其它各种抽样形式的基础。通常只是在总体个体之间差异程度较小和数目较少时,才采用这种方法。(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法(4)抽签法:①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:①给调查对象群体中的每一个对象编号(编号位数相同);②获取样本编号2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。K(抽样距离)=N/n(若N/n不是整数,则需先用简单随机抽样剔除数目最少的个体后再进行)(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的2要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。两种方法:①先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。②先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。(2)分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。分层标准:①以调查所要分析和研究的主要变量或相关的变量作为分层的标准。②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。③以那些有明显分层区分的变量作为分层变量。(3)分层的比例问题:抽样比=样本容量各层样本容量个体容量各层个体容量①按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。②不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。3如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。类别共同点各自特点相互关系适用范围简单随机抽样抽样过程中每个个体被抽取的机会相等,都为n/N从总体中逐个抽取总体中的个体数较少系统抽样将总体均匀分成几部分,按事先确定的规则在各部分抽取再起时部分抽样时采用简单随机抽样总体中的个数较多分成抽样经总体分成几层,分层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成如:某学校决定从高一(1)班60名学生中利用随机数表法抽取10人进行调研,先将60名学生按01,02,…,60进行编号;如果从第8行第7列的数开始从左向右读,则抽取到的第4个人的编号为()(下面摘取了第7行到第9行)844217533157245506887704744767217633502683926301531659169275386298215071751286735807443913263321134278641607825207443815032442997931.A.16B.38C.21D.50【考点】系统抽样方法.【分析】根据随机数表法的读法,可得答案.【解答】解:找到第8行第7列的数开始向右读,第一个符合条件的是16,第二个数59,第三个数38,第四个数21.∴第4个样本个体的编号是21,故选:C,4:用样本的数字特征估计总体的数字特征(1)样本均值:nxxxxn21(2)样本标准差:nxxxxxxssn222212)()()((3)众数:在样本数据中,频率分布最大值所对应的样本数据(可以是多个)。4(4)中位数:居中(中间一个或两个的平均数,直方图中使两边频率相等的数据)注意:①如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变②如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍③一组数据中的最大值和最小值对标准差的影响,区间)3,3(sxsx的应用;“去掉一个最高分,去掉一个最低分”中的科学道理5:用样本的频率分布估计总体分布1:频率分布表与频率分布直方图频率分布表盒频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况。具体步骤如下:第一步:求极差,即计算最大值与最小值的差.第二步:决定组距和组数:组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多.一般来说,容量不超过100的组数在5至12之间.组距应最好“取整”,它与组距极差有关.注意:组数的“取舍”不依据四舍五入,而是当组距极差不是整数时,组数=[组距极差]+1.②频率分布折线图:连接频率分布直方图中各个小长方形上端的中点,就得到频率分布折线图。③总体密度曲线:总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。2:茎叶图:茎是指中间的一列数,叶是指从茎旁边生长出来的数。5例1:某班n名学生的综合素质测评成绩(百分制)频率分布直方图如图所示,已知70~80分数段的学生人数为27人,90~95分数段的学生中女生为2人.(1)求a,n的值;(2)若从90~95分数段内的学生中随机抽取2人,求其中至少有一名女生的概率.【考点】频率分布直方图;列举法计算基本事件数及事件发生的概率.【分析】(1)根据频率分布直方图求出a的值,从而求出n即可;(2)先得到男生4人,记为:a,b,c,d,女生2人,记为:e,f,列出所有的基本事件以及满足条件的事件,从而求出满足条件的概率即可.【解答】解:(1)由频率分布直方图得:(a+a+2a+3a+4a+4a+5a)×5=1,解得:a=0.01,由已知得(4a+5a)×5=,解得:n=60;(2)90~95分数段内的学生数是2a×5×60=6,则男生4人,记为:a,b,c,d,女生2人,记为:e,f,若从90~95分数段内的学生中随机抽取2人,共有ab,ac,ad,ae,af,bc,bd,be,bf,cd,ce,cf,de,df,ef,共15种情形,其中满足至少有一名女生共有:ae,af,be,bf,ce,cf,de,df,ef,共9种情形,∴其中至少有一名女生的概率是p==.例2:某赛季甲、乙两名篮球运动员每场比赛得分情况的茎叶图如下甲乙0851364451235876916133898540516图2-2-5请根据上图对两名运动员的成绩进行比较,谁发挥比较稳定。6:变量间的相关关系:自变量取值一定时因变量的取值带有一定随机性的两个变量之间的关系交相关关系。对具有相关关系的两个变量进行统计分析的方法叫做回归分析。(1)回归直线:根据变量的数据作出散点图,如果各点大致分布在一条直线的附近,就称这两个变量之间具有线性相关的关系,这条直线叫做回归直线方程。如果这些点散布在从左下角到右上角的区域,我们就成这两个变量呈正相关;若从左上角到右下角的区域,则称这两个变量呈负相关。设已经得到具有线性相关关系的一组数据:所要求的回归直线方程为:ybxa,其中,是待定的系数。x1x。。。nxy1y。。。ny7(2)回归直线过的样本中心点(,)xy例3.10.假设关于某设备的使用年限x(年)和所支出的维修费y(万元)有如下统计资料:x23456y2.23.85.56.57.0若由资料知,y对x呈线性相关关系.试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用约是多少?思路分析:本题考查线性回归方程的求法和利用线性回归方程求两变量间的关系.解:(1)b==1.23,a=y-bx=5-1.23×4=0.08.所以,回归直线方程为yˆ=1.23x+0.08.(2)当x=10时,yˆ=1.23×10+0.08=12.38(万元),即估计使用10年时维修费约为12.38万元.例4.(15年全国卷19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.363834404244464850525456480500520540560580600620年销售量/T年宣传费/千元········225125145905453.11255xxyxyxiiiii8表中w1=x1,,w=18111xw(Ⅰ)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;(Ⅲ)已知这种产品的年利率z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x为何值时,年利率的预报值最大?附:对于一组数据(u1v1),(u2v2),……,(unvn),其回归线v=u的斜率和截距的最小二乘估计分别为:β=211i)())((uniniuuvvuα=uvxw2111)(xxx2111)(xww))((111yyxxx))((111yywwx46.656.36.8289.81.61469108.8y9二、练习提高;1.一学校高中部有学生2000人,其中高一学生800人,高二学生600人,高三学生600人.现采用分层抽样的方法抽取容量为50的样本,那么高一、高二、高三各年级被抽取的学生人数分别为()A.15,10,25B、20,15,15C.10,10,30D.10,20,202.一个容量为10的样本数据,分组后,组距与频数如下:[1,2),1;[2,3),1;[3,4),2;[4,5),3;[5,6),1;[6,7),2.则样本在区间[1,5)上的频率是()A、0.70B.0.25C.0.50D.0.203.观察新生婴儿的体重表,其频率分布直方图如图2-1所示,则新生婴儿体重在[2700,3000)的频率为()图2-1A.0.001B.0.1C.0.2D、0.34.有甲、乙两种水稻,测得每种水稻各10株的分蘖数后,计算出样本方差分别为s甲2=11,s乙2=3.4,由此可以估计()A.甲种水稻比乙种水稻分蘖整齐B、乙种水稻比甲种水稻分蘖整齐C.甲、乙两种水稻分蘖整齐程度相同D.甲、乙两种水稻分蘖整齐程度不能比较5.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2).则完成(1)(2)这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B、分层抽样法,简单随机抽样法C.系统抽样法,分层
本文标题:必修三第二章统计复习教案
链接地址:https://www.777doc.com/doc-2391988 .html