您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2019-2020学年高中数学 第2章 统计章末复习课讲义 苏教版必修3
-1-第2章统计抽样方法【例1】某商场有四类食品,食品类别和种数见下表:类别粮食类植物油类动物性食品类果蔬类种数40103020现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为________.6[因为总体的个数为40+10+30+20=100,所以根据分层抽样的定义可知,抽取的植物油类食品种数为10100×20=2,抽取的果蔬类食品种数为20100×20=4,所以抽取的植物油类与果蔬类食品种数之和为2+4=6.]1.抽样方法有:简单随机抽样、分层抽样.2.两种抽样方法比较-2-3.选择抽样方法与总体的个体数有关.在具体的抽样过程中还需明确下列运算关系:(1)两种抽样方法中每个个体被抽到的可能性p=样本容量n总体容量N.(2)对于分层抽样,设第i层的个体数及从其中抽取的样本个体数分别为Ni,ni(i∈N*),则分层抽样比p=样本容量n总体容量N=niNi.1.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为________.926446072021392077663817325616405858776631700500259305455370781428896628675782311589006200473815513181863709452166655325538327029055719621723207111413844359448817,00,02,07[在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07.]2.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为________.514[根据题意,9n-1=13,解得n=28.故在整个抽样过程中每个个体被抽到的概率为1028=514.]用样本的频率分布估计总体分布【例2】有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.-3-(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30的数据约占多大百分比.思路点拨:(1)每组频率=每组频数样本容量.(2)频率分布直方图中,纵轴表示的是频率组距.(3)小于30的数据所占百分比也就是前6组的频率之和,可用两种方法求解,法一:前6组频率相加,法二:用1减去第7组频率.[解](1)样本的频率分布表如下:分组频数频率[12.5,15.5)60.06[15.5,18.5)160.16[18.5,21.5)180.18[21.5,24.5)220.22[24.5,27.5)200.20[27.5,30.5)100.10[30.5,33.5]80.08合计1001.00(2)频率分布直方图如图.(3)法一:小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.法二:因为所有组的频率之和为1,大于30的数据占0.08,故小于30的数据占1-0.08=0.92=92%.-4-1.样本频率分布直方图的制作步骤(1)求全距,确定组距和组数,要根据全距的大小和数据的多少,选择恰当的组距,使表格不至于太长或太短.当全距组距不是整数时,组数的“取舍”一般不是依据四舍五入,而是按组数=全距组距+1确定,即取全距组距的整数部分加1.(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.(3)计算频数、频率,列出频率分布表.(4)建立平面直角坐标系,把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于该组的频率组距,这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率,这些矩形构成了频率分布直方图.2.求频率、频数的方法与技巧(1)频率=频数样本容量,已知其中任意两个量就可以求出第三个量.(2)各小组的频数和等于样本容量,频率和等于1.(3)由样本的频率可估计总体的频率,从而估计出总体的频数.3.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为________.54[[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.所以a=(0.22+0.32)×100=54.]4.为了解高中一年级学生身高情况,某校按10%的比例对全校700名高中一年级学生按性别进行抽样检查,测得身高频数分布表如表1、表2.表1:男生身高频数分布表-5-身高(cm)[160,165)[165,170)[170,175)[175,180)[180,185)[185,190]频数25141342表2:女生身高频数分布表身高(cm)[150,155)[155,160)[160,165)[165,170)[170,175)[175,180]频数1712631(1)求该校男生的人数并画出频率分布直方图;(2)估计该校学生身高在165cm~180cm的人数占总人数的百分比.思路点拨:(1)由表1中数据可知样本中男生人数为2+5+14+13+4+2=40,又分层抽样比例10%,故全校男生数400.画频率分布直方图应注意两点:①频率分布直方图是用面积表示频率;②在频率分布直方图中,所有矩形的面积之和等于1.(2)由表1、表2中数据可估计身高在165cm~180cm的人数占总人数的百分比.[解](1)样本中男生人数为40,分层抽样比例为10%,可得全校男生人数为400.频率分布直方图如图.(2)由表1、表2知,样本中身高在165cm~180cm的学生人数为5+14+13+6+3+1=42,样本容量为70,所以样本中学生身高在165cm~180cm的频率为4270=35,故估计该校学生身高在165cm~180cm的人数占总人数的60%.用样本的数字特征估计总体的数字特征【例3】甲、乙两机床同时加工直径为100cm的零件,为检验质量,各从中抽取6件测量,数据为甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定.思路点拨:利用平均数公式及方差公式计算求解,方差小的质量更稳定.-6-[解](1)x甲=16(99+100+98+100+100+103)=100,x乙=16(99+100+102+99+100+100)=100.s2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均数相同,又s2甲s2乙,所以乙机床加工零件的质量更稳定.样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.5.有容量为100的样本,数据分组及各组的数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5),8,0.08.试估计总体的平均数.[解]法一:总体的平均数约为1100×(13.5×6+15.5×16+17.5×18+19.5×22+21.5×20+23.5×10+25.5×8)=19.42.故总体的平均数约为19.42.法二:求组中值与对应频率积的和13.5×0.06+15.5×0.16+17.5×0.18+19.5×0.22+21.5×0.20+23.5×0.10+25.5×0.08=19.42.-7-故总体的平均数约为19.42.6.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?思路点拨:根据表中数据计算两组数据的平均数及方差,然后定量分析.[解]甲的平均成绩为x甲=74,乙的平均成绩为x乙=73.所以甲的平均成绩好.甲的方差是s2甲=15[(-14)2+62+(-4)2+162+(-4)2]=104,乙的方差是s2乙=15×[72+(-13)2+(-3)2+72+22]=56.因为s2甲s2乙,所以乙的各门功课发展较平衡.变量间的相关关系【例4】某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院查阅了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x/℃1011131286就诊人数y/人222529261612(1)画出散点图,判断昼夜温差与因患感冒而就诊的人数是否线性相关,并用相关系数说明;(2)该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.①若选取的是1月与6月的2组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程y^=bx+A.②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?③若7月10日这天就诊人数为20,试估计这天昼夜温差大概是多少?思路点拨:以昼夜温差x值为横坐标,以就诊人数y值为纵坐标,在平面直角坐标系中作出散点图,观察点的分布规律,作出判断.利用“变量x与y的相关系数公式及线性回归系数公式求出r,b,a再作定量分析.[解](1)散点图如图所示,由图可见昼夜温差与就诊人数间具有线性相关关系.-8-相关系数r=i=1nxiyi-nxyi=1nx2i-nx2i=1ny2i-ny2≈0.995,可知线性相关程度较高.(2)①由数据求得x=11,y=24,由公式求得b=187,再由a=y-bx得a=-307,所以y关于x的线性回归方程为y=187x-307.②当x=10时,y=1507,1507-22=472.同样,当x=6时,y=787,787-12=672,所以,该小组所得线性回归方程是理想的.③在y=187x-307中,令y=20,求得x=859,即7月10日这天昼夜温差大概是859℃.1.判断两个变量间的相关性在判断两个变量是否具有相关关系时,第一种方法是根据相关关系的定义判断,看这两个变量是否具有不确定性,第二种方法是借助散点图观察得到结论.2.线性回归方程(1)求线性回归方程主要利用待定系数法,其一般步骤为:①若题目中已明确两个变量具有线性相关关系,则不用验证;否则作出散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,那么根据确定线性回归方程的步骤求出回归系数,并写出线性回归方程.(2)因为回归系数a,b满足公式a=y-bx,y=bx+a,(x,y),即所以线性回归方程y^=bx+a必过定点该点也是样本中心点.3.相关关系的强弱的判断用相关系数r的值判断相关系数的强弱.r的范围为-1≤r≤1
本文标题:2019-2020学年高中数学 第2章 统计章末复习课讲义 苏教版必修3
链接地址:https://www.777doc.com/doc-8472745 .html