您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 2019-2020学年高中数学 第1章 统计本章整合课件 北师大版必修3
统计第一章本章整合知识网络专题归纳一、抽样方法的应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数表法抽样时,对个体所编的号码位数要相等,当问题所给位数不等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.如:1,2,3,…,20可凑成01,02,03,…,20(2)用系统抽样法抽样时,如果总体容量N能被样本容量n整除,抽样间隔为k=Nn;如果总体容量N不能被样本容量n整除,先用简单随机抽样法剔除多余个体,抽样间隔k=Nn.(3)应用三种抽样方法时需搞清楚它们的使用原则:①当总体容量较小,样本容量较小时,制签简单,号签容易搅匀,可采用抽签法;②当总体容量较大,样本容量较小时,可用随机数表法;③当总体容量较大,样本容量也较大时,可用系统抽样法;④当总体中个体差异较显著时,可采用分层抽样法.某高级中学共有学生3000名,各年级男、女生人数如下表:高一年级高二年级高三年级女生523xy男生487490z已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?【思路启迪】(1)如何求x,y,z的值?(2)分层抽样的特征是什么?有什么注意事项?【解】(1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990.现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.二、频率分布表取频率分布直方图的应用由画频率分布直方图的步骤可以看出,横轴是数据,纵轴是fiΔxi,也就是说频率分布直方图中每个小矩形的高是fiΔxi,不是该组的频率,其中每个小矩形的面积恰好是该组的频率,所有小矩形的面积和等于1.从频率分布直方图中可以清楚地看出数据分布的总体趋势.频率分布直方图的优点:形象、直观地反映了样本的分布规律;缺点是从频率分布直方图中得不出原始的数据内容,把数据表示成频率分布直方图后,原有的具体数据信息就被抹掉了.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).分组频率[1.00,1.05)[1.05,1.10)[1.10,1.15)[1.15,1.20)[1.20,1.25)[1.25,1.30)(1)在题中表格中填写相应的频率;(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.【思路启迪】(1)如何求出各组的频数及频率?(2)概率与频率具有怎样的关系?(3)如何估计水库中鱼的总条数?【解】(1)根据频率分布直方图可知,频率=组距×(频率/组距),故可得下表分组频率[1.00,1.05)0.05[1.05,1.10)0.20[1.10,1.15)0.28[1.15,1.20)0.30[1.20,1.25)0.15[1.25,1.30)0.02(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(3)120×1006=2000,所以水库中鱼的总条数约为2000条.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率的大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)频率=频数样本容量,还要注意此公式的一些变形及应用.三、用样本的数字特征估计总体为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的数据.中位数就是把样本数据按照从小到大(或由大到小)排列,如果数据的个数是奇数,处于中间位置的数就是中位数;如果数据的个数是偶数,中间两个数据的平均数就是中位数.平均数就是所有样本数据的平均值,用x-表示.标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如:s=1n[x1-x-2+x2-x-2+…+xn-x-2].甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如下图所示.(1)填写下表:平均数方差中位数命中9环及以上甲71.2乙5.43(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.【思路启迪】(1)从折线图中可以得到哪些信息?(2)如何结合平均数、方差、中位数等数字特征对总体作出估计?【解】(1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以x-乙=110(2+4+6+8+7+7+8+9+9+10)=7,乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以平均数、中位数均为7.于是填充后的表格如下表所示:平均数方差中位数命中9环及以上甲71.271乙75.47.53(2)①甲、乙的平均数相同,均为7,但s2甲s2乙,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多.③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.在统计中,为了考查一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类,一类是用样本频率分布估计总体分布,另一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征.四、两个变量的相关性分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程.把样本数据表示的点在直角坐标系中作出,构成的图叫散点图.从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫作回归直线,直线方程叫作回归直线方程.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x(℃)101113128发芽数y(颗)2325302616该农科所确定的研究方案是:先从这5组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y=bx+a;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?【思路启迪】(1)求回归直线方程的基本步骤是什么?(2)求回归直线方程有哪些注意事项?【解】(1)x-=11+13+123=12,y-=25+30+263=27,又i=1nxiyi=11×25+13×30+12×26=977,i=1nx2i=112+132+122=434,∴b=i=1nxiyi-nx-y-i=1nx2i-nx-2=977-3×12×27434-3×122=52.∴a=y--bx-=27-52×12=-3.∴y关于x的线性回归方程为y=52x-3.(2)当x=10时,y=52×10-3=22,|22-23|2;同样,当x=8时,y=52×8-3=17,|17-16|2.∴(1)中所得的线性回归方程是可靠的.建立回归模型的基本步骤:(1)确定研究对象,明确解释变量与预报变量;(2)画出确定好的解释变量与预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(若数据呈线性关系,则选用线性回归方程y=bx+a);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)将所得的结果进行分析检验,看看是否符合实际情况.真题演练1.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08B.07C.02D.01解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字为08,02,14,07,01,…,故选出的第5个个体的编号为01.答案:D2.已知变量x与y正相关,且由观测数据算得样本平均数x-=3,y-=3.5,则由该观测数据算得的线性回归方程可能是()A.y^=0.4x+2.3B.y^=2x-2.4C.y^=-2x+9.5D.y^=-0.3x+4.4解析:依题意知,相应的回归直线的斜率应为正,排除C、D,且直线必过点(3,3.5),代入A、B得A正确.答案:A3.已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A.100,10B.200,10C.100,20D.200,20解析:易知(3500+4500+2000)×2%=200即样本容量;抽取的高中生人数为2000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.答案:D4.某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x-和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为()A.x-,s2+1002B.x-+100,s2+1002C.x-,s2D.x-+100,s2解析:解法一:对平均数和方差的意义深入理解可巧解.因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D.解法二:由题意知x1+x2+…+xn=nx-,s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2],则所求均值y-=1n[(x1+100)+(x2+100)+…+(xn+100)]=1n(nx-+n×100)=x-+100,而所求方差t2=1n[(x1+100-y-)2+(x2+100-y-)2+…+(xn+100-y-)2]=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2]=s2,故选D.答案:D5.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,
本文标题:2019-2020学年高中数学 第1章 统计本章整合课件 北师大版必修3
链接地址:https://www.777doc.com/doc-8291707 .html