您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2015-2016学年北师大版必修3-用样本估计总体-课件(27张)
复习回顾抽样方法简单随机抽样分层抽样抽签法随机数表法抽样过程中每个个体被抽取的机会相等,体现了抽样的客观性与公平性系统抽样为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体相应的情况.这种估计大体分为两类:一类是用样本的某种数字特征(例如平均数、标准差等)去估计总体的相应数字特征.一类是用样本的频率分布去估计总体分布;§5用样本估计总体(1)一、估计总体的分布例1.为了了解某地区高二学生的身体发育情况,抽查了地区100名年龄为16.5岁至17岁的男生的体重情况,结果如下(单位:kg):60.569.56561.564.566.56464.56258.57273.559677057.565.56871756268.562.56659.563.564.567.57368647266.5746360557064.5586470.55762.5656971.573625874716663.560.559.563.5657074.568.56455.572.566.568766160685769.57464.55961.5676863.5585965.562.569.57264.56168.5646265.558.567.570.5656666.5706359.5请你估计该地区年龄为16.5岁至17岁的男生体重的分布情况.解:这里,如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息,来估计总体的分布情况.但从抽样的数据很难直接估计出总体的分布情况.60.569.56561.564.566.56464.56258.57273.559677057.565.56871756268.562.56659.563.564.567.57368647266.5746360557064.5586470.55762.5656971.573625874716663.560.559.563.5657074.568.56455.572.566.568766160685769.57464.55961.5676863.5585965.562.569.57264.56168.5646265.558.567.570.5656666.5706359.5为此,我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表:体重/kg频数频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重/kg频数频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重/kg频数频率6910.0169.530.037040.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解:这里,如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息,来估计总体的分布情况.但从抽样的数据很难直接估计出总体的分布情况.为此,我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表:体重/kg频数频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重/kg频数频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重/kg频数频率6910.0169.530.037040.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解:这里,如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息,来估计总体的分布情况.但从抽样的数据很难直接估计出总体的分布情况.从表格中,我们就能估计出总体大致的分布情况了,如在年龄为16.5岁至17岁之间,男生的体重主要在58~72kg之间,58kg以下及72kg以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够直观形象,为了得到更为直观的信息,我们可以再将表中的数据按照下表的方式分组.为此,我们可以先将抽样的数据按照下表进行分组:解:这里,如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息,来估计总体的分布情况.但从抽样的数据很难直接估计出总体的分布情况.分组(△xi)频数(ni)频率(fi)[54.5,56.5)20.02[56.5,58.5)60.06[58.5,60.5)100.10[60.5,62.5)100.10[62.5,64.5)140.14[64.5,66.5)160.16[66.5,68.5)130.13[68.5,70.5)110.11[70.5,72.5)80.08[72.5,74.5)70.07[74.5,76.5)30.03频数048121620频数分布直方图为此,我们可以先将抽样的数据按照下表进行分组:解:这里,如果把总体看作是该地区年龄为16.5岁至17岁的男生体重,那么我们就要通过上面的样本信息,来估计总体的分布情况.但从抽样的数据很难直接估计出总体的分布情况.分组(△xi)频数(ni)频率(fi)[54.5,56.5)20.02[56.5,58.5)60.06[58.5,60.5)100.10[60.5,62.5)100.10[62.5,64.5)140.14[64.5,66.5)160.16[66.5,68.5)130.13[68.5,70.5)110.11[70.5,72.5)80.08[72.5,74.5)70.07[74.5,76.5)30.03fi/△xi0.010.030.050.050.070.080.0650.0550.040.0350.015分组(△xi)fi/△xi[54.5,56.5)0.01[56.5,58.5)0.03[58.5,60.5)0.05[60.5,62.5)0.05[62.5,64.5)0.07[64.5,66.5)0.08[66.5,68.5)0.065[68.5,70.5)0.055[70.5,72.5)0.04[72.5,74.5)0.035[74.5,76.5)0.01500.020.040.060.080.10iixf思考交流1.体重位于哪个区间的人数最多?2.体重在64.5~66.5kg的频率约是多数?3.体重小于64.5kg的频率约是多数?4.体重在63.5~65.5kg的频率约是多数?[64.5,66.5)16%42%15%抽象概括:00.02体重(kg)0.040.060.080.10iixf上图中,每个小矩形的宽度为△xi(分组的宽度),高为,小矩形的面积恰为相应的频率fi.iixf通常称这样的图形为频率分布直方图.当样本容量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的概率,也即总体的分布情况.频率折线图00.02体重(kg)0.040.060.080.10iixf频率折线图注意:折线与横轴所围成的面积是1.00.02体重(kg)0.040.060.080.10iixf频率折线图如果样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑的曲线.我们称这条光滑的曲线为总体的密度曲线.例2.为了了解一大片经济林生长情况.随机测量其中的100株树木的底部周长,得到如下数据表(单位:cm)135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表;(2)绘制频率分布直方图;(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少.解:(1)这组数据的最大值是135,最小值是80,全距是55.135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108可将其分为11组,组距为5.解:(1)这组数据的最大值是135,最小值是80,全距是55.可将其分为11组,组距为5.分组(△xi)频数(ni)频率(fi)fi/△xi[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.190.018[120,125)110.110.022[125,130)60.060.012[130,135)20.020.004(2)直方图如图:00.010.020.030.040.05iixf(3)样本小于100的频率为:0.21样本不小于120的频率为:0.19估计该片经济林中底部周长小于100cm的树木约占21%,周长不小于120cm的树木约占19%.问题提出在日常生活中,我们不仅需要了解总体的分布形态,有时会更关心总体的某些数字特征.§5用样本估计总体(2)一、估计总体的数字特征1.分析理解1996年奥运会风帆比赛前7场比赛(共比赛11场)结束后,排名前5名的选手积分如下:排名运动员比赛场次总分12345678910111李丽珊(香港)3222427222简度(新西兰)23611055323贺根(挪威)7844318354威尔逊(英国)55145564445李科4135927646根据上面的比赛结果,我们如何比较各选手之间的成绩及稳定情况呢?如果此时让你预测谁将获得最后胜利,你会怎样看?5位选手前7场比赛积分的平均数和标准差如下:3.336.57李科53.196.29威尔逊(英国)42.515.00贺根(挪威)32.774.57简度(新西兰)21.733.14李丽珊(香港)1积分标准差(s)平均积分运动员排名)(x从上表中可见:李丽珊的平均积分及积分标准差都比其他选手的小,这说明,在前7场的比赛中,她的成绩最为优秀,且表现最为稳定.假定每位运动员在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛看作是总体的一个样本,并由此估计每位运动员最后比赛
本文标题:2015-2016学年北师大版必修3-用样本估计总体-课件(27张)
链接地址:https://www.777doc.com/doc-6907301 .html